AWS AI 服务
AWS AI 服务覆盖生成式与传统 AI 场景:Amazon Bedrock(大模型托管与推理)、Comprehend(NLP)、Rekognition(视觉)、Polly(文本转语音)、Transcribe(语音转文本)、Translate(机器翻译)、Lex(对话式 AI)。本文件以 Amazon Polly 的 HTTP 接口为示例(/v1/speech),其余服务请参考链接。
基础 URL
https://polly.us-east-1.amazonaws.com
认证
Bearer / Authorization: Bearer
官方 SDK
Python (boto3), JavaScript/TypeScript, Java, .NET, Go, Kotlin
🔑 API Key 获取
前置要求:需要有效的 AWS 账户与账单;为目标区域选择正确的服务端点;建议开启多因素认证;Bedrock 模型需先在控制台授权使用。
说明:在 AWS 控制台创建 IAM 用户或使用角色,授予对应服务权限(例如 AmazonPollyFullAccess),在“安全凭证”中创建访问密钥;Bedrock 需在控制台启用模型访问。
支持模型
API 接口列表
Amazon Polly 文本转语音接口。提交 JSON(Text/VoiceId/OutputFormat 等)返回音频字节流。详见官方文档 SynthesizeSpeech。
认证是
频率限制60/min
计费模式按字符计费:标准语音约每百万字符$4、神经语音约每百万字符$16(随区域与语音引擎变化)。
{
"OutputFormat": "mp3",
"VoiceId": "Joanna",
"Text": "Hello from AWS Polly",
"Engine": "standard"
}Amazon Bedrock 运行时 InvokeModel 接口。向指定模型提交推理请求(JSON),返回生成结果(如文本、图像或嵌入),参数因模型而异。
认证是
频率限制60/min
计费模式按模型/吞吐定价(常见为按输入/输出 token 或秒计费,具体见 Bedrock 定价与模型页面)。
{
"modelId": "anthropic.claude-3-haiku-20240307-v1:0",
"contentType": "application/json",
"accept": "application/json",
"body": {
"prompt": "Write a haiku about AWS.",
"max_tokens_to_sample": 256
}
}Amazon Bedrock 运行时 InvokeModelWithResponseStream(流式)接口。用于长文本或需要边生成边消费的场景,返回分片事件流。
认证是
频率限制60/min
计费模式同 InvokeModel,按模型与吞吐计费;流式不改变计费单位但影响实际调用时长。
{
"modelId": "anthropic.claude-3-haiku-20240307-v1:0",
"contentType": "application/json",
"accept": "application/json",
"body": {
"prompt": "Explain Bedrock streaming in one paragraph.",
"max_tokens_to_sample": 512
}
}