AWS AI 服务

AWS AI 服务覆盖生成式与传统 AI 场景：Amazon Bedrock（大模型托管与推理）、Comprehend（NLP）、Rekognition（视觉）、Polly（文本转语音）、Transcribe（语音转文本）、Translate（机器翻译）、Lex（对话式 AI）。本文件以 Amazon Polly 的 HTTP 接口为示例（/v1/speech），其余服务请参考链接。

基础 URL

https://polly.us-east-1.amazonaws.com

官网

https://aws.amazon.com/ai/

开放平台

https://docs.aws.amazon.com/

认证

Bearer / Authorization: Bearer

官方 SDK

Python (boto3), JavaScript/TypeScript, Java, .NET, Go, Kotlin

定价

https://aws.amazon.com/polly/pricing/

🔑 API Key 获取

前置要求：需要有效的 AWS 账户与账单；为目标区域选择正确的服务端点；建议开启多因素认证；Bedrock 模型需先在控制台授权使用。

入口：https://console.aws.amazon.com/iamv2/home#/security_credentials

说明：在 AWS 控制台创建 IAM 用户或使用角色，授予对应服务权限（例如 AmazonPollyFullAccess），在“安全凭证”中创建访问密钥；Bedrock 需在控制台启用模型访问。

支持模型

API 接口列表

POST /v1/speech Docs

Amazon Polly 文本转语音接口。提交 JSON（Text/VoiceId/OutputFormat 等）返回音频字节流。详见官方文档 SynthesizeSpeech。

认证是

频率限制60/min

计费模式按字符计费：标准语音约每百万字符$4、神经语音约每百万字符$16（随区域与语音引擎变化）。

{
  "OutputFormat": "mp3",
  "VoiceId": "Joanna",
  "Text": "Hello from AWS Polly",
  "Engine": "standard"
}

POST /model/{modelId}/invoke Docs

Amazon Bedrock 运行时 InvokeModel 接口。向指定模型提交推理请求（JSON），返回生成结果（如文本、图像或嵌入），参数因模型而异。

认证是

频率限制60/min

计费模式按模型/吞吐定价（常见为按输入/输出 token 或秒计费，具体见 Bedrock 定价与模型页面）。

{
  "modelId": "anthropic.claude-3-haiku-20240307-v1:0",
  "contentType": "application/json",
  "accept": "application/json",
  "body": {
    "prompt": "Write a haiku about AWS.",
    "max_tokens_to_sample": 256
  }
}

POST /model/{modelId}/invoke-with-response-stream Docs

Amazon Bedrock 运行时 InvokeModelWithResponseStream（流式）接口。用于长文本或需要边生成边消费的场景，返回分片事件流。

认证是

频率限制60/min

计费模式同 InvokeModel，按模型与吞吐计费；流式不改变计费单位但影响实际调用时长。

{
  "modelId": "anthropic.claude-3-haiku-20240307-v1:0",
  "contentType": "application/json",
  "accept": "application/json",
  "body": {
    "prompt": "Explain Bedrock streaming in one paragraph.",
    "max_tokens_to_sample": 512
  }
}