AWS AI 服务

AWS AI 服务覆盖生成式与传统 AI 场景:Amazon Bedrock(大模型托管与推理)、Comprehend(NLP)、Rekognition(视觉)、Polly(文本转语音)、Transcribe(语音转文本)、Translate(机器翻译)、Lex(对话式 AI)。本文件以 Amazon Polly 的 HTTP 接口为示例(/v1/speech),其余服务请参考链接。

基础 URL
https://polly.us-east-1.amazonaws.com
认证
Bearer / Authorization: Bearer
官方 SDK
Python (boto3), JavaScript/TypeScript, Java, .NET, Go, Kotlin
🔑 API Key 获取
前置要求:需要有效的 AWS 账户与账单;为目标区域选择正确的服务端点;建议开启多因素认证;Bedrock 模型需先在控制台授权使用。
入口:https://console.aws.amazon.com/iamv2/home#/security_credentials
说明:在 AWS 控制台创建 IAM 用户或使用角色,授予对应服务权限(例如 AmazonPollyFullAccess),在“安全凭证”中创建访问密钥;Bedrock 需在控制台启用模型访问。

支持模型

API 接口列表

POST /v1/speech Docs

Amazon Polly 文本转语音接口。提交 JSON(Text/VoiceId/OutputFormat 等)返回音频字节流。详见官方文档 SynthesizeSpeech。

认证
频率限制60/min
计费模式按字符计费:标准语音约每百万字符$4、神经语音约每百万字符$16(随区域与语音引擎变化)。
{
  "OutputFormat": "mp3",
  "VoiceId": "Joanna",
  "Text": "Hello from AWS Polly",
  "Engine": "standard"
}
POST /model/{modelId}/invoke Docs

Amazon Bedrock 运行时 InvokeModel 接口。向指定模型提交推理请求(JSON),返回生成结果(如文本、图像或嵌入),参数因模型而异。

认证
频率限制60/min
计费模式按模型/吞吐定价(常见为按输入/输出 token 或秒计费,具体见 Bedrock 定价与模型页面)。
{
  "modelId": "anthropic.claude-3-haiku-20240307-v1:0",
  "contentType": "application/json",
  "accept": "application/json",
  "body": {
    "prompt": "Write a haiku about AWS.",
    "max_tokens_to_sample": 256
  }
}
POST /model/{modelId}/invoke-with-response-stream Docs

Amazon Bedrock 运行时 InvokeModelWithResponseStream(流式)接口。用于长文本或需要边生成边消费的场景,返回分片事件流。

认证
频率限制60/min
计费模式同 InvokeModel,按模型与吞吐计费;流式不改变计费单位但影响实际调用时长。
{
  "modelId": "anthropic.claude-3-haiku-20240307-v1:0",
  "contentType": "application/json",
  "accept": "application/json",
  "body": {
    "prompt": "Explain Bedrock streaming in one paragraph.",
    "max_tokens_to_sample": 512
  }
}