Replicate HTTP API
Replicate 提供统一的 HTTP API 用于运行社区与官方 AI 模型(文本、图像、音频、视频等),核心对象为 "prediction"。开发者可通过 POST /v1/predictions 或模型/部署专属端点创建一次运行,支持同步(Prefer: wait)与异步模式、SSE 流式输出与 Webhook 回调。鉴权使用 Bearer 令牌,基础地址为 https://api.replicate.com/v1。创建预测端点限速约 600 次/分钟,其他端点约 3000 次/分钟;计费按模型规则(按时长或按令牌)。
基础 URL
https://api.replicate.com/v1
认证
Bearer / Authorization: Bearer $REPLICATE_API_TOKEN
官方 SDK
Python, Node.js
🔑 API Key 获取
前置要求:需要有效账户;建议完成邮箱验证并添加账单以提升配额与限速;令牌具有账户权限,切勿公开。
说明:注册或登录 Replicate,进入 "API tokens" 页面,点击创建新令牌(只显示一次),复制保存并配置到环境变量。
支持模型
API 接口列表
创建一次预测(运行社区模型版本),支持同步(设置 Prefer: wait)与默认异步模式。返回 prediction 对象,包含状态与输出。
认证是
频率限制600/min
计费模式按具体模型计费(按时长或按输入/输出令牌);请求本身不单独计价
{
"version": "5c7d5dc6dd8bf75c1acaa8565735e7986bc5b66206b55cca93cb72c9bf15ccaa",
"input": {
"prompt": "A photo of a bear riding a bicycle over the moon"
}
}获取指定预测的当前状态与结果(包括输出、日志、计时等)。
认证是
频率限制3000/min
计费模式免费查询;实际费用取决于创建预测所用模型
curl -s -H 'Authorization: Bearer $REPLICATE_API_TOKEN' https://api.replicate.com/v1/predictions/{id}取消未完成的预测。如果预测已完成则无法取消。
认证是
频率限制3000/min
计费模式免费操作;费用仍由已运行的模型用量决定
curl -s -X POST -H 'Authorization: Bearer $REPLICATE_API_TOKEN' https://api.replicate.com/v1/predictions/{id}/cancel分页列出你创建的预测(包含网站和 API 创建),默认每页返回最多 100 条。
认证是
频率限制3000/min
计费模式免费查询;费用取决于实际预测运行
curl -s -H 'Authorization: Bearer $REPLICATE_API_TOKEN' https://api.replicate.com/v1/predictions
针对官方模型创建预测,无需提供具体版本 ID(官方模型会固定版本策略)。
认证是
频率限制600/min
计费模式按模型计费(按时长或按令牌)
{
"input": {
"prompt": "A cozy cabin in the woods"
}
}在指定部署上创建预测,可用于产品化场景(稳定模型与配额)。
认证是
频率限制600/min
计费模式按部署绑定模型的计费规则执行
curl -s -X POST -H 'Prefer: wait' -H 'Authorization: Bearer $REPLICATE_API_TOKEN' -H 'Content-Type: application/json' -d '{
"input": { "prompt": "A photo of a bear riding a bicycle over the moon" }
}' https://api.replicate.com/v1/deployments/{owner}/{name}/predictions删除指定部署。成功时返回 204 无内容。
认证是
频率限制3000/min
计费模式免费操作;不产生推理费用
curl -s -X DELETE -H 'Authorization: Bearer $REPLICATE_API_TOKEN' https://api.replicate.com/v1/deployments/{owner}/{name}获取默认 Webhook 的签名密钥(返回包含 key 字段的 JSON)。
认证是
频率限制3000/min
计费模式免费查询;用于校验 Webhook 签名
curl -s -H 'Authorization: Bearer $REPLICATE_API_TOKEN' https://api.replicate.com/v1/webhooks/default/secret
搜索公开的模型、合集与文档(Beta),支持查询字符串与结果数量限制。
认证是
频率限制3000/min
计费模式免费查询;不产生推理费用
curl -s -H 'Authorization: Bearer $REPLICATE_API_TOKEN' 'https://api.replicate.com/v1/search?query=flux&models_limit=20'
获取模型详情(包括可用版本与元数据,版本的 openapi_schema 可用于校验输入)。
认证是
频率限制3000/min
计费模式免费查询;用于发现模型与版本信息
curl -s -H 'Authorization: Bearer $REPLICATE_API_TOKEN' https://api.replicate.com/v1/models/{owner}/{name}列出指定模型的版本集合。
认证是
频率限制3000/min
计费模式免费查询;用于选择运行版本
curl -s -H 'Authorization: Bearer $REPLICATE_API_TOKEN' https://api.replicate.com/v1/models/{owner}/{name}/versions