AI API 服务目录
精选 LLM、对话、视觉与多模态 API 提供商
阿里云百炼 API(OpenAI 兼容)
通义千问直连,OpenAI 兼容 /v1
阿里云百炼(Model Studio)提供通义千问等模型的 OpenAI 兼容接口(/v1)。兼容模式核心端点包括聊天补全(/v1/chat/completions)与文本向量(/v1/embeddings),支持流式、工具调用、系统指令与上下文管理。需按地域配置 BASE_URL:北京(https://dashscope.aliyuncs.com/compatible-mode/v1)与新加坡(https://dashscope-intl.aliyuncs.com/compatible-mode/v1)。
AWS AI 服务
Bedrock 推理+全家桶 AI 服务
AWS AI 服务覆盖生成式与传统 AI 场景:Amazon Bedrock(大模型托管与推理)、Comprehend(NLP)、Rekognition(视觉)、Polly(文本转语音)、Transcribe(语音转文本)、Translate(机器翻译)、Lex(对话式 AI)。本文件以 Amazon Polly 的 HTTP 接口为示例(/v1/speech),其余服务请参考链接。
Azure AI
OpenAI 兼容 /v1,直连 Azure 企业生态
Azure AI 是微软在 Azure 上提供的一体化 AI 平台,用于构建 AI 应用与 AI 代理,覆盖 Azure OpenAI Service、Azure AI Services(视觉/语音/语言/翻译/内容安全)、Azure AI Search、Azure Machine Learning 以及 Azure AI Studio 等能力。在该解决方案页面可了解平台概览并进入各能力入口;其中 Azure AI Inference 提供 OpenAI 兼容的 /v1 风格端点,适合快速集成与迁移。
Claude API — Anthropic 开发者平台
消息 API+Prompt 缓存,善用工具
Claude API 由 Anthropic 提供,核心为 Messages API,支持文本与图像理解/生成、工具调用(函数/技能)、计算机使用、系统提示、流式输出、令牌计数与提示缓存(Prompt Caching)。适用于智能助理、RAG 检索增强、自动化工作流与企业集成。
DeepSeek API
高性能、低成本、生态兼容的推理型大模型 API。
DeepSeek 提供兼容 OpenAI/Anthropic 格式的推理增强型 LLM 接口,支持聊天补全、工具调用、思维链输出与 Beta 能力(前缀补全、FIM)。
Google AI 开发者 — Gemini API
多模态到位:结构化输出+函数调用
Gemini API 是 Google AI 提供的多模态生成式 AI 服务,支持文本、图片、视频、音频与 PDF 的理解与生成,并提供结构化输出、函数调用、上下文缓存、批处理、嵌入向量与令牌计数等能力。适用于聊天助手、内容生成、检索增强、Agent 工具使用与大规模管线处理。
Hugging Face
开源生态直连推理,统一 OpenAI 路由
Hugging Face 是领先的开源与开放科学 AI 平台,核心包括模型/数据/Spaces 的 Hugging Face Hub、推理与托管(Inference Providers 与 Inference Endpoints)、以及丰富的开源库(Transformers、Diffusers、Datasets、Tokenizers、Accelerate、PEFT、TRL、Safetensors、Transformers.js、smolagents、TGI 等)。平台支持文本、图像、音频、视频与 3D 等多模态,提供 Python、JavaScript 与 REST/OpenAI 兼容端点的统一接入。
Kimi 大模型 API
长上下文+JSON/Partial Mode,兼容 /v1
Kimi 由月之暗面(Moonshot AI)提供,开放平台兼容 OpenAI 的 API/SDK,提供聊天补全、工具调用、JSON Mode、Partial Mode、长上下文与视觉理解(kimi-latest)等能力。核心端点为 POST /v1/chat/completions,支持流式输出与上下文缓存。
OpenAI API
统一 Responses+Realtime,旗舰级开发者 API
OpenAI 提供面向开发者的开放平台与 REST/Streaming/Realtime API,包括通用回复(Responses API)、传统聊天补全(Chat Completions)、嵌入向量(Embeddings)、图像生成(Images)、语音文本(Audio:TTS/转写)、以及 Assistants 线程与运行(Threads/Runs)。统一基础地址为 https://api.openai.com/v1,采用 Bearer 令牌进行鉴权。用量与速率限制因账户和模型而异,参考官方限速文档与账户控制台。
Replicate HTTP API
统一“预测”接口,SSE+异步随你挑
Replicate 提供统一的 HTTP API 用于运行社区与官方 AI 模型(文本、图像、音频、视频等),核心对象为 "prediction"。开发者可通过 POST /v1/predictions 或模型/部署专属端点创建一次运行,支持同步(Prefer: wait)与异步模式、SSE 流式输出与 Webhook 回调。鉴权使用 Bearer 令牌,基础地址为 https://api.replicate.com/v1。创建预测端点限速约 600 次/分钟,其他端点约 3000 次/分钟;计费按模型规则(按时长或按令牌)。
面向生产的 AI API 提供商目录,覆盖 LLM、对话/消息、推理、向量与嵌入、图像/音频/视频以及模型托管。包含 OpenAI、Anthropic Claude、Google Gemini、Azure AI、AWS AI Services、阿里云百炼(通义千问)、DeepSeek、Kimi(月之暗面)、Hugging Face 与 Replicate,多个接口兼容 OpenAI。