首页
›
AI API 服务目录

AI API 服务目录

精选 LLM、对话、视觉与多模态 API 提供商

阿里云百炼 API（OpenAI 兼容）

通义千问直连，OpenAI 兼容 /v1

阿里云百炼（Model Studio）提供通义千问等模型的 OpenAI 兼容接口（/v1）。兼容模式核心端点包括聊天补全（/v1/chat/completions）与文本向量（/v1/embeddings），支持流式、工具调用、系统指令与上下文管理。需按地域配置 BASE_URL：北京（https://dashscope.aliyuncs.com/compatible-mode/v1）与新加坡（https://dashscope-intl.aliyuncs.com/compatible-mode/v1）。

AWS AI 服务

亚马逊云科技

Bedrock 推理＋全家桶 AI 服务

AWS AI 服务覆盖生成式与传统 AI 场景：Amazon Bedrock（大模型托管与推理）、Comprehend（NLP）、Rekognition（视觉）、Polly（文本转语音）、Transcribe（语音转文本）、Translate（机器翻译）、Lex（对话式 AI）。本文件以 Amazon Polly 的 HTTP 接口为示例（/v1/speech），其余服务请参考链接。

Azure AI

微软

OpenAI 兼容 /v1，直连 Azure 企业生态

Azure AI 是微软在 Azure 上提供的一体化 AI 平台，用于构建 AI 应用与 AI 代理，覆盖 Azure OpenAI Service、Azure AI Services（视觉/语音/语言/翻译/内容安全）、Azure AI Search、Azure Machine Learning 以及 Azure AI Studio 等能力。在该解决方案页面可了解平台概览并进入各能力入口；其中 Azure AI Inference 提供 OpenAI 兼容的 /v1 风格端点，适合快速集成与迁移。

Claude API — Anthropic 开发者平台

Anthropic 公司

消息 API＋Prompt 缓存，善用工具

Claude API 由 Anthropic 提供，核心为 Messages API，支持文本与图像理解/生成、工具调用（函数/技能）、计算机使用、系统提示、流式输出、令牌计数与提示缓存（Prompt Caching）。适用于智能助理、RAG 检索增强、自动化工作流与企业集成。

DeepSeek API

DeepSeek（深度求索）

高性能、低成本、生态兼容的推理型大模型 API。

DeepSeek 提供兼容 OpenAI/Anthropic 格式的推理增强型 LLM 接口，支持聊天补全、工具调用、思维链输出与 Beta 能力（前缀补全、FIM）。

Google AI 开发者 — Gemini API

谷歌公司

多模态到位：结构化输出＋函数调用

Gemini API 是 Google AI 提供的多模态生成式 AI 服务，支持文本、图片、视频、音频与 PDF 的理解与生成，并提供结构化输出、函数调用、上下文缓存、批处理、嵌入向量与令牌计数等能力。适用于聊天助手、内容生成、检索增强、Agent 工具使用与大规模管线处理。

Hugging Face

Hugging Face Inc.

开源生态直连推理，统一 OpenAI 路由

Hugging Face 是领先的开源与开放科学 AI 平台，核心包括模型/数据/Spaces 的 Hugging Face Hub、推理与托管（Inference Providers 与 Inference Endpoints）、以及丰富的开源库（Transformers、Diffusers、Datasets、Tokenizers、Accelerate、PEFT、TRL、Safetensors、Transformers.js、smolagents、TGI 等）。平台支持文本、图像、音频、视频与 3D 等多模态，提供 Python、JavaScript 与 REST/OpenAI 兼容端点的统一接入。

Kimi 大模型 API

月之暗面

长上下文＋JSON/Partial Mode，兼容 /v1

Kimi 由月之暗面（Moonshot AI）提供，开放平台兼容 OpenAI 的 API/SDK，提供聊天补全、工具调用、JSON Mode、Partial Mode、长上下文与视觉理解（kimi-latest）等能力。核心端点为 POST /v1/chat/completions，支持流式输出与上下文缓存。

OpenAI API

OpenAI

统一 Responses＋Realtime，旗舰级开发者 API

OpenAI 提供面向开发者的开放平台与 REST/Streaming/Realtime API，包括通用回复（Responses API）、传统聊天补全（Chat Completions）、嵌入向量（Embeddings）、图像生成（Images）、语音文本（Audio：TTS/转写）、以及 Assistants 线程与运行（Threads/Runs）。统一基础地址为 https://api.openai.com/v1，采用 Bearer 令牌进行鉴权。用量与速率限制因账户和模型而异，参考官方限速文档与账户控制台。

Replicate HTTP API

Replicate

统一“预测”接口，SSE＋异步随你挑

Replicate 提供统一的 HTTP API 用于运行社区与官方 AI 模型（文本、图像、音频、视频等），核心对象为 "prediction"。开发者可通过 POST /v1/predictions 或模型/部署专属端点创建一次运行，支持同步（Prefer: wait）与异步模式、SSE 流式输出与 Webhook 回调。鉴权使用 Bearer 令牌，基础地址为 https://api.replicate.com/v1。创建预测端点限速约 600 次/分钟，其他端点约 3000 次/分钟；计费按模型规则（按时长或按令牌）。

面向生产的 AI API 提供商目录，覆盖 LLM、对话/消息、推理、向量与嵌入、图像/音频/视频以及模型托管。包含 OpenAI、Anthropic Claude、Google Gemini、Azure AI、AWS AI Services、阿里云百炼（通义千问）、DeepSeek、Kimi（月之暗面）、Hugging Face 与 Replicate，多个接口兼容 OpenAI。