Google AI 开发者 — Gemini API
Gemini API 是 Google AI 提供的多模态生成式 AI 服务,支持文本、图片、视频、音频与 PDF 的理解与生成,并提供结构化输出、函数调用、上下文缓存、批处理、嵌入向量与令牌计数等能力。适用于聊天助手、内容生成、检索增强、Agent 工具使用与大规模管线处理。
基础 URL
https://generativelanguage.googleapis.com
认证
Bearer / Authorization: Bearer
官方 SDK
JavaScript, Python, Android (Kotlin), Swift
🔑 API Key 获取
前置要求:需要 Google 账号登录;如需提高速率或使用付费层级,需在云项目中启用 Cloud Billing。
说明:登录 Google AI Studio,在左侧进入“API Keys”,点击“Create API key”生成密钥(仅显示一次)。可在项目级别管理免费或付费方案。
支持模型
API 接口列表
列出可用的 Gemini 模型(包括稳定与预览版本),返回模型名称、支持的多模态类型、上下文窗口与功能标识。
认证是
频率限制10 requests/min
计费模式按量计费(每百万 token,输入与输出分别计费);提供免费层级
{
"url": "https://generativelanguage.googleapis.com/v1beta/models?key=YOUR_API_KEY"
}获取指定模型的详细信息,例如支持的输入/输出类型、令牌限制与功能。
认证是
频率限制10 requests/min
计费模式按量计费(每百万 token,输入与输出分别计费);提供免费层级
{
"url": "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.5-flash?key=YOUR_API_KEY"
}进行内容生成(文本与多模态)。支持结构化输出、函数调用、上下文缓存与工具使用。
认证是
频率限制10 requests/min
计费模式按量计费(每百万 token,输入与输出分别计费);批处理可降本
{
"url": "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.5-flash:generateContent?key=YOUR_API_KEY",
"body": {
"contents": [
{
"role": "user",
"parts": [
{
"text": "用 3 点概述 Gemini API 的核心能力。"
}
]
}
]
}
}以服务器流式(Server-streaming)方式生成内容,适用于低延迟输出场景。
认证是
频率限制10 requests/min
计费模式按量计费(每百万 token,输入与输出分别计费)
{
"url": "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.5-flash:streamGenerateContent?key=YOUR_API_KEY",
"body": {
"contents": [
{
"role": "user",
"parts": [
{
"text": "请逐步流式输出结果。"
}
]
}
]
}
}计算提示与候选的令牌用量,用于费用与配额估算。
认证是
频率限制10 requests/min
计费模式计数请求不收取令牌费用,但占用配额;生成/嵌入按量计费
{
"url": "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.5-flash:countTokens?key=YOUR_API_KEY",
"body": {
"contents": [
{
"role": "user",
"parts": [
{
"text": "这段文字的 token 数是多少?"
}
]
}
]
}
}为单条内容生成嵌入向量,适用于检索增强与语义搜索。
认证是
频率限制100 requests/min
计费模式按量计费(每百万 token);不同嵌入模型价格不同
{
"url": "https://generativelanguage.googleapis.com/v1beta/models/embedding-001:embedContent?key=YOUR_API_KEY",
"body": {
"content": {
"parts": [
{
"text": "检索增强的文档片段"
}
]
}
}
}为多条内容批量生成嵌入,提升吞吐并降低总体成本。
认证是
频率限制100 requests/min
计费模式按量计费(每百万 token);批处理具备成本优势
{
"url": "https://generativelanguage.googleapis.com/v1beta/models/embedding-001:batchEmbedContents?key=YOUR_API_KEY",
"body": {
"requests": [
{
"content": {
"parts": [
{
"text": "文档 A"
}
]
}
},
{
"content": {
"parts": [
{
"text": "文档 B"
}
]
}
}
]
}
}