Google AI 开发者 — Gemini API

Gemini API 是 Google AI 提供的多模态生成式 AI 服务,支持文本、图片、视频、音频与 PDF 的理解与生成,并提供结构化输出、函数调用、上下文缓存、批处理、嵌入向量与令牌计数等能力。适用于聊天助手、内容生成、检索增强、Agent 工具使用与大规模管线处理。

基础 URL
https://generativelanguage.googleapis.com
认证
Bearer / Authorization: Bearer
官方 SDK
JavaScript, Python, Android (Kotlin), Swift
🔑 API Key 获取
前置要求:需要 Google 账号登录;如需提高速率或使用付费层级,需在云项目中启用 Cloud Billing。
入口:https://aistudio.google.com/api-keys
说明:登录 Google AI Studio,在左侧进入“API Keys”,点击“Create API key”生成密钥(仅显示一次)。可在项目级别管理免费或付费方案。

支持模型

API 接口列表

GET /v1beta/models Docs

列出可用的 Gemini 模型(包括稳定与预览版本),返回模型名称、支持的多模态类型、上下文窗口与功能标识。

认证
频率限制10 requests/min
计费模式按量计费(每百万 token,输入与输出分别计费);提供免费层级
{
  "url": "https://generativelanguage.googleapis.com/v1beta/models?key=YOUR_API_KEY"
}
GET /v1beta/models/{model} Docs

获取指定模型的详细信息,例如支持的输入/输出类型、令牌限制与功能。

认证
频率限制10 requests/min
计费模式按量计费(每百万 token,输入与输出分别计费);提供免费层级
{
  "url": "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.5-flash?key=YOUR_API_KEY"
}
POST /v1beta/models/{model}:generateContent Docs

进行内容生成(文本与多模态)。支持结构化输出、函数调用、上下文缓存与工具使用。

认证
频率限制10 requests/min
计费模式按量计费(每百万 token,输入与输出分别计费);批处理可降本
{
  "url": "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.5-flash:generateContent?key=YOUR_API_KEY",
  "body": {
    "contents": [
      {
        "role": "user",
        "parts": [
          {
            "text": "用 3 点概述 Gemini API 的核心能力。"
          }
        ]
      }
    ]
  }
}
POST /v1beta/models/{model}:streamGenerateContent Docs

以服务器流式(Server-streaming)方式生成内容,适用于低延迟输出场景。

认证
频率限制10 requests/min
计费模式按量计费(每百万 token,输入与输出分别计费)
{
  "url": "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.5-flash:streamGenerateContent?key=YOUR_API_KEY",
  "body": {
    "contents": [
      {
        "role": "user",
        "parts": [
          {
            "text": "请逐步流式输出结果。"
          }
        ]
      }
    ]
  }
}
POST /v1beta/models/{model}:countTokens Docs

计算提示与候选的令牌用量,用于费用与配额估算。

认证
频率限制10 requests/min
计费模式计数请求不收取令牌费用,但占用配额;生成/嵌入按量计费
{
  "url": "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.5-flash:countTokens?key=YOUR_API_KEY",
  "body": {
    "contents": [
      {
        "role": "user",
        "parts": [
          {
            "text": "这段文字的 token 数是多少?"
          }
        ]
      }
    ]
  }
}
POST /v1beta/models/{model}:embedContent Docs

为单条内容生成嵌入向量,适用于检索增强与语义搜索。

认证
频率限制100 requests/min
计费模式按量计费(每百万 token);不同嵌入模型价格不同
{
  "url": "https://generativelanguage.googleapis.com/v1beta/models/embedding-001:embedContent?key=YOUR_API_KEY",
  "body": {
    "content": {
      "parts": [
        {
          "text": "检索增强的文档片段"
        }
      ]
    }
  }
}
POST /v1beta/models/{model}:batchEmbedContents Docs

为多条内容批量生成嵌入,提升吞吐并降低总体成本。

认证
频率限制100 requests/min
计费模式按量计费(每百万 token);批处理具备成本优势
{
  "url": "https://generativelanguage.googleapis.com/v1beta/models/embedding-001:batchEmbedContents?key=YOUR_API_KEY",
  "body": {
    "requests": [
      {
        "content": {
          "parts": [
            {
              "text": "文档 A"
            }
          ]
        }
      },
      {
        "content": {
          "parts": [
            {
              "text": "文档 B"
            }
          ]
        }
      }
    ]
  }
}