Google AI 开发者 — Gemini API

Gemini API 是 Google AI 提供的多模态生成式 AI 服务，支持文本、图片、视频、音频与 PDF 的理解与生成，并提供结构化输出、函数调用、上下文缓存、批处理、嵌入向量与令牌计数等能力。适用于聊天助手、内容生成、检索增强、Agent 工具使用与大规模管线处理。

基础 URL

https://generativelanguage.googleapis.com

官网

https://ai.google.dev

开放平台

https://aistudio.google.com/

认证

Bearer / Authorization: Bearer

官方 SDK

JavaScript, Python, Android (Kotlin), Swift

定价

https://ai.google.dev/gemini-api/docs/pricing

🔑 API Key 获取

前置要求：需要 Google 账号登录；如需提高速率或使用付费层级，需在云项目中启用 Cloud Billing。

入口：https://aistudio.google.com/api-keys

说明：登录 Google AI Studio，在左侧进入“API Keys”，点击“Create API key”生成密钥（仅显示一次）。可在项目级别管理免费或付费方案。

支持模型

API 接口列表

GET /v1beta/models Docs

列出可用的 Gemini 模型（包括稳定与预览版本），返回模型名称、支持的多模态类型、上下文窗口与功能标识。

认证是

频率限制10 requests/min

计费模式按量计费（每百万 token，输入与输出分别计费）；提供免费层级

{
  "url": "https://generativelanguage.googleapis.com/v1beta/models?key=YOUR_API_KEY"
}

GET /v1beta/models/{model} Docs

获取指定模型的详细信息，例如支持的输入/输出类型、令牌限制与功能。

认证是

频率限制10 requests/min

计费模式按量计费（每百万 token，输入与输出分别计费）；提供免费层级

{
  "url": "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.5-flash?key=YOUR_API_KEY"
}

POST /v1beta/models/{model}:generateContent Docs

进行内容生成（文本与多模态）。支持结构化输出、函数调用、上下文缓存与工具使用。

认证是

频率限制10 requests/min

计费模式按量计费（每百万 token，输入与输出分别计费）；批处理可降本

{
  "url": "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.5-flash:generateContent?key=YOUR_API_KEY",
  "body": {
    "contents": [
      {
        "role": "user",
        "parts": [
          {
            "text": "用 3 点概述 Gemini API 的核心能力。"
          }
        ]
      }
    ]
  }
}

POST /v1beta/models/{model}:streamGenerateContent Docs

以服务器流式（Server-streaming）方式生成内容，适用于低延迟输出场景。

认证是

频率限制10 requests/min

计费模式按量计费（每百万 token，输入与输出分别计费）

{
  "url": "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.5-flash:streamGenerateContent?key=YOUR_API_KEY",
  "body": {
    "contents": [
      {
        "role": "user",
        "parts": [
          {
            "text": "请逐步流式输出结果。"
          }
        ]
      }
    ]
  }
}

POST /v1beta/models/{model}:countTokens Docs

计算提示与候选的令牌用量，用于费用与配额估算。

认证是

频率限制10 requests/min

计费模式计数请求不收取令牌费用，但占用配额；生成/嵌入按量计费

{
  "url": "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.5-flash:countTokens?key=YOUR_API_KEY",
  "body": {
    "contents": [
      {
        "role": "user",
        "parts": [
          {
            "text": "这段文字的 token 数是多少？"
          }
        ]
      }
    ]
  }
}

POST /v1beta/models/{model}:embedContent Docs

为单条内容生成嵌入向量，适用于检索增强与语义搜索。

认证是

频率限制100 requests/min

计费模式按量计费（每百万 token）；不同嵌入模型价格不同

{
  "url": "https://generativelanguage.googleapis.com/v1beta/models/embedding-001:embedContent?key=YOUR_API_KEY",
  "body": {
    "content": {
      "parts": [
        {
          "text": "检索增强的文档片段"
        }
      ]
    }
  }
}

POST /v1beta/models/{model}:batchEmbedContents Docs

为多条内容批量生成嵌入，提升吞吐并降低总体成本。

认证是

频率限制100 requests/min

计费模式按量计费（每百万 token）；批处理具备成本优势

{
  "url": "https://generativelanguage.googleapis.com/v1beta/models/embedding-001:batchEmbedContents?key=YOUR_API_KEY",
  "body": {
    "requests": [
      {
        "content": {
          "parts": [
            {
              "text": "文档 A"
            }
          ]
        }
      },
      {
        "content": {
          "parts": [
            {
              "text": "文档 B"
            }
          ]
        }
      }
    ]
  }
}