---
title: "Gemini API — 全部变体、定价与 Model Skill | RunAPI"
url: "https://runapi.ai/zh-CN/models/gemini.md"
canonical: "https://runapi.ai/zh-CN/models/gemini.md"
locale: "zh-CN"
model: "Gemini"
provider: "Google"
modality: "text"
variant_count: 6
price_from_cents: 2
---

# Gemini API

Gemini API 调用 Google 多模态大语言模型，支持对话、代码生成、推理和长上下文任务。

**Provider:** Google
**Modality:** Text
**Catalog:** 6 variants

Gemini 是 Google 的多模态大语言模型系列，支持文本、图像、音频和代码理解。提供 Flash 和 Pro 两种规格，适用于快速摘要到深度推理及复杂编程等各类任务。

## Variants

| Version | Variant | Pricing | Billing | URL |
|---|---|---|---|---|
| gemini-2.5-flash | `2.5-flash` | $0.020 | 1K tokens | https://runapi.ai/zh-CN/models/gemini/2.5-flash.md |
| gemini-2.5-pro | `2.5-pro` | $0.050 | 1K tokens | https://runapi.ai/zh-CN/models/gemini/2.5-pro.md |
| gemini-3-flash-preview | `3-flash-preview` | $0.020 | 1K tokens | https://runapi.ai/zh-CN/models/gemini/3-flash-preview.md |
| gemini-3-pro-preview | `3-pro-preview` | $0.060 | 1K tokens | https://runapi.ai/zh-CN/models/gemini/3-pro-preview.md |
| gemini-3.1-pro-preview | `3.1-pro-preview` | $0.060 | 1K tokens | https://runapi.ai/zh-CN/models/gemini/3.1-pro-preview.md |
| gemini-3.5-flash | `3.5-flash` | $0.050 | 1K tokens | https://runapi.ai/zh-CN/models/gemini/3.5-flash.md |


## API endpoints

Base URL: `https://runapi.ai`

- `POST /v1/chat/completions`
- `POST /v1beta/models/*:streamGenerateContent`

Use the OpenAI or Anthropic SDK with your RunAPI API key. No extra SDK required.

## Context

Gemini 是 Google 的旗舰多模态 LLM，提供 Flash（快速）和 Pro（旗舰推理）变体。通过 RunAPI，所有 Gemini 模型共享相同的 API 接口和计费。

## FAQ

### 应该从哪个变体开始？

选满足质量要求的最便宜变体。多数团队从 fast 起步，生产时升级到 pro。

### 有免费额度吗？

新账户每个模型都有免费调用额度，之后按次计费。

### 支持流式吗？

模型支持流式时，RunAPI 端到端流式。

### 失败怎么计费？

失败的生成不计费。

### 输出会缓存吗？

输出按任务 ID 存储在 R2 供回取。输入不缓存。

### 可以商用吗？

可以——所有变体默认含商用许可，除非模型许可明确限制；有例外会在变体页面注明。

### 速率限制？

Key 级限流随使用层级伸缩。当前限制见定价页。

### 在哪里报问题？

在公共 GitHub 仓库提 issue 或邮件联系 support。

