变体 · Google / Gemini

Gemini gemini-3.5-flash API

同一套 API,同一个 SDK — 切换变体只需改一个参数。

运行中 · text · 可商用
# Works with Claude Code, Codex, Gemini CLI, Cursor, and 50+ agents
npx skills add runapi-ai/gemini -g
The -g flag installs globally so every project picks it up.
Or paste this prompt to your AI agent:
Install the Gemini skill for me:

1. Clone https://github.com/runapi-ai/gemini
2. Copy the skills/gemini/ directory into your
   user-level skills directory (e.g. ~/.claude/skills/
   for Claude Code, ~/.codex/skills/ for Codex).
3. Verify that SKILL.md is present.
4. Confirm the install path when done.
切换变体
概览

gemini-3.5-flash 在 Gemini 家族中处于质量与成本的最佳平衡点。

  • USD 按次定价
  • 失败不计费
  • 模型支持时流式
  • Schema 校验后的工具调用
定价

定价

失败的生成不计费
Generate content stream
Input $0.75 / 1M tokens
Output $4.50 / 1M tokens
规格

技术细节

模型 ID gemini-3.5-flash
提供方 Google
模态 text
任务类型 synchronous
计费单位 1K tokens
API 端点 /v1beta/models/gemini-3.5-flash:streamGenerateContent
商用许可 允许商用
状态 运行中
快速开始

Quickstart — gemini-3.5-flash

runapi.ai
curl -X POST https://runapi.ai/v1beta/models/gemini-3.5-flash:streamGenerateContent \
  -H "Authorization: Bearer $RUNAPI_KEY" \
  -H "Content-Type: application/json" \
  -d '{
  "model": "gemini-3.5-flash",
  "contents": [
    {
      "parts": [
        {
          "text": "分析这段代码库,给出三项性能优化建议,包含优化前后的对比示例。"
        }
      ]
    }
  ]
}'
import { GeminiClient } from "@runapi.ai/gemini";

const client = new GeminiClient();
const result = await client.streamGenerateContent.run({
    model: "gemini-3.5-flash",
    contents: [{"parts":[{"text":"分析这段代码库,给出三项性能优化建议,包含优化前后的对比示例。"}]}],
});
require "runapi/gemini"

client = RunApi::Gemini::Client.new
result = client.stream_generate_content.run(
    model: "gemini-3.5-flash",
    contents: [{parts: [{text: "分析这段代码库,给出三项性能优化建议,包含优化前后的对比示例。"}]}]
)
@runapi.ai/gemini v1
工作流程

四步使用 gemini-3.5-flash

01

安装

安装该模型线对应的 SDK 或 agent 技能。

02

配置

把 model 字段设置为本页展示的完整模型 ID。

03

调用

带上提示词、输入文件和回调配置,发送类型化请求。

04

接收

从 RunAPI 读取任务响应、webhook 回调或缓存输出 URL。

差异

gemini-3.5-flash 与其它变体的差异

VS GEMINI-2.5-FLASH

面向高并发生产场景的快速多模态流式输出

速度/成本优化;100 万上下文;稳定基线

VS GEMINI-2.5-PRO

面向高并发生产场景的快速多模态流式输出

2.5 代最强推理;100 万上下文

VS GEMINI-3-FLASH-PREVIEW

面向高并发生产场景的快速多模态流式输出

gemini-3-flash-preview

应用场景

最适合的场景

客户支持

基于私有知识库回答客户问题,减少工单量。

文档分析

起草合同摘要并标记关键条款供律师审阅。

代码生成

在 CI 中自动生成单元测试、代码审查和重构建议。

常见问题

gemini-3.5-flash 常见问题

模型 ID 跨版本稳定吗?

RunAPI 保持模型 ID 稳定,并在不改变请求形态的前提下处理兼容版本刷新。

该变体的限流?

Key 级限流随使用层级伸缩。当前限制见定价页。

能切到其它变体吗?

可以——变体只是参数,改 model 字段即可。

支持流式吗?

模型支持流式时,RunAPI 端到端流式。

质量问题在哪里报?

在公共 GitHub 仓库提 issue 或邮件联系 support。

立即开始

立即体验 Gemini。