Video · Google

Gemini Omni API

Gemini Omni API 调用声音、角色和多模态视频资源，用于旁白、对白和 Agent 媒体工作流。

运行中 · 3 variants · 起价 $0.0000

runapi.ai

curl -X POST https://runapi.ai/api/v1/gemini_omni/create_audio \
  -H "Authorization: Bearer $RUNAPI_KEY" \
  -H "Content-Type: application/json" \
  -d '{
  "audio_id": "achernar",
  "name": "Acher Narrator",
  "voice_description": "生成一段 1080p 霓虹城市跟拍视频：可复用角色在雨中前行，并配合稳定旁白。",
  "example_dialogue": "Hello, I am achernar"
}'

import { GeminiOmniClient } from "@runapi.ai/gemini-omni";

const client = new GeminiOmniClient();
const result = await client.createAudio.run({
    audio_id: "achernar",
    name: "Acher Narrator",
    voice_description: "生成一段 1080p 霓虹城市跟拍视频：可复用角色在雨中前行，并配合稳定旁白。",
    example_dialogue: "Hello, I am achernar",
});

<?php

require __DIR__ . "/vendor/autoload.php";

use RunApi\GeminiOmni\GeminiOmniClient;

$client = new GeminiOmniClient();
$result = $client->createAudio->run([
        'audio_id' => 'achernar',
        'name' => 'Acher Narrator',
        'voice_description' => '生成一段 1080p 霓虹城市跟拍视频：可复用角色在雨中前行，并配合稳定旁白。',
        'example_dialogue' => 'Hello, I am achernar',
]);

require "runapi/gemini_omni"

client = RunApi::GeminiOmni::Client.new
result = client.create_audio.run(
    audio_id: "achernar",
    name: "Acher Narrator",
    voice_description: "生成一段 1080p 霓虹城市跟拍视频：可复用角色在雨中前行，并配合稳定旁白。",
    example_dialogue: "Hello, I am achernar"
)

npx skills add runapi-ai/gemini-omni -g

# Claude Code
claude mcp add runapi -s user -- npx -y @runapi.ai/mcp

# Codex
codex plugin install runapi-mcp@agents

# Cursor / Windsurf / VS Code
npx @runapi.ai/mcp init cursor

@runapi.ai/gemini-omni v1

概览

Gemini Omni 可创建可复用声音资源、可复用角色资源，以及可组合提示词、参考图、音频 ID、角色 ID 和源视频片段的多模态视频。

多变体覆盖不同速度/质量层级
Model skill 包含文档、schema 和接入说明
适合面向应用的编码工作流
失败的生成不计费

变体

对比全部 API 变体

Variant	Billing	From
gemini-omni-audio	call	$0.0000	查看 →
gemini-omni-character	call	$0.0000	查看 →
gemini-omni-text-to-video	call	$3.60	查看 →

技能

为应用开发安装 Gemini Omni skill

把模型文档、schema、定价说明和接入步骤加载进代码工作区。

# Install the model skill for app development workflows
npx skills add runapi-ai/gemini-omni -g

Installs docs, schemas, pricing context, and setup notes into your developer workspace.

Or use this setup request in your coding tool:

Install the Gemini Omni skill for this app:

1. Add runapi-ai/gemini-omni with the skills installer.
2. Load SKILL.md in this workspace.
3. Use its docs, schemas, pricing notes, and setup steps when adding model features.
4. Confirm the install path when done.

工作流程

四步从 model skill 到首次结果

选择模型

根据输出类型、质量要求和延迟目标选择模型与变体。

配置

设置 RunAPI key，并在代码工作区安装对应 model skill。

调用

按 skill 里的说明，把模型能力接入到你的应用里。

接收

按 task ID 轮询、在支持时使用流式，或处理 webhook 回调。

背景

Gemini Omni API 是什么？

Gemini Omni 属于 RunAPI 的 Google catalog，音频、角色和视频变体共用同一个 SDK 包、CLI 命名空间和计费页面。

Provider

Google

Modality

Video

为何选择 RunAPI

为什么用 RunAPI 调用 Gemini Omni API

一把认证，覆盖所有提供方

一把 RunAPI key 解锁整个模型目录。无需为每家提供方单独建账户。

统一的定价与账单

USD 按次定价，按月结算。失败的生成不计费。

Schema 优先的 SDK

Typed schema 和接入说明已打包进 model skill，让实现从正确契约开始。

常见问题

应该从哪个变体开始？

选满足质量要求的最便宜变体。多数团队从 fast 起步，生产时升级到 pro。

有免费额度吗？

新账户每个模型都有免费调用额度，之后按次计费。

支持流式吗？

模型支持流式时，RunAPI 端到端流式。

失败怎么计费？

失败的生成不计费。

输出会缓存吗？

输出按任务 ID 存储在 R2 供回取。输入不缓存。

可以商用吗？

可以——所有变体默认含商用许可，除非模型许可明确限制；有例外会在变体页面注明。

速率限制？

Key 级限流随使用层级伸缩。当前限制见定价页。

在哪里报问题？

在公共 GitHub 仓库提 issue 或邮件联系 support。

相似模型

如果喜欢 Gemini Omni API，也可以试试这些

立即开始

立即体验 Gemini Omni API。

免费注册阅读快速开始 →

变体