Image · Google

Gemini Omni

创建声音、角色和多模态视频资源,用于旁白、对白和 Agent 媒体工作流。

运行中 · 3 variants · 起价 $0.0000
# Works with Claude Code, Codex, Gemini CLI, Cursor, and 50+ agents
npx skills add runapi-ai/gemini-omni -g
The -g flag installs globally so every project picks it up.
Or paste this prompt to your AI agent:
Install the Gemini Omni skill for me:

1. Clone https://github.com/runapi-ai/gemini-omni
2. Copy the skills/gemini-omni/ directory into your
   user-level skills directory (e.g. ~/.claude/skills/
   for Claude Code, ~/.codex/skills/ for Codex).
3. Verify that SKILL.md is present.
4. Confirm the install path when done.
概览

Gemini Omni 可创建可复用声音资源、可复用角色资源,以及可组合提示词、参考图、音频 ID、角色 ID 和源视频片段的多模态视频。

  • 多变体覆盖不同速度/质量层级
  • 每种能力一个端点——text-to-X、image-to-X 等
  • 按变体支持流式与异步模式
  • 失败的生成不计费
变体

对比全部变体

Variant Billing From
gemini-omni-audio call $0.0000 查看 →
gemini-omni-character call $0.0000 查看 →
gemini-omni-text-to-video call $3.60 查看 →
AGENT USAGE

从 prompt 到工具调用

Typed schema · 调用前已验证
# User prompt to the agent
"生成一段 1080p 霓虹城市跟拍视频:可复用角色在雨中前行,并配合稳定旁白。"
// Code generated by the agent via @runapi.ai/gemini-omni
import { GeminiOmniClient } from '@runapi.ai/gemini-omni';

const client = new GeminiOmniClient();
const result = await client.createAudio.run({
  model: 'gemini-omni-audio',
  prompt: '生成一段 1080p 霓虹城市跟拍视频:可复用角色在雨中前行,并配合稳定旁白。',
});
@runapi.ai/gemini-omni npm
工作流程

四步从安装到首次结果

01

安装

一条 CLI 命令把技能包装进 agent。

02

配置

设置变体 ID 与 RunAPI key。配置就这么简单。

03

调用

Agent 发出一个 typed 工具调用。Schema 已校验,无 glue code。

04

接收

把结果流回 agent loop。已缓存、已签名、即可用。

SDK QUICKSTART

直接从代码调用

runapi.ai
curl -X POST https://runapi.ai/api/v1/gemini_omni/create_audio \
  -H "Authorization: Bearer $RUNAPI_KEY" \
  -H "Content-Type: application/json" \
  -d '{
  "audio_id": "achernar",
  "name": "Acher Narrator",
  "voice_description": "生成一段 1080p 霓虹城市跟拍视频:可复用角色在雨中前行,并配合稳定旁白。",
  "example_dialogue": "Hello, I am achernar"
}'
import { GeminiOmniClient } from "@runapi.ai/gemini-omni";

const client = new GeminiOmniClient();
const result = await client.createAudio.run({
    audio_id: "achernar",
    name: "Acher Narrator",
    voice_description: "生成一段 1080p 霓虹城市跟拍视频:可复用角色在雨中前行,并配合稳定旁白。",
    example_dialogue: "Hello, I am achernar",
});
require "runapi/gemini_omni"

client = RunApi::GeminiOmni::Client.new
result = client.create_audio.run(
    audio_id: "achernar",
    name: "Acher Narrator",
    voice_description: "生成一段 1080p 霓虹城市跟拍视频:可复用角色在雨中前行,并配合稳定旁白。",
    example_dialogue: "Hello, I am achernar"
)
@runapi.ai/gemini-omni v1
背景

Gemini Omni 是什么?

Gemini Omni 属于 RunAPI 的 Google catalog,音频、角色和视频变体共用同一个 SDK 包、CLI 命名空间和计费页面。

Provider
Google
Modality
Image
为何选择 RunAPI

为什么用 RunAPI 调用 Gemini Omni

一把认证,覆盖所有提供方

一把 RunAPI key 解锁整个模型目录。无需为每家提供方单独建账户。

统一的定价与账单

USD 按次定价,按月结算。失败的生成不计费。

Schema 优先的 SDK

跨变体的 typed JSON Schema。工具调用在发送前已验证。

常见问题

常见问题

应该从哪个变体开始?

选满足质量要求的最便宜变体。多数团队从 fast 起步,生产时升级到 pro。

有免费额度吗?

新账户每个模型都有免费调用额度,之后按次计费。

支持流式吗?

模型支持流式时,RunAPI 端到端流式。

失败怎么计费?

失败的生成不计费。

输出会缓存吗?

输出按任务 ID 存储在 R2 供回取。输入不缓存。

可以商用吗?

可以——所有变体默认含商用许可,除非模型许可明确限制;有例外会在变体页面注明。

速率限制?

Key 级限流随使用层级伸缩。当前限制见定价页。

在哪里报问题?

在公共 GitHub 仓库提 issue 或邮件联系 support。

立即开始

立即体验 Gemini Omni。