变体 · Google / Gemini Omni

Gemini Omni gemini-omni-audio API

同一套 API,同一个 SDK — 切换变体只需改一个参数。

运行中 · audio_music · 可商用
# Works with Claude Code, Codex, Gemini CLI, Cursor, and 50+ agents
npx skills add runapi-ai/gemini-omni -g
The -g flag installs globally so every project picks it up.
Or paste this prompt to your AI agent:
Install the Gemini Omni skill for me:

1. Clone https://github.com/runapi-ai/gemini-omni
2. Copy the skills/gemini-omni/ directory into your
   user-level skills directory (e.g. ~/.claude/skills/
   for Claude Code, ~/.codex/skills/ for Codex).
3. Verify that SKILL.md is present.
4. Confirm the install path when done.
切换变体
概览

gemini-omni-audio 在 Gemini Omni 家族中处于质量与成本的最佳平衡点。

  • USD 按次定价
  • 失败不计费
  • 模型支持时流式
  • Schema 校验后的工具调用
定价

定价

失败的生成不计费
Create audio
Free / track
规格

技术细节

模型 ID gemini-omni-audio
提供方 Google
模态 audio_music
任务类型 synchronous
计费单位 call
API 端点 /api/v1/gemini_omni/create_audio
商用许可 允许商用
状态 运行中
快速开始

Quickstart — gemini-omni-audio

runapi.ai
curl -X POST https://runapi.ai/api/v1/gemini_omni/create_audio \
  -H "Authorization: Bearer $RUNAPI_KEY" \
  -H "Content-Type: application/json" \
  -d '{
  "audio_id": "achernar",
  "name": "Acher Narrator",
  "voice_description": "生成一段 1080p 霓虹城市跟拍视频:可复用角色在雨中前行,并配合稳定旁白。",
  "example_dialogue": "Hello, I am achernar"
}'
import { GeminiOmniClient } from "@runapi.ai/gemini-omni";

const client = new GeminiOmniClient();
const result = await client.createAudio.run({
    audio_id: "achernar",
    name: "Acher Narrator",
    voice_description: "生成一段 1080p 霓虹城市跟拍视频:可复用角色在雨中前行,并配合稳定旁白。",
    example_dialogue: "Hello, I am achernar",
});
require "runapi/gemini_omni"

client = RunApi::GeminiOmni::Client.new
result = client.create_audio.run(
    audio_id: "achernar",
    name: "Acher Narrator",
    voice_description: "生成一段 1080p 霓虹城市跟拍视频:可复用角色在雨中前行,并配合稳定旁白。",
    example_dialogue: "Hello, I am achernar"
)
@runapi.ai/gemini-omni v1
工作流程

四步使用 gemini-omni-audio

01

安装

安装该模型线对应的 SDK 或 agent 技能。

02

配置

把 model 字段设置为本页展示的完整模型 ID。

03

调用

带上提示词、输入文件和回调配置,发送类型化请求。

04

接收

从 RunAPI 读取任务响应、webhook 回调或缓存输出 URL。

差异

gemini-omni-audio 与其它变体的差异

VS GEMINI-OMNI-CHARACTER

基于预设声音同步创建可复用声音资源

基于单张参考图同步创建可复用角色资源

VS GEMINI-OMNI-TEXT-TO-VIDEO

基于预设声音同步创建可复用声音资源

支持提示词、图片、音频、角色和源片段参考的多模态视频

应用场景

最适合的场景

播客与视频配乐

生成与节目氛围匹配的免版税背景音乐,无需授权费用。

游戏音频

为程序化生成的关卡生成自适应环境音效和配乐。

广告配音与音效

无需录音棚即可为客户广告生成定制配音和音效。

常见问题

gemini-omni-audio 常见问题

模型 ID 跨版本稳定吗?

RunAPI 保持模型 ID 稳定,并在不改变请求形态的前提下处理兼容版本刷新。

该变体的限流?

Key 级限流随使用层级伸缩。当前限制见定价页。

能切到其它变体吗?

可以——变体只是参数,改 model 字段即可。

支持流式吗?

模型支持流式时,RunAPI 端到端流式。

质量问题在哪里报?

在公共 GitHub 仓库提 issue 或邮件联系 support。

立即开始

立即体验 Gemini Omni。