变体 · Google / Gemini Omni

gemini-omni-audio API

Google / Gemini Omni

通过 RunAPI 使用 Gemini Omni 系列的 gemini-omni-audio。按次计费，无需订阅，失败的生成不计费。

运行中 · audio_music · 可商用

runapi.ai

curl -X POST https://runapi.ai/api/v1/gemini_omni/create_audio \
  -H "Authorization: Bearer $RUNAPI_KEY" \
  -H "Content-Type: application/json" \
  -d '{
  "audio_id": "achernar",
  "name": "Acher Narrator",
  "voice_description": "生成一段 1080p 霓虹城市跟拍视频：可复用角色在雨中前行，并配合稳定旁白。",
  "example_dialogue": "Hello, I am achernar"
}'

import { GeminiOmniClient } from "@runapi.ai/gemini-omni";

const client = new GeminiOmniClient();
const result = await client.createAudio.run({
    audio_id: "achernar",
    name: "Acher Narrator",
    voice_description: "生成一段 1080p 霓虹城市跟拍视频：可复用角色在雨中前行，并配合稳定旁白。",
    example_dialogue: "Hello, I am achernar",
});

<?php

require __DIR__ . "/vendor/autoload.php";

use RunApi\GeminiOmni\GeminiOmniClient;

$client = new GeminiOmniClient();
$result = $client->createAudio->run([
        'audio_id' => 'achernar',
        'name' => 'Acher Narrator',
        'voice_description' => '生成一段 1080p 霓虹城市跟拍视频：可复用角色在雨中前行，并配合稳定旁白。',
        'example_dialogue' => 'Hello, I am achernar',
]);

require "runapi/gemini_omni"

client = RunApi::GeminiOmni::Client.new
result = client.create_audio.run(
    audio_id: "achernar",
    name: "Acher Narrator",
    voice_description: "生成一段 1080p 霓虹城市跟拍视频：可复用角色在雨中前行，并配合稳定旁白。",
    example_dialogue: "Hello, I am achernar"
)

npx skills add runapi-ai/gemini-omni -g

# Claude Code
claude mcp add runapi -s user -- npx -y @runapi.ai/mcp

# Codex
codex plugin install runapi-mcp@agents

# Cursor / Windsurf / VS Code
npx @runapi.ai/mcp init cursor

@runapi.ai/gemini-omni v1

切换变体

gemini-omni-character gemini-omni-flash-preview gemini-omni-text-to-video

概览

gemini-omni-audio 在 Gemini Omni 家族中处于质量与成本的最佳平衡点。

USD 按次定价
失败不计费
模型支持时流式
Schema 校验后的工具调用

定价

失败的生成不计费

Create audio

Free / track

规格

技术细节

模型 ID	gemini-omni-audio
提供方	Google
模态	audio_music
任务类型	synchronous
计费单位	call
API 端点	/api/v1/gemini_omni/create_audio
商用许可	允许商用
收录状态	运行中

技能

Model skill — gemini-omni-audio

安装一次 skill，开发时使用本页的变体 ID。

# Install the model skill for app development workflows
npx skills add runapi-ai/gemini-omni -g

Installs docs, schemas, pricing context, and setup notes into your developer workspace.

Or use this setup request in your coding tool:

Install the Gemini Omni skill for this app:

1. Add runapi-ai/gemini-omni with the skills installer.
2. Load SKILL.md in this workspace.
3. Use its docs, schemas, pricing notes, and setup steps when adding model features.
4. Confirm the install path when done.

工作流程

用 model skill 使用 gemini-omni-audio

安装

安装该模型线对应的 model skill。

配置

把 model 字段设置为本页展示的完整模型 ID。

调用

按 skill 说明把提示词、输入文件和回调处理接入应用。

接收

从 RunAPI 读取任务响应、webhook 回调或缓存输出 URL。

差异

gemini-omni-audio 与其它变体的差异

VS GEMINI-OMNI-CHARACTER

基于预设声音同步创建可复用声音资源

基于单张参考图同步创建可复用角色资源

VS GEMINI-OMNI-FLASH-PREVIEW

基于预设声音同步创建可复用声音资源

面向自然语言创意迭代的快速对话式视频生成

VS GEMINI-OMNI-TEXT-TO-VIDEO

基于预设声音同步创建可复用声音资源

支持提示词、图片、音频、角色和源片段参考的多模态视频

应用场景

最适合的场景

播客与视频配乐

生成与节目氛围匹配的免版税背景音乐，无需授权费用。

游戏音频

为程序化生成的关卡生成自适应环境音效和配乐。

广告配音与音效

无需录音棚即可为客户广告生成定制配音和音效。

常见问题

gemini-omni-audio 常见问题

模型 ID 跨版本稳定吗？

RunAPI 保持模型 ID 稳定，并在不改变请求形态的前提下处理兼容版本刷新。

该变体的限流？

Key 级限流随使用层级伸缩。当前限制见定价页。

能切到其它变体吗？

可以——变体只是参数，改 model 字段即可。

支持流式吗？

模型支持流式时，RunAPI 端到端流式。

质量问题在哪里报？

在公共 GitHub 仓库提 issue 或邮件联系 support。

Gemini Omni 的其它变体

gemini-omni-character 最低价

character

$0.0000 / call

gemini-omni-flash-preview 快速

flash-preview

$0.600 / call

gemini-omni-text-to-video

text-to-video

$3.60 / call

立即体验 Gemini Omni。

免费注册阅读快速开始 →

gemini-omni-audio API

定价

技术细节

Model skill — gemini-omni-audio

用 model skill 使用 gemini-omni-audio

安装

配置

调用

接收

gemini-omni-audio 与其它变体的差异

基于预设声音同步创建可复用声音资源

基于预设声音同步创建可复用声音资源

基于预设声音同步创建可复用声音资源

最适合的场景

播客与视频配乐

游戏音频

广告配音与音效

gemini-omni-audio 常见问题

Gemini Omni 的其它变体

同类的其它模型

立即体验 Gemini Omni。