变体 · Google / Gemini Omni

Gemini Omni gemini-omni-text-to-video API

同一套 API,同一个 SDK — 切换变体只需改一个参数。

运行中 · video · 可商用
# Works with Claude Code, Codex, Gemini CLI, Cursor, and 50+ agents
npx skills add runapi-ai/gemini-omni -g
The -g flag installs globally so every project picks it up.
Or paste this prompt to your AI agent:
Install the Gemini Omni skill for me:

1. Clone https://github.com/runapi-ai/gemini-omni
2. Copy the skills/gemini-omni/ directory into your
   user-level skills directory (e.g. ~/.claude/skills/
   for Claude Code, ~/.codex/skills/ for Codex).
3. Verify that SKILL.md is present.
4. Confirm the install path when done.
切换变体
gemini-omni-audio gemini-omni-character
概览

gemini-omni-text-to-video 在 Gemini Omni 家族中处于质量与成本的最佳平衡点。

  • USD 按次定价
  • 失败不计费
  • 模型支持时流式
  • Schema 校验后的工具调用
定价

定价

失败的生成不计费
Text to video
$0.90-$3.60 / video
Input mode: video · Duration seconds: any · Output resolution: 4k $3.60
Input mode: video · Duration seconds: any · Output resolution: 720p $2.40
Input mode: video · Duration seconds: any · Output resolution: 1080p $2.40
Input mode: generated · Duration seconds: 4 · Output resolution: 4k $2.10
Input mode: generated · Duration seconds: 4 · Output resolution: 720p $0.90
Input mode: generated · Duration seconds: 4 · Output resolution: 1080p $0.90
Input mode: generated · Duration seconds: 6 · Output resolution: 4k $2.40
Input mode: generated · Duration seconds: 6 · Output resolution: 720p $1.20
Input mode: generated · Duration seconds: 6 · Output resolution: 1080p $1.20
Input mode: generated · Duration seconds: 8 · Output resolution: 4k $2.70
Input mode: generated · Duration seconds: 8 · Output resolution: 720p $1.50
Input mode: generated · Duration seconds: 8 · Output resolution: 1080p $1.50
Input mode: generated · Duration seconds: 10 · Output resolution: 4k $3.00
Input mode: generated · Duration seconds: 10 · Output resolution: 720p $1.80
Input mode: generated · Duration seconds: 10 · Output resolution: 1080p $1.80
规格

技术细节

模型 ID gemini-omni-text-to-video
提供方 Google
模态 video
任务类型 asynchronous
计费单位 call
API 端点 /api/v1/gemini_omni/text_to_video
商用许可 允许商用
状态 运行中
快速开始

Quickstart — gemini-omni-text-to-video

runapi.ai
curl -X POST https://runapi.ai/api/v1/gemini_omni/text_to_video \
  -H "Authorization: Bearer $RUNAPI_KEY" \
  -H "Content-Type: application/json" \
  -d '{
  "model": "gemini-omni-text-to-video",
  "prompt": "生成一段 1080p 霓虹城市跟拍视频:可复用角色在雨中前行,并配合稳定旁白。"
}'
import { GeminiOmniClient } from "@runapi.ai/gemini-omni";

const client = new GeminiOmniClient();
const result = await client.textToVideo.run({
    model: "gemini-omni-text-to-video",
    prompt: "生成一段 1080p 霓虹城市跟拍视频:可复用角色在雨中前行,并配合稳定旁白。",
});
require "runapi/gemini_omni"

client = RunApi::GeminiOmni::Client.new
result = client.text_to_video.run(
    model: "gemini-omni-text-to-video",
    prompt: "生成一段 1080p 霓虹城市跟拍视频:可复用角色在雨中前行,并配合稳定旁白。"
)
@runapi.ai/gemini-omni v1
工作流程

四步使用 gemini-omni-text-to-video

01

安装

安装该模型线对应的 SDK 或 agent 技能。

02

配置

把 model 字段设置为本页展示的完整模型 ID。

03

调用

带上提示词、输入文件和回调配置,发送类型化请求。

04

接收

从 RunAPI 读取任务响应、webhook 回调或缓存输出 URL。

差异

gemini-omni-text-to-video 与其它变体的差异

VS GEMINI-OMNI-AUDIO

支持提示词、图片、音频、角色和源片段参考的多模态视频

基于预设声音同步创建可复用声音资源

VS GEMINI-OMNI-CHARACTER

支持提示词、图片、音频、角色和源片段参考的多模态视频

基于单张参考图同步创建可复用角色资源

应用场景

最适合的场景

广告与社交内容

从文字简报生成产品发布短视频和广告片段,将制作周期从数周缩短到数小时。

在线教育

将课程脚本批量转换为动画讲解视频,无需摄像设备和拍摄团队。

创作者工作流

直接从提示词生成社交平台短视频内容。

常见问题

gemini-omni-text-to-video 常见问题

模型 ID 跨版本稳定吗?

RunAPI 保持模型 ID 稳定,并在不改变请求形态的前提下处理兼容版本刷新。

该变体的限流?

Key 级限流随使用层级伸缩。当前限制见定价页。

能切到其它变体吗?

可以——变体只是参数,改 model 字段即可。

支持流式吗?

模型支持流式时,RunAPI 端到端流式。

质量问题在哪里报?

在公共 GitHub 仓库提 issue 或邮件联系 support。

立即开始

立即体验 Gemini Omni。