VARIANTE · Google / Gemini Omni

gemini-omni-audio API

Google / Gemini Omni

Nutze gemini-omni-audio aus der Gemini Omni-Familie über RunAPI. Preis pro Aufruf, kein Abo – fehlgeschlagene Generierungen werden nie berechnet.

Betriebsbereit · audio_music · Kommerzielle Nutzung unterstützt

runapi.ai

curl -X POST https://runapi.ai/api/v1/gemini_omni/create_audio \
  -H "Authorization: Bearer $RUNAPI_KEY" \
  -H "Content-Type: application/json" \
  -d '{
  "audio_id": "achernar",
  "name": "Acher Narrator",
  "voice_description": "Erstelle einen 1080p-Neon-City-Tracking-Shot mit einem wiederverwendbaren Charakter, der im Regen geht, während ein ruhiger Erzähler spricht.",
  "example_dialogue": "Hello, I am achernar"
}'

import { GeminiOmniClient } from "@runapi.ai/gemini-omni";

const client = new GeminiOmniClient();
const result = await client.createAudio.run({
    audio_id: "achernar",
    name: "Acher Narrator",
    voice_description: "Erstelle einen 1080p-Neon-City-Tracking-Shot mit einem wiederverwendbaren Charakter, der im Regen geht, während ein ruhiger Erzähler spricht.",
    example_dialogue: "Hello, I am achernar",
});

<?php

require __DIR__ . "/vendor/autoload.php";

use RunApi\GeminiOmni\GeminiOmniClient;

$client = new GeminiOmniClient();
$result = $client->createAudio->run([
        'audio_id' => 'achernar',
        'name' => 'Acher Narrator',
        'voice_description' => 'Erstelle einen 1080p-Neon-City-Tracking-Shot mit einem wiederverwendbaren Charakter, der im Regen geht, während ein ruhiger Erzähler spricht.',
        'example_dialogue' => 'Hello, I am achernar',
]);

require "runapi/gemini_omni"

client = RunApi::GeminiOmni::Client.new
result = client.create_audio.run(
    audio_id: "achernar",
    name: "Acher Narrator",
    voice_description: "Erstelle einen 1080p-Neon-City-Tracking-Shot mit einem wiederverwendbaren Charakter, der im Regen geht, während ein ruhiger Erzähler spricht.",
    example_dialogue: "Hello, I am achernar"
)

npx skills add runapi-ai/gemini-omni -g

# Claude Code
claude mcp add runapi -s user -- npx -y @runapi.ai/mcp

# Codex
codex plugin install runapi-mcp@agents

# Cursor / Windsurf / VS Code
npx @runapi.ai/mcp init cursor

@runapi.ai/gemini-omni v1

Variante wechseln

gemini-omni-character gemini-omni-flash-preview gemini-omni-text-to-video

ÜBERBLICK

Gemini Omni gemini-omni-audio ist über dieselbe RunAPI-Authentifizierung, denselben Model-Skill-Workflow und nutzungsbasierte Preise verfügbar.

Einheitlicher API Key
Model-Skill-Setup
Modell-ID-Referenz
Fehlgeschlagene Generierungen werden nicht berechnet

PREISE

Fehlgeschlagene Generierungen werden nicht berechnet

Create audio

Free / track

DATENBLATT

Modell-ID	gemini-omni-audio
Anbieter	Google
Modalität	audio_music
Task-Typ	synchronous
Abrechnung	call
Endpoint	/api/v1/gemini_omni/create_audio
Kommerziell	Ja
Katalogstatus	Betriebsbereit

MODELS

Modell-Skill — gemini-omni-audio

Installiere den Skill einmal und verwende dann die Varianten-ID von dieser Seite beim Entwickeln.

# Install the model skill for app development workflows
npx skills add runapi-ai/gemini-omni -g

Installs docs, schemas, pricing context, and setup notes into your developer workspace.

Or use this setup request in your coding tool:

Install the Gemini Omni skill for this app:

1. Add runapi-ai/gemini-omni with the skills installer.
2. Load SKILL.md in this workspace.
3. Use its docs, schemas, pricing notes, and setup steps when adding model features.
4. Confirm the install path when done.

SO FUNKTIONIERT ES

gemini-omni-audio verwenden

Modell wählen

Wähle Modell und Variante passend zu deinem App-Workflow.

Modell-ID übergeben

Nutze diese Varianten-ID im Request Body.

Task ausführen

Sende den Request und speichere die zurückgegebene Task ID.

Ausgabe abrufen

Frage ab oder empfange den Callback, wenn der Task fertig ist.

UNTERSCHIEDE

Vergleich von gemini-omni-audio

VS GEMINI-OMNI-CHARACTER

Synchrone Erstellung wiederverwendbarer Sprachressourcen aus vordefinierten Stimmen

Synchrone Erstellung wiederverwendbarer Charakter-Ressourcen aus einem Referenzbild

VS GEMINI-OMNI-FLASH-PREVIEW

Synchrone Erstellung wiederverwendbarer Sprachressourcen aus vordefinierten Stimmen

Schnelle, dialogorientierte Videogenerierung für kreative Iteration in natürlicher Sprache

VS GEMINI-OMNI-TEXT-TO-VIDEO

Synchrone Erstellung wiederverwendbarer Sprachressourcen aus vordefinierten Stimmen

Multimodales Video aus Prompts mit Bild-, Audio-, Charakter- und Quell-Clip-Referenzen

ANWENDUNGSFÄLLE

Einsatzbereiche dieser Variante

Musikgenerierung

Erstelle Tracks und Audio-Assets.

Voice-Workflows

Baue Speech- und Audio-Pipelines.

Tool-gestützte Erstellung

Stelle Audio-Tools im Entwicklungsworkflow bereit.

FAQ

Häufige Fragen zu gemini-omni-audio

Wie wähle ich gemini-omni-audio aus?

Übergib die im Quickstart angezeigte Modell-ID.

Sind die Preise nutzungsbasiert?

Ja. Preise werden pro Aufruf oder Einheit gemessen.

Weitere Gemini Omni-Varianten

gemini-omni-character Günstigste

character

$0.0000 / call

gemini-omni-flash-preview Schnell

flash-preview

$0.600 / call

gemini-omni-text-to-video

text-to-video

$3.60 / call

Starte heute mit Gemini Omni.

Kostenloses Konto erstellen Quickstart lesen →

gemini-omni-audio API

PREISE

DATENBLATT

Modell-Skill — gemini-omni-audio

gemini-omni-audio verwenden

Modell wählen

Modell-ID übergeben

Task ausführen

Ausgabe abrufen

Vergleich von gemini-omni-audio

Synchrone Erstellung wiederverwendbarer Sprachressourcen aus vordefinierten Stimmen

Synchrone Erstellung wiederverwendbarer Sprachressourcen aus vordefinierten Stimmen

Synchrone Erstellung wiederverwendbarer Sprachressourcen aus vordefinierten Stimmen

Einsatzbereiche dieser Variante

Musikgenerierung

Voice-Workflows

Tool-gestützte Erstellung

Häufige Fragen zu gemini-omni-audio

Weitere Gemini Omni-Varianten

Verwandte Modelle

Starte heute mit Gemini Omni.