VARIANT · ElevenLabs / ElevenLabs

ElevenLabs speech-to-text API

Variante modello disponibile tramite l'API AI unificata di RunAPI.

Operativo · audio_music · Uso commerciale consentito
# Install the model skill for app development workflows
npx skills add runapi-ai/elevenlabs -g
Installs docs, schemas, pricing context, and setup notes into your developer workspace.
Or use this setup request in your coding tool:
Install the ElevenLabs skill for this app:

1. Add runapi-ai/elevenlabs with the skills installer.
2. Load SKILL.md in this workspace.
3. Use its docs, schemas, pricing notes, and setup steps when adding model features.
4. Confirm the install path when done.
Cambia variante
OVERVIEW

speech-to-text punta al giusto equilibrio tra qualità e costo all’interno della famiglia ElevenLabs.

  • Prezzi pay-per-call in USD
  • Le generazioni fallite non vengono addebitate
  • Streaming quando supportato dal modello
  • Setup del model skill
PRICING

Prezzi

Le generazioni fallite non vengono addebitate
Speech to text
$0.04 / minute
SCHEDA TECNICA

Dettagli tecnici

ID modello speech-to-text
Provider ElevenLabs
Modalità audio_music
Tipo di task asynchronous
Unità di fatturazione minute
API endpoint /api/v1/elevenlabs/speech_to_text
Licenza commerciale Sì — inclusa via API
Stato Operativo
SKILLS

Quickstart — speech-to-text

Stessa struttura · variante fissata nel model

# Install the model skill for app development workflows
npx skills add runapi-ai/elevenlabs -g
Installs docs, schemas, pricing context, and setup notes into your developer workspace.
Or use this setup request in your coding tool:
Install the ElevenLabs skill for this app:

1. Add runapi-ai/elevenlabs with the skills installer.
2. Load SKILL.md in this workspace.
3. Use its docs, schemas, pricing notes, and setup steps when adding model features.
4. Confirm the install path when done.
COME FUNZIONA

Usa speech-to-text in quattro passaggi

01

Installa

Installa il model skill per questa linea di modello.

02

Configura

Imposta il campo model con l'ID completo del model mostrato in questa pagina.

03

Invia

Invia una richiesta tipizzata con prompt, input e impostazioni di callback.

04

Ricevi

Leggi la risposta del task, il callback webhook o l'URL dell'output in cache da RunAPI.

DIFFERENCES

Cosa cambia in speech-to-text

VS AUDIO-ISOLATION

Transcription across 29+ languages with speaker diarization

Vocal extraction from mixed audio sources

VS SOUND-EFFECT-V2

Transcription across 29+ languages with speaker diarization

Text-to-sound effects for games, video, and podcasts

VS TEXT-TO-DIALOGUE-V3

Transcription across 29+ languages with speaker diarization

Multi-speaker dialogue generation with natural turn-taking

CASI D'USO

Ideale per

Colonna sonora per podcast e video

Genera musica di sottofondo royalty-free in linea con il mood dell'episodio, senza costi di licenza.

Audio per game

Genera paesaggi sonori ambientali adattivi ed effetti per livelli generati proceduralmente.

Voiceover e SFX per adv

Genera voiceover e effetti sonori personalizzati per spot dei clienti senza uno studio di registrazione.

FAQ

Domande frequenti su speech-to-text

L'ID del modello resta stabile tra le versioni?

RunAPI mantiene stabile l’ID del modello e gestisce gli aggiornamenti di versione compatibili senza modificare la forma della richiesta.

Qual è il rate limit di questa variante?

I limiti per chiave scalano in base al tier di utilizzo. Consulta la pagina prezzi per i limiti attuali.

Posso cambiare variante in seguito?

Sì — la variante è un flag. Puoi cambiarla modificando il parametro model.

Fa streaming?

Dove lo streaming è disponibile, RunAPI esegue lo streaming end-to-end.

Dove posso segnalare problemi di qualità?

Apri un issue nel repository GitHub pubblico oppure scrivi all’assistenza.

INIZIA ORA

Inizia a costruire con ElevenLabs.