Usa ElevenLabs in OpenClaw.
ElevenLabs fornisce sei endpoint audio tramite RunAPI — sintesi vocale turbo-v2.5 con latenza inferiore al secondo, multilingual-v2 per 29 lingue, dialogue-v3 per conversazioni multi-speaker, effetti sonori, trascrizione speech-to-text e isolamento vocale. Gli agenti OpenClaw li chiamano tutti con la stessa API key RunAPI usata per la chat.
Usa RunAPI per generare audio vocale con la sintesi vocale ElevenLabs.
Requisiti:
- Leggi la API key da RUNAPI_API_KEY.
- Chiama POST https://runapi.ai/api/v1/elevenlabs/text_to_speech
- Imposta model su "text-to-speech-turbo-v2.5".
- Imposta text sul contenuto che vuoi pronunciato.
- Facoltativamente imposta voice su un voice ID specifico di ElevenLabs.
- Facoltativamente imposta speed tra 0.7 e 1.2.
- Il task è asincrono. Esegui il polling del task_id restituito finché lo status non è "completed".
- Al termine, leggi l'URL audio dall'output della risposta.
curl -X POST https://runapi.ai/api/v1/elevenlabs/text_to_speech \
-H "Authorization: Bearer $RUNAPI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "text-to-speech-turbo-v2.5",
"text": "Welcome to RunAPI. This audio was generated by ElevenLabs turbo v2.5.",
"speed": 1.0,
"stability": 0.5,
"similarity_boost": 0.75
}'
{
"task_id": "tsk_abc123",
"status": "pending",
"model": "text-to-speech-turbo-v2.5"
}
Usa ElevenLabs in OpenClaw in tre passaggi
Configura RunAPI
Imposta RUNAPI_API_KEY nel tuo ambiente. Se hai già configurato RunAPI per la chat in OpenClaw, la stessa key funziona per tutti gli endpoint ElevenLabs — sintesi vocale, STT, dialogue, effetti sonori e isolamento vocale.
export RUNAPI_API_KEY=runapi_xxx
Chiama text_to_speech
Invia una POST all'endpoint text_to_speech con model impostato su text-to-speech-turbo-v2.5, il testo da pronunciare e i parametri facoltativi voice, speed e stability. Per output multilingue, usa text-to-speech-multilingual-v2 con un voice e language_code.
POST /api/v1/elevenlabs/text_to_speech
Ottieni il risultato
L'endpoint restituisce immediatamente un task_id. Esegui il polling dell'endpoint di stato del task finché lo stato non cambia in completed, poi leggi l'URL audio di output dalla risposta.
GET /api/v1/elevenlabs/text_to_speech/tsk_abc123
Parametri API ElevenLabs text_to_speech
| Parametro | Tipo | Descrizione |
|---|---|---|
model |
string |
Obbligatorio. text-to-speech-turbo-v2.5 (bassa latenza) o text-to-speech-multilingual-v2 (29 lingue). |
text |
string |
Obbligatorio. Il testo da convertire in audio. Max 5000 caratteri. |
voice |
string |
Voice ID ElevenLabs. Obbligatorio per multilingual-v2. turbo-v2.5 usa una voce predefinita se omesso. |
speed |
float |
Facoltativo. Moltiplicatore di velocità di riproduzione. Range da 0.7 a 1.2. |
stability |
float |
Facoltativo. Consistenza vocale. Range da 0.0 a 1.0. Valori più bassi aggiungono espressività. |
similarity_boost |
float |
Facoltativo. Applicazione della somiglianza vocale. Range da 0.0 a 1.0. |
style |
float |
Facoltativo. Esagerazione dello stile. Range da 0.0 a 1.0. |
language_code |
string |
Facoltativo. Lingua target per multilingual-v2, ad es. en, es, ja. |
callback_url |
string |
Facoltativo. URL webhook che riceve una POST quando il task è completato. |
Cos'è ElevenLabs su OpenClaw?
ElevenLabs è l'API testo-a-parlato di riferimento per output vocale dal suono naturale. Tramite RunAPI, gli agenti OpenClaw ottengono accesso a turbo-v2.5 (latenza sub-secondo per l'inglese), multilingual-v2 (29 lingue), dialogue-v3 (conversazioni multi-speaker), generazione di effetti sonori, trascrizione parlato-a-testo e isolamento vocale. Puoi regolare l'output vocale con cursori di stabilità e boost di similarità per controllare quanto espressiva o coerente suona la voce.
Casi d'uso di ElevenLabs
Narrazione di audiolibri e podcast
Convertire testo di formato lungo in audio parlato usando voci di personaggi coerenti. Regolare la stabilità per la coerenza del narratore e il boost di similarità per mantenere la voce vicina al profilo originale per ore di contenuto.
Doppiaggio video in più lingue
Doppiare contenuto video in 29 lingue usando multilingual-v2 con lo stesso profilo vocale, producendo versioni localizzate che mantengono le caratteristiche vocali del parlante originale.
Effetti sonori per la produzione video e di giochi
Generare suoni Foley personalizzati, audio ambientale e cue sonori da descrizioni testuali tramite l'endpoint text_to_sound, sostituendo le ricerche nelle librerie audio di stock con la generazione su richiesta.
Domande su ElevenLabs + OpenClaw
RunAPI espone sei endpoint ElevenLabs: text_to_speech (turbo-v2.5 e multilingual-v2), text_to_dialogue (dialogue-v3 per multi-speaker), text_to_sound (effetti sonori), speech_to_text (trascrizione)e isolate_audio (estrazione vocale). Tutti condividono la stessa RUNAPI_API_KEY.
turbo-v2.5 è ottimizzato per bassa latenza e output principalmente in inglese — applica una voce predefinita quando non ne viene specificata una. multilingual-v2 supporta 29 lingue e richiede un voice ID esplicito e un language_code facoltativo. Turbo costa circa la metà per carattere.
Asincrono. L'endpoint di creazione restituisce immediatamente un task_id. Esegui il polling dell'endpoint di stato del task o fornisci un callback_url per ricevere un webhook quando il file audio è pronto per il download.
Gli endpoint text-to-speech e dialogue sono fatturati per carattere di testo di input. speech-to-text è fatturato per minuto di audio. L'isolamento audio è fatturato per task. Controlla la pagina dei prezzi di RunAPI per le tariffe aggiornate.
Sì. Chiama l'endpoint text_to_dialogue con model text-to-dialogue-v3. Passa un array dialogue in cui ogni elemento ha un text e un voice ID. Il testo totale di tutti i parlanti deve essere inferiore a 5000 caratteri.
Configurazione generale di OpenClaw
Non ancora configurato? Inizia con la guida di configurazione RunAPI per OpenClaw.
Guida di configurazione di OpenClaw →Catalogo modelli ElevenLabs
Vedi tutte le varianti, i prezzi e la documentazione API di ElevenLabs.
ElevenLabs su RunAPI →Prova ElevenLabs in OpenClaw oggi.
Ottieni una API key RunAPI gratuita, incolla il prompt in OpenClaw e genera audio vocale con ElevenLabs — sei endpoint, una sola API key, fatturazione per carattere.