---
title: &quot;Usa ElevenLabs in Hermes Agent tramite RunAPI — Guida API TTS e Audio&quot;
url: &quot;https://runapi.ai/it/hermes-elevenlabs.md&quot;
canonical: &quot;https://runapi.ai/it/hermes-elevenlabs&quot;
locale: &quot;it&quot;
model: &quot;elevenlabs&quot;
---

# Usa ElevenLabs in Hermes Agent.

ElevenLabs fornisce sei endpoint audio tramite RunAPI — sintesi vocale turbo-v2.5 con latenza inferiore al secondo, multilingual-v2 per 29 lingue, dialogue-v3 per conversazioni multi-speaker, effetti sonori, trascrizione speech-to-text e isolamento vocale. Hermes Agent li chiama tramite il provider custom:runapi con una sola API key.

## API example

```bash
curl -X POST https://runapi.ai/api/v1/elevenlabs/text_to_speech \
  -H &quot;Authorization: Bearer $RUNAPI_API_KEY&quot; \
  -H &quot;Content-Type: application/json&quot; \
  -d &#39;{
    &quot;model&quot;: &quot;text-to-speech-turbo-v2.5&quot;,
    &quot;text&quot;: &quot;Welcome to RunAPI. This audio was generated by ElevenLabs turbo v2.5.&quot;,
    &quot;speed&quot;: 1.0,
    &quot;stability&quot;: 0.5,
    &quot;similarity_boost&quot;: 0.75
  }&#39;

```

### Response

```json
{
  &quot;task_id&quot;: &quot;tsk_abc123&quot;,
  &quot;status&quot;: &quot;pending&quot;,
  &quot;model&quot;: &quot;text-to-speech-turbo-v2.5&quot;
}

```

## How it works

1. **Configura RunAPI** — Imposta RUNAPI_API_KEY nell&#39;ambiente in cui Hermes Agent viene eseguito. Se hai già aggiunto RunAPI come provider custom:runapi, la stessa key e base_url gestiscono tutti gli endpoint ElevenLabs — sintesi vocale, STT, dialogue, effetti sonori e isolamento vocale.
2. **Chiama text_to_speech** — Invia una POST all&#39;endpoint text_to_speech con model impostato su text-to-speech-turbo-v2.5, il testo da pronunciare e i parametri facoltativi voice, speed e stability. Hermes Agent instrada la richiesta tramite il provider custom:runapi. Per output multilingue, usa text-to-speech-multilingual-v2 con un voice e language_code.
3. **Ottieni il risultato** — L&#39;endpoint restituisce immediatamente un task_id. Esegui il polling dell&#39;endpoint di stato del task finché lo stato non cambia in completed, poi leggi l&#39;URL audio di output dalla risposta.

## Parameters

| Parameter | Type | Description |
|-----------|------|-------------|
| `model` | `string` | Obbligatorio. text-to-speech-turbo-v2.5 (bassa latenza) o text-to-speech-multilingual-v2 (29 lingue). |
| `text` | `string` | Obbligatorio. Il testo da convertire in audio. Max 5000 caratteri. |
| `voice` | `string` | Voice ID ElevenLabs. Obbligatorio per multilingual-v2. turbo-v2.5 usa una voce predefinita se omesso. |
| `speed` | `float` | Facoltativo. Moltiplicatore di velocità di riproduzione. Range da 0.7 a 1.2. |
| `stability` | `float` | Facoltativo. Consistenza vocale. Range da 0.0 a 1.0. Valori più bassi aggiungono espressività. |
| `similarity_boost` | `float` | Facoltativo. Applicazione della somiglianza vocale. Range da 0.0 a 1.0. |
| `style` | `float` | Facoltativo. Esagerazione dello stile. Range da 0.0 a 1.0. |
| `language_code` | `string` | Facoltativo. Lingua target per multilingual-v2, ad es. en, es, ja. |
| `callback_url` | `string` | Facoltativo. URL webhook che riceve una POST quando il task è completato. |

## FAQ

### Posso usare ElevenLabs in Hermes Agent?

Sì. Configura RunAPI come provider custom:runapi in Hermes Agent con base_url https://runapi.ai/v1 e key_env RUNAPI_API_KEY, poi chiama qualsiasi endpoint ElevenLabs — text_to_speech, speech_to_text, text_to_dialogue, text_to_sound o isolate_audio.

### Qual è la differenza tra turbo-v2.5 e multilingual-v2?

turbo-v2.5 è ottimizzato per bassa latenza e output principalmente in inglese — applica una voce predefinita quando non ne viene specificata una. multilingual-v2 supporta 29 lingue e richiede un voice ID esplicito e un language_code facoltativo. Turbo costa circa la metà per carattere.

### Come viene fatturato ElevenLabs su RunAPI?

Gli endpoint text-to-speech e dialogue sono fatturati per carattere di testo di input. speech-to-text è fatturato per minuto di audio. L&#39;isolamento audio è fatturato per task. Controlla la pagina dei prezzi di RunAPI per le tariffe aggiornate.

### Posso trascrivere audio con ElevenLabs in Hermes Agent?

Sì. Chiama l&#39;endpoint speech_to_text su /api/v1/elevenlabs/speech_to_text con un source_audio_url. L&#39;endpoint supporta la diarizzazione facoltativa degli speaker tramite il parametro diarize e il tagging degli eventi audio tramite tag_audio_events. I risultati vengono restituiti in modo asincrono.

### Come funziona l&#39;isolamento vocale tramite RunAPI?

Chiama l&#39;endpoint isolate_audio su /api/v1/elevenlabs/isolate_audio con un source_audio_url che punta al tuo file audio misto. L&#39;endpoint estrae le voci dal rumore di fondo e restituisce un URL audio pulito. Il task è asincrono — esegui il polling o usa un callback_url.


## Links

- [Guida di configurazione di Hermes Agent →](https://runapi.ai/it/hermes-agent)
- [ElevenLabs su RunAPI →](https://runapi.ai/it/models/elevenlabs)
- [Model catalog](https://runapi.ai/it/models)
- [API docs](https://runapi.ai/it/docs)