---
title: &quot;Usa ElevenLabs en Hermes Agent con RunAPI — Guía de API TTS y Audio&quot;
url: &quot;https://runapi.ai/pt-BR/hermes-elevenlabs.md&quot;
canonical: &quot;https://runapi.ai/pt-BR/hermes-elevenlabs&quot;
locale: &quot;pt-BR&quot;
model: &quot;elevenlabs&quot;
---

# Usa ElevenLabs en Hermes Agent.

ElevenLabs proporciona seis endpoints de audio a través de RunAPI — TTS turbo-v2.5 con latencia inferior al segundo, multilingual-v2 que cubre 29 idiomas, dialogue-v3 para conversaciones multilocutor, efectos de sonido, transcripción de voz a texto y aislamiento vocal. Hermes Agent los llama a través del proveedor custom:runapi con una sola clave API.

## API example

```bash
curl -X POST https://runapi.ai/api/v1/elevenlabs/text_to_speech \
  -H &quot;Authorization: Bearer $RUNAPI_API_KEY&quot; \
  -H &quot;Content-Type: application/json&quot; \
  -d &#39;{
    &quot;model&quot;: &quot;text-to-speech-turbo-v2.5&quot;,
    &quot;text&quot;: &quot;Welcome to RunAPI. This audio was generated by ElevenLabs turbo v2.5.&quot;,
    &quot;speed&quot;: 1.0,
    &quot;stability&quot;: 0.5,
    &quot;similarity_boost&quot;: 0.75
  }&#39;

```

### Response

```json
{
  &quot;task_id&quot;: &quot;tsk_abc123&quot;,
  &quot;status&quot;: &quot;pending&quot;,
  &quot;model&quot;: &quot;text-to-speech-turbo-v2.5&quot;
}

```

## How it works

1. **Configura RunAPI** — Establece RUNAPI_API_KEY en el entorno donde se ejecuta Hermes Agent. Si ya añadiste RunAPI como proveedor custom:runapi, la misma clave y base_url gestionan todos los endpoints de ElevenLabs — TTS, STT, diálogo, efectos de sonido y aislamiento de audio.
2. **Llama a text_to_speech** — Envía un POST al endpoint text_to_speech con model establecido en text-to-speech-turbo-v2.5, el texto que quieres hablar y parámetros opcionales de voice, speed y stability. Hermes Agent enruta la solicitud a través del proveedor custom:runapi. Para salida multilingüe, usa text-to-speech-multilingual-v2 con un voice y language_code.
3. **Consulta el resultado** — El endpoint devuelve un task_id de inmediato. Consulta el endpoint de estado de la tarea hasta que el estado sea completado y luego lee la URL de audio de salida de la respuesta.

## Parameters

| Parameter | Type | Description |
|-----------|------|-------------|
| `model` | `string` | Obligatorio. text-to-speech-turbo-v2.5 (baja latencia) o text-to-speech-multilingual-v2 (29 idiomas). |
| `text` | `string` | Obligatorio. El texto a convertir en voz. Máx. 5000 caracteres. |
| `voice` | `string` | ID de voz de ElevenLabs. Obligatorio para multilingual-v2. Turbo-v2.5 usa una voz predeterminada si se omite. |
| `speed` | `float` | Opcional. Multiplicador de velocidad de reproducción. Rango de 0.7 a 1.2. |
| `stability` | `float` | Opcional. Consistencia de voz. Rango de 0.0 a 1.0. Valores más bajos añaden expresividad. |
| `similarity_boost` | `float` | Opcional. Refuerzo de similitud de voz. Rango de 0.0 a 1.0. |
| `style` | `float` | Opcional. Exageración de estilo. Rango de 0.0 a 1.0. |
| `language_code` | `string` | Opcional. Idioma de destino para multilingual-v2, p. ej. en, es, ja. |
| `callback_url` | `string` | Opcional. URL de webhook que recibe un POST cuando la tarea se completa. |

## FAQ

### ¿Puedo usar ElevenLabs en Hermes Agent?

Sí. Configura RunAPI como proveedor custom:runapi en Hermes Agent con base_url https://runapi.ai/v1 y key_env RUNAPI_API_KEY, luego llama a cualquier endpoint de ElevenLabs — text_to_speech, speech_to_text, text_to_dialogue, text_to_sound o isolate_audio.

### ¿Cuál es la diferencia entre turbo-v2.5 y multilingual-v2?

Turbo-v2.5 está optimizado para baja latencia y salida principalmente en inglés — aplica una voz predeterminada cuando no se especifica ninguna. Multilingual-v2 admite 29 idiomas y requiere un ID de voz explícito y un language_code opcional. Turbo cuesta aproximadamente la mitad por carácter.

### ¿Cómo se factura ElevenLabs en RunAPI?

Los endpoints de text-to-speech y diálogo se facturan por carácter del texto de entrada. Speech-to-text se factura por minuto de audio. El aislamiento de audio se factura por tarea. Consulta la página de precios de RunAPI para las tarifas actuales.

### ¿Puedo transcribir audio con ElevenLabs en Hermes Agent?

Sí. Llama al endpoint speech_to_text en /api/v1/elevenlabs/speech_to_text con un source_audio_url. El endpoint admite diarización de hablantes opcional mediante el parámetro diarize y etiquetado de eventos de audio mediante tag_audio_events. Los resultados se devuelven de forma asíncrona.

### ¿Cómo funciona el aislamiento de audio a través de RunAPI?

Llama al endpoint isolate_audio en /api/v1/elevenlabs/isolate_audio con un source_audio_url apuntando a tu archivo de audio mezclado. El endpoint extrae las voces del ruido de fondo y devuelve una URL de audio limpio. La tarea es asíncrona — consulta o usa un callback_url.


## Links

- [Guía de configuración de Hermes Agent →](https://runapi.ai/pt-BR/hermes-agent)
- [ElevenLabs en RunAPI →](https://runapi.ai/pt-BR/models/elevenlabs)
- [Model catalog](https://runapi.ai/pt-BR/models)
- [API docs](https://runapi.ai/pt-BR/docs)