---
title: &quot;ElevenLabs in Hermes Agent via RunAPI verwenden — TTS &amp; Audio-API-Anleitung&quot;
url: &quot;https://runapi.ai/de/hermes-elevenlabs.md&quot;
canonical: &quot;https://runapi.ai/de/hermes-elevenlabs&quot;
locale: &quot;de&quot;
model: &quot;elevenlabs&quot;
---

# ElevenLabs in Hermes Agent verwenden.

ElevenLabs bietet sechs Audio-Endpunkte über RunAPI — turbo-v2.5 TTS mit unter einer Sekunde Latenz, multilingual-v2 für 29 Sprachen, dialogue-v3 für Multi-Speaker-Konversationen, Soundeffekte, Sprache-zu-Text-Transkription und Vokaltrennung. Hermes Agent ruft sie über den custom:runapi-Provider mit einem API-Key auf.

## API example

```bash
curl -X POST https://runapi.ai/api/v1/elevenlabs/text_to_speech \
  -H &quot;Authorization: Bearer $RUNAPI_API_KEY&quot; \
  -H &quot;Content-Type: application/json&quot; \
  -d &#39;{
    &quot;model&quot;: &quot;text-to-speech-turbo-v2.5&quot;,
    &quot;text&quot;: &quot;Welcome to RunAPI. This audio was generated by ElevenLabs turbo v2.5.&quot;,
    &quot;speed&quot;: 1.0,
    &quot;stability&quot;: 0.5,
    &quot;similarity_boost&quot;: 0.75
  }&#39;

```

### Response

```json
{
  &quot;task_id&quot;: &quot;tsk_abc123&quot;,
  &quot;status&quot;: &quot;pending&quot;,
  &quot;model&quot;: &quot;text-to-speech-turbo-v2.5&quot;
}

```

## How it works

1. **RunAPI konfigurieren** — RUNAPI_API_KEY in der Umgebung setzen, in der Hermes Agent läuft. Wenn RunAPI bereits als custom:runapi-Provider hinzugefügt wurde, übernehmen derselbe Key und dieselbe base_url alle ElevenLabs-Endpunkte — TTS, STT, Dialogue, Soundeffekte und Audio-Isolation.
2. **text_to_speech aufrufen** — Einen POST an den text_to_speech-Endpunkt mit model text-to-speech-turbo-v2.5, dem zu sprechenden Text und optionalen voice-, speed- und stability-Parametern senden. Hermes Agent leitet den Request über den custom:runapi-Provider weiter. Für mehrsprachigen Output text-to-speech-multilingual-v2 mit einer voice und language_code verwenden.
3. **Ergebnis abrufen** — Der Endpunkt gibt sofort eine task_id zurück. Den Task-Status-Endpunkt abfragen, bis der Status completed ist, dann die Audio-URL aus der Antwort auslesen.

## Parameters

| Parameter | Type | Description |
|-----------|------|-------------|
| `model` | `string` | Erforderlich. text-to-speech-turbo-v2.5 (niedrige Latenz) oder text-to-speech-multilingual-v2 (29 Sprachen). |
| `text` | `string` | Erforderlich. Der zu sprechende Text. Maximal 5000 Zeichen. |
| `voice` | `string` | ElevenLabs-Stimm-ID. Erforderlich für multilingual-v2. Turbo-v2.5 verwendet eine Standardstimme, wenn weggelassen. |
| `speed` | `float` | Optional. Wiedergabegeschwindigkeitsmultiplikator. Bereich 0,7 bis 1,2. |
| `stability` | `float` | Optional. Stimmkonsistenz. Bereich 0,0 bis 1,0. Niedrigere Werte fügen Ausdrucksstärke hinzu. |
| `similarity_boost` | `float` | Optional. Stimmähnlichkeitserzwingung. Bereich 0,0 bis 1,0. |
| `style` | `float` | Optional. Stilübertreibung. Bereich 0,0 bis 1,0. |
| `language_code` | `string` | Optional. Zielsprache für multilingual-v2, z. B. en, es, ja. |
| `callback_url` | `string` | Optional. Webhook-URL, die einen POST erhält, wenn der Task abgeschlossen ist. |

## FAQ

### Kann ich ElevenLabs in Hermes Agent verwenden?

Ja. RunAPI als custom:runapi-Provider in Hermes Agent mit base_url https://runapi.ai/v1 und key_env RUNAPI_API_KEY konfigurieren, dann beliebige ElevenLabs-Endpunkte aufrufen — text_to_speech, speech_to_text, text_to_dialogue, text_to_sound oder isolate_audio.

### Was ist der Unterschied zwischen turbo-v2.5 und multilingual-v2?

Turbo-v2.5 ist für niedrige Latenz und englischsprachigen Output optimiert — es wird eine Standardstimme angewendet, wenn keine angegeben ist. Multilingual-v2 unterstützt 29 Sprachen und benötigt eine explizite voice-ID und optionalen language_code. Turbo kostet etwa halb so viel pro Zeichen.

### Wie wird ElevenLabs auf RunAPI abgerechnet?

Text-to-Speech- und Dialogue-Endpunkte werden pro Zeichen des Eingabetexts abgerechnet. Speech-to-Text wird pro Audiominute abgerechnet. Audio-Isolation wird pro Task abgerechnet. Aktuelle Preise auf der RunAPI-Preisseite.

### Kann ich Audio mit ElevenLabs in Hermes Agent transkribieren?

Ja. Den speech_to_text-Endpunkt unter /api/v1/elevenlabs/speech_to_text mit einer source_audio_url aufrufen. Der Endpunkt unterstützt optionale Sprecher-Diarisierung über den diarize-Parameter und Audio-Event-Tagging über tag_audio_events. Ergebnisse werden asynchron zurückgegeben.

### Wie funktioniert die Audio-Isolation über RunAPI?

Den isolate_audio-Endpunkt unter /api/v1/elevenlabs/isolate_audio mit einer source_audio_url aufrufen, die auf die gemischte Audiodatei zeigt. Der Endpunkt trennt Gesang von Hintergrundgeräuschen und gibt eine bereinigte Audio-URL zurück. Der Task ist asynchron — abfragen oder callback_url verwenden.


## Links

- [Hermes Agent Einrichtungsanleitung →](https://runapi.ai/de/hermes-agent)
- [ElevenLabs on RunAPI →](https://runapi.ai/de/models/elevenlabs)
- [Model catalog](https://runapi.ai/de/models)
- [API docs](https://runapi.ai/de/docs)