---
title: &quot;Używaj ElevenLabs w Hermes Agent przez RunAPI — Przewodnik po TTS i Audio API&quot;
url: &quot;https://runapi.ai/pl/hermes-elevenlabs.md&quot;
canonical: &quot;https://runapi.ai/pl/hermes-elevenlabs&quot;
locale: &quot;pl&quot;
model: &quot;elevenlabs&quot;
---

# Używaj ElevenLabs w Hermes Agent.

ElevenLabs zapewnia sześć endpointów audio przez RunAPI — TTS turbo-v2.5 z opóźnieniem poniżej sekundy, multilingual-v2 obsługujący 29 języków, dialogue-v3 dla rozmów wieloosobowych, efekty džwiękowe, transkrypcję mowy na tekst i izolację wokalu. Hermes Agent wywołuje je przez dostawcę custom:runapi z jednym kluczem API.

## API example

```bash
curl -X POST https://runapi.ai/api/v1/elevenlabs/text_to_speech \
  -H &quot;Authorization: Bearer $RUNAPI_API_KEY&quot; \
  -H &quot;Content-Type: application/json&quot; \
  -d &#39;{
    &quot;model&quot;: &quot;text-to-speech-turbo-v2.5&quot;,
    &quot;text&quot;: &quot;Welcome to RunAPI. This audio was generated by ElevenLabs turbo v2.5.&quot;,
    &quot;speed&quot;: 1.0,
    &quot;stability&quot;: 0.5,
    &quot;similarity_boost&quot;: 0.75
  }&#39;

```

### Response

```json
{
  &quot;task_id&quot;: &quot;tsk_abc123&quot;,
  &quot;status&quot;: &quot;pending&quot;,
  &quot;model&quot;: &quot;text-to-speech-turbo-v2.5&quot;
}

```

## How it works

1. **Skonfiguruj RunAPI** — Ustaw RUNAPI_API_KEY w środowisku, w którym działa Hermes Agent. Jeśli już dodałeś RunAPI jako dostawcę custom:runapi, ten sam klucz i base_url obsługują wszystkie endpointy ElevenLabs — TTS, STT, dialogue, efekty džwiękowe i izolacja džwięku.
2. **Wywołaj text_to_speech** — Wyślij POST do endpointu text_to_speech z modelem ustawionym na text-to-speech-turbo-v2.5, tekstem, który chcesz wypowiedzieć, oraz opcjonalnymi parametrami voice, speed i stability. Hermes Agent kieruje żądanie przez dostawcę custom:runapi. Dla wyjścia wielojęzycznego użyj text-to-speech-multilingual-v2 z głosem i language_code.
3. **Odpytuj o wynik** — Endpoint natychmiast zwraca task_id. Odpytuj endpoint statusu zadania, aż status osiągnie wartość completed, a następnie odczytaj wyjściowy adres URL džwięku z odpowiedzi.

## Parameters

| Parameter | Type | Description |
|-----------|------|-------------|
| `model` | `string` | Wymagane. text-to-speech-turbo-v2.5 (niskie opóźnienie) lub text-to-speech-multilingual-v2 (29 języków). |
| `text` | `string` | Wymagane. Tekst do przekonwertowania na mowę. Maksymalnie 5000 znaków. |
| `voice` | `string` | ID głosu ElevenLabs. Wymagane dla multilingual-v2. Turbo-v2.5 używa domyślnego głosu, jeśli pominięto. |
| `speed` | `float` | Opcjonalne. Mnożnik prędkości odtwarzania. Zakres 0.7 do 1.2. |
| `stability` | `float` | Opcjonalne. Spójność głosu. Zakres 0.0 do 1.0. Niższe wartości dodają ekspresji. |
| `similarity_boost` | `float` | Opcjonalne. Wymuszenie podobieństwa głosu. Zakres 0.0 do 1.0. |
| `style` | `float` | Opcjonalne. Wzmocnienie stylu. Zakres 0.0 do 1.0. |
| `language_code` | `string` | Opcjonalne. Docelowy język dla multilingual-v2, np. en, es, ja. |
| `callback_url` | `string` | Opcjonalne. Adres URL webhooka, który otrzymuje POST po zakończeniu zadania. |

## FAQ

### Czy mogę używać ElevenLabs w Hermes Agent?

Tak. Skonfiguruj RunAPI jako dostawcę custom:runapi w Hermes Agent z base_url https://runapi.ai/v1 i key_env RUNAPI_API_KEY, a następnie wywołaj dowolny endpoint ElevenLabs — text_to_speech, speech_to_text, text_to_dialogue, text_to_sound lub isolate_audio.

### Jaka jest różnica między turbo-v2.5 a multilingual-v2?

Turbo-v2.5 jest zoptymalizowany pod kątem niskich opóźnień i przede wszystkim angielskiego wyjścia — stosuje domyślny głos, gdy żaden nie jest podany. Multilingual-v2 obsługuje 29 języków i wymaga jawnego ID głosu oraz opcjonalnego language_code. Turbo kosztuje mniej więcej o połowę mniej za znak.

### Jak rozliczany jest ElevenLabs na RunAPI?

Endpointy text-to-speech i dialogue są rozliczane per znak tekstu wejściowego. Speech-to-text jest rozliczany per minuta džwięku. Izolacja džwięku jest rozliczana per zadanie. Sprawdź stronę cennika RunAPI, aby uzyskać aktualne stawki.

### Czy mogę transkrybować džwięk z ElevenLabs w Hermes Agent?

Tak. Wywołaj endpoint speech_to_text pod adresem /api/v1/elevenlabs/speech_to_text z source_audio_url. Endpoint obsługuje opcjonalną diaryzację mówców przez parametr diarize oraz tagowanie zdarzeń džwiękowych przez tag_audio_events. Wyniki są zwracane asynchronicznie.

### Jak działa izolacja džwięku przez RunAPI?

Wywołaj endpoint isolate_audio pod adresem /api/v1/elevenlabs/isolate_audio z source_audio_url wskazującym na Twój mieszany plik audio. Endpoint ekstrahuje wokal z szumu tła i zwraca oczyszczony adres URL džwięku. Zadanie jest asynchroniczne — odpytuj lub użyj callback_url.


## Links

- [Przewodnik konfiguracji Hermes Agent →](https://runapi.ai/pl/hermes-agent)
- [ElevenLabs na RunAPI →](https://runapi.ai/pl/models/elevenlabs)
- [Model catalog](https://runapi.ai/pl/models)
- [API docs](https://runapi.ai/pl/docs)