---
title: &quot;Używaj ElevenLabs w OpenClaw przez RunAPI — Przewodnik po TTS i Audio API&quot;
url: &quot;https://runapi.ai/pl/openclaw-elevenlabs.md&quot;
canonical: &quot;https://runapi.ai/pl/openclaw-elevenlabs&quot;
locale: &quot;pl&quot;
model: &quot;elevenlabs&quot;
---

# Używaj ElevenLabs w OpenClaw.

ElevenLabs zapewnia sześć endpointów audio przez RunAPI — TTS turbo-v2.5 z opóźnieniem poniżej sekundy, multilingual-v2 obsługujący 29 języków, dialogue-v3 dla rozmów wieloosobowych, efekty džwiękowe, transkrypcję mowy na tekst i izolację wokalu. Agenty OpenClaw wywołują je tym samym kluczem RunAPI używanym do czatu.

## API example

```bash
curl -X POST https://runapi.ai/api/v1/elevenlabs/text_to_speech \
  -H &quot;Authorization: Bearer $RUNAPI_API_KEY&quot; \
  -H &quot;Content-Type: application/json&quot; \
  -d &#39;{
    &quot;model&quot;: &quot;text-to-speech-turbo-v2.5&quot;,
    &quot;text&quot;: &quot;Welcome to RunAPI. This audio was generated by ElevenLabs turbo v2.5.&quot;,
    &quot;speed&quot;: 1.0,
    &quot;stability&quot;: 0.5,
    &quot;similarity_boost&quot;: 0.75
  }&#39;

```

### Response

```json
{
  &quot;task_id&quot;: &quot;tsk_abc123&quot;,
  &quot;status&quot;: &quot;pending&quot;,
  &quot;model&quot;: &quot;text-to-speech-turbo-v2.5&quot;
}

```

## How it works

1. **Skonfiguruj RunAPI** — Ustaw RUNAPI_API_KEY w swoim środowisku. Jeśli już skonfigurowałeś RunAPI do czatu w OpenClaw, ten sam klucz działa dla wszystkich endpointów ElevenLabs — TTS, STT, dialogue, efekty džwiękowe i izolacja džwięku.
2. **Wywołaj text_to_speech** — Wyślij POST do endpointu text_to_speech z modelem ustawionym na text-to-speech-turbo-v2.5, tekstem, który chcesz wypowiedzieć, oraz opcjonalnymi parametrami voice, speed i stability. Dla wyjścia wielojęzycznego użyj text-to-speech-multilingual-v2 z głosem i language_code.
3. **Odpytuj o wynik** — Endpoint natychmiast zwraca task_id. Odpytuj endpoint statusu zadania, aż status osiągnie wartość completed, a następnie odczytaj wyjściowy adres URL džwięku z odpowiedzi.

## Parameters

| Parameter | Type | Description |
|-----------|------|-------------|
| `model` | `string` | Wymagane. text-to-speech-turbo-v2.5 (niskie opóźnienie) lub text-to-speech-multilingual-v2 (29 języków). |
| `text` | `string` | Wymagane. Tekst do przekonwertowania na mowę. Maksymalnie 5000 znaków. |
| `voice` | `string` | ID głosu ElevenLabs. Wymagane dla multilingual-v2. Turbo-v2.5 używa domyślnego głosu, jeśli pominięto. |
| `speed` | `float` | Opcjonalne. Mnożnik prędkości odtwarzania. Zakres 0.7 do 1.2. |
| `stability` | `float` | Opcjonalne. Spójność głosu. Zakres 0.0 do 1.0. Niższe wartości dodają ekspresji. |
| `similarity_boost` | `float` | Opcjonalne. Wymuszenie podobieństwa głosu. Zakres 0.0 do 1.0. |
| `style` | `float` | Opcjonalne. Wzmocnienie stylu. Zakres 0.0 do 1.0. |
| `language_code` | `string` | Opcjonalne. Docelowy język dla multilingual-v2, np. en, es, ja. |
| `callback_url` | `string` | Opcjonalne. Adres URL webhooka, który otrzymuje POST po zakończeniu zadania. |

## FAQ

### Jakich endpointów ElevenLabs mogę używać z OpenClaw?

RunAPI udostępnia sześć endpointów ElevenLabs: text_to_speech (turbo-v2.5 i multilingual-v2), text_to_dialogue (dialogue-v3 dla wielu mówców), text_to_sound (efekty džwiękowe), speech_to_text (transkrypcja) i isolate_audio (ekstrakcja wokalu). Wszystkie korzystają z tego samego RUNAPI_API_KEY.

### Jaka jest różnica między turbo-v2.5 a multilingual-v2?

Turbo-v2.5 jest zoptymalizowany pod kątem niskich opóźnień i przede wszystkim angielskiego wyjścia — stosuje domyślny głos, gdy żaden nie jest podany. Multilingual-v2 obsługuje 29 języków i wymaga jawnego ID głosu oraz opcjonalnego language_code. Turbo kosztuje mniej więcej o połowę mniej za znak.

### Czy TTS ElevenLabs jest synchroniczny czy asynchroniczny na RunAPI?

Asynchroniczny. Endpoint create zwraca task_id natychmiast. Odpytuj endpoint statusu zadania lub podaj callback_url, aby otrzymać webhook, gdy plik audio będzie gotowy do pobrania.

### Jak rozliczany jest ElevenLabs na RunAPI?

Endpointy text-to-speech i dialogue są rozliczane per znak tekstu wejściowego. Speech-to-text jest rozliczany per minuta džwięku. Izolacja džwięku jest rozliczana per zadanie. Sprawdź stronę cennika RunAPI, aby uzyskać aktualne stawki.

### Czy mogę używać ElevenLabs dialogue-v3 do džwięku wieloosobowego w OpenClaw?

Tak. Wywołaj endpoint text_to_dialogue z modelem text-to-dialogue-v3. Przekaż tablicę dialogue, gdzie każdy element ma text i ID głosu. Łączna liczba znaków tekstu wszystkich mówców musi być mniejsza niż 5000 znaków.


## Links

- [Przewodnik konfiguracji OpenClaw →](https://runapi.ai/pl/openclaw)
- [ElevenLabs na RunAPI →](https://runapi.ai/pl/models/elevenlabs)
- [Model catalog](https://runapi.ai/pl/models)
- [API docs](https://runapi.ai/pl/docs)
