ElevenLabs speech-to-text API
Wariant modelu dostępny przez ujednolicone AI API RunAPI.
# Install the model skill for app development workflows
npx skills add runapi-ai/elevenlabs -g
Install the ElevenLabs skill for this app: 1. Add runapi-ai/elevenlabs with the skills installer. 2. Load SKILL.md in this workspace. 3. Use its docs, schemas, pricing notes, and setup steps when adding model features. 4. Confirm the install path when done.
speech-to-text trafia w optymalny punkt między jakością a kosztem w rodzinie ElevenLabs.
- Cennik za wywołanie w USD
- Nieudane generacje nie są rozliczane
- Streaming, gdy jest obsługiwany przez model
- Setup model skilla
Cennik
Szczegóły techniczne
| ID modelu | speech-to-text |
| Dostawca | ElevenLabs |
| Modalność | audio_music |
| Typ zadania | asynchronous |
| Jednostka rozliczeniowa | minute |
| API endpoint | /api/v1/elevenlabs/speech_to_text |
| Licencja komercyjna | Tak — wliczona przez API |
| Status | Operacyjny |
Szybki start — speech-to-text
Ten sam format · wariant przypięty w modelu
# Install the model skill for app development workflows
npx skills add runapi-ai/elevenlabs -g
Install the ElevenLabs skill for this app: 1. Add runapi-ai/elevenlabs with the skills installer. 2. Load SKILL.md in this workspace. 3. Use its docs, schemas, pricing notes, and setup steps when adding model features. 4. Confirm the install path when done.
Użyj speech-to-text w czterech krokach
Instalacja
Zainstaluj model skill dla tej linii modeli.
Konfiguracja
Ustaw pole model na pełny identyfikator modelu widoczny na tej stronie.
Wywołanie
Wyślij typowane żądanie z promptem, danymi wejściowymi i ustawieniami callbacku.
Odbiór
Odczytaj odpowiedź zadania, webhook callback lub adres URL zapisanego wyniku z RunAPI.
Co wyróżnia speech-to-text
Transcription across 29+ languages with speaker diarization
Vocal extraction from mixed audio sources
Transcription across 29+ languages with speaker diarization
Text-to-sound effects for games, video, and podcasts
Transcription across 29+ languages with speaker diarization
Multi-speaker dialogue generation with natural turn-taking
Najlepiej sprawdza się w
Muzyka do podcastów i wideo
Generuj muzykę w tle bez tantiem, dopasowaną do nastroju odcinka i bez opłat licencyjnych.
Audio do gier
Generuj adaptacyjne ambientowe pejzaże dźwiękowe i efekty do proceduralnie generowanych poziomów.
Lektor i SFX do reklam
Generuj niestandardowe lektorskie nagrania i efekty dźwiękowe do spotów klienta bez studia nagrań.
Najczęściej zadawane pytania o speech-to-text
Czy identyfikator modelu jest stały między wersjami?
RunAPI utrzymuje stały identyfikator modelu i obsługuje zgodne odświeżenia wersji bez zmiany kształtu żądania.
Jaki jest limit rate limit dla tej warianty?
Limity na klucz skalują się wraz z poziomem wykorzystania. Aktualne limity znajdziesz na stronie cennika.
Czy mogę później zmienić wariant?
Tak — wariant to flaga. Zmieniasz go, aktualizując parametr model.
Czy obsługuje streaming?
Tam, gdzie streaming jest dostępny, RunAPI streamuje end-to-end.
Gdzie zgłaszać problemy z jakością?
Otwórz issue w publicznym repo na GitHubie albo napisz do supportu.