Gebruik ElevenLabs in Hermes Agent.
ElevenLabs biedt zes audio-endpoints via RunAPI — turbo-v2.5 TTS met latentie onder een seconde, multilingual-v2 met ondersteuning voor 29 talen, dialogue-v3 voor gesprekken met meerdere sprekers, geluidseffecten, speech-to-text-transcriptie en vocale isolatie. Hermes Agent roept ze aan via de custom:runapi-provider met één API-sleutel.
Use RunAPI to generate speech audio with ElevenLabs text-to-speech.
Requirements:
- Read the API key from RUNAPI_API_KEY.
- Use the custom:runapi provider with base_url https://runapi.ai/v1.
- Call POST https://runapi.ai/api/v1/elevenlabs/text_to_speech
- Set model to "text-to-speech-turbo-v2.5".
- Set text to the content you want spoken.
- Optionally set voice to a specific ElevenLabs voice ID.
- Optionally set speed between 0.7 and 1.2.
- The task is async. Poll the returned task_id until status is "completed".
- When done, read the audio URL from the response output.
curl -X POST https://runapi.ai/api/v1/elevenlabs/text_to_speech \
-H "Authorization: Bearer $RUNAPI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "text-to-speech-turbo-v2.5",
"text": "Welcome to RunAPI. This audio was generated by ElevenLabs turbo v2.5.",
"speed": 1.0,
"stability": 0.5,
"similarity_boost": 0.75
}'
{
"task_id": "tsk_abc123",
"status": "pending",
"model": "text-to-speech-turbo-v2.5"
}
Gebruik ElevenLabs in Hermes Agent in drie stappen
Configureer RunAPI
Stel RUNAPI_API_KEY in als omgevingsvariabele waar Hermes Agent draait. Als je RunAPI al als custom:runapi-provider hebt toegevoegd, verwerken dezelfde sleutel en base_url alle ElevenLabs-endpoints — TTS, STT, dialoog, geluidseffecten en audio-isolatie.
export RUNAPI_API_KEY=runapi_xxx
Roep text_to_speech aan
Stuur een POST-verzoek naar het text_to_speech-endpoint met model ingesteld op text-to-speech-turbo-v2.5, de tekst die je wilt laten uitspreken, en optionele voice-, speed- en stability-parameters. Hermes Agent routeert het verzoek via de custom:runapi-provider. Voor meertalige uitvoer gebruik je text-to-speech-multilingual-v2 met een voice en language_code.
POST /api/v1/elevenlabs/text_to_speech
Haal het resultaat op
Het endpoint retourneert onmiddellijk een task_id. Poll het taakstatusendpoint totdat de status verandert naar voltooid, lees dan de uitvoer-audio-URL uit de reactie.
GET /api/v1/elevenlabs/text_to_speech/tsk_abc123
ElevenLabs text_to_speech API-parameters
| Parameter | Type | Beschrijving |
|---|---|---|
model |
string |
Verplicht. text-to-speech-turbo-v2.5 (lage latentie) of text-to-speech-multilingual-v2 (29 talen). |
text |
string |
Verplicht. De tekst om naar spraak om te zetten. Maximaal 5000 tekens. |
voice |
string |
ElevenLabs stem-ID. Verplicht voor multilingual-v2. Turbo-v2.5 gebruikt een standaardstem als dit niet is opgegeven. |
speed |
float |
Optioneel. Afspeelsnelheidsvermenigvuldiger. Bereik 0,7 tot 1,2. |
stability |
float |
Optioneel. Stemconsistentie. Bereik 0,0 tot 1,0. Lagere waarden voegen expressiviteit toe. |
similarity_boost |
float |
Optioneel. Stemgelijkenishandhaving. Bereik 0,0 tot 1,0. |
style |
float |
Optioneel. Stijloverdrijving. Bereik 0,0 tot 1,0. |
language_code |
string |
Optioneel. Doeltaal voor multilingual-v2, bijv. en, es, ja. |
callback_url |
string |
Optioneel. Webhook-URL die een POST ontvangt wanneer de taak voltooid is. |
Wat is ElevenLabs in Hermes Agent?
ElevenLabs is de toonaangevende tekst-naar-spraak-API, en Hermes Agent roept het aan via de RunAPI custom provider. Het maakt het eenvoudig om TTS te koppelen aan andere RunAPI-modellen — genereer spraak en geef de audio-URL door aan InfiniteTalk of videomodellen in één workflow.
ElevenLabs-toepassingen
Conversationele AI-spraakagenten
Bouw spraakagenten die natuurlijk praten door spraak te genereren als stap in Hermes Agent-workflows.
Narrating voor YouTube-content
Produceer voice-over voor YouTube-video's in consistente karakterstemmen via de TTS-API.
Tekst-naar-gesproken-video-pipelines
Koppel ElevenLabs TTS met InfiniteTalk of andere videomodellen voor volledige tekst-naar-video-workflows.
Vragen over ElevenLabs + Hermes Agent
Ja. Configureer RunAPI als custom:runapi-provider in Hermes Agent met base_url https://runapi.ai/v1 en key_env RUNAPI_API_KEY, en roep vervolgens elk ElevenLabs-endpoint aan — text_to_speech, speech_to_text, text_to_dialogue, text_to_sound of isolate_audio.
Turbo-v2.5 is geoptimaliseerd voor lage latentie en Engelstalige uitvoer — er wordt een standaardstem toegepast als er geen is opgegeven. Multilingual-v2 ondersteunt 29 talen en vereist een expliciet stem-ID en optionele language_code. Turbo kost ongeveer de helft per teken.
Text-to-speech- en dialoog-endpoints worden gefactureerd per teken invoertekst. Speech-to-text wordt gefactureerd per minuut audio. Audio-isolatie wordt per taak gefactureerd. Controleer de RunAPI-prijspagina voor actuele tarieven.
Ja. Roep het speech_to_text-endpoint aan op /api/v1/elevenlabs/speech_to_text met een source_audio_url. Het endpoint ondersteunt optionele sprekersherkenning via de diarize-parameter en audiogebeurtenislabeling via tag_audio_events. Resultaten worden asynchroon geretourneerd.
Roep het isolate_audio-endpoint aan op /api/v1/elevenlabs/isolate_audio met een source_audio_url die naar je gemixte audiobestand wijst. Het endpoint extraheert vocalen uit achtergrondgeluid en retourneert een opgeschoonde audio-URL. De taak is asynchroon — poll of gebruik een callback_url.
Algemene Hermes Agent-configuratie
Nog niet geconfigureerd? Begin met de RunAPI-configuratiegids voor Hermes Agent.
Hermes Agent-configuratiegids →ElevenLabs-modelcatalogus
Bekijk alle ElevenLabs-varianten, prijzen en API-documentatie.
ElevenLabs op RunAPI →Probeer ElevenLabs in Hermes Agent vandaag.
Haal een gratis RunAPI-sleutel, configureer de custom:runapi-provider en genereer spraakaudio met ElevenLabs — zes endpoints, één API-sleutel, facturering per teken.