HERMES + ELEVENLABS

Utiliser ElevenLabs dans Hermes Agent.

ElevenLabs fournit six endpoints audio via RunAPI — TTS turbo-v2.5 à latence inférieure à la seconde, multilingual-v2 couvrant 29 langues, dialogue-v3 pour les conversations multi-locuteurs, effets sonores, transcription speech-to-text et isolation vocale. Hermes Agent les appelle via le fournisseur custom:runapi avec une seule clé API.

une seule clé API · endpoint text-to-speech · facturation par caractère
Utilisez RunAPI pour générer de l'audio vocal avec ElevenLabs text-to-speech.


  Exigences :

  - Lire la clé API depuis RUNAPI_API_KEY.

  - Utiliser le fournisseur custom:runapi avec base_url https://runapi.ai/v1.

  - Appeler POST https://runapi.ai/api/v1/elevenlabs/text_to_speech

  - Définir le modèle sur "text-to-speech-turbo-v2.5".

  - Définir text sur le contenu que vous souhaitez narrer.

  - Optionnellement définir voice sur un ID de voix ElevenLabs spécifique.

  - Optionnellement définir speed entre 0.7 et 1.2.

  - La tâche est asynchrone. Interroger le task_id retourné jusqu'à ce que le statut soit "completed".

  - Une fois terminé, lire l'URL audio depuis la réponse.

  
curl -X POST https://runapi.ai/api/v1/elevenlabs/text_to_speech \
  -H "Authorization: Bearer $RUNAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "text-to-speech-turbo-v2.5",
    "text": "Welcome to RunAPI. This audio was generated by ElevenLabs turbo v2.5.",
    "speed": 1.0,
    "stability": 0.5,
    "similarity_boost": 0.75
  }'
{
  "task_id": "tsk_abc123",
  "status": "pending",
  "model": "text-to-speech-turbo-v2.5"
}
Copiez la commande curl pour tester elevenlabs
FONCTIONNEMENT

Utiliser ElevenLabs dans Hermes Agent en trois étapes

1

Configurer RunAPI

Définissez RUNAPI_API_KEY dans l'environnement où Hermes Agent s'exécute. Si vous avez déjà ajouté RunAPI comme fournisseur custom:runapi, la même clé et base_url gèrent tous les endpoints ElevenLabs — TTS, STT, dialogue, effets sonores et isolation audio.

export RUNAPI_API_KEY=runapi_xxx
2

Appeler text_to_speech

Envoyez un POST à l'endpoint text_to_speech avec le modèle défini sur text-to-speech-turbo-v2.5, le texte que vous souhaitez narrer, et les paramètres optionnels voice, speed et stability. Hermes Agent route la requête via le fournisseur custom:runapi. Pour une sortie multilingue, utilisez text-to-speech-multilingual-v2 avec une voix et language_code.

POST /api/v1/elevenlabs/text_to_speech
3

Obtenir le résultat

L'endpoint retourne immédiatement un task_id. Interrogez l'endpoint de statut de tâche jusqu'à ce que le statut soit completed, puis lisez l'URL audio de sortie depuis la réponse.

GET /api/v1/elevenlabs/text_to_speech/tsk_abc123
PARAMÈTRES

Paramètres API text_to_speech de ElevenLabs

Paramètre Type Description
model string Requis. text-to-speech-turbo-v2.5 (faible latence) ou text-to-speech-multilingual-v2 (29 langues).
text string Requis. Le texte à convertir en parole. Maximum 5000 caractères.
voice string ID de voix ElevenLabs. Requis pour multilingual-v2. Turbo-v2.5 utilise une voix par défaut si omis.
speed float Optionnel. Multiplicateur de vitesse de lecture. Plage de 0.7 à 1.2.
stability float Optionnel. Cohérence vocale. Plage de 0.0 à 1.0. Des valeurs plus basses ajoutent de l'expressivité.
similarity_boost float Optionnel. Application de la similarité vocale. Plage de 0.0 à 1.0.
style float Optionnel. Exagération du style. Plage de 0.0 à 1.0.
language_code string Optionnel. Langue cible pour multilingual-v2, ex. en, es, ja.
callback_url string Optionnel. URL webhook qui reçoit un POST lorsque la tâche se termine.

Qu'est-ce qu'ElevenLabs sur Hermes Agent ?

ElevenLabs est l'API texte-vers-parole de référence, et Hermes Agent l'appelle via le fournisseur custom:runapi pour la génération vocale, la transcription et le traitement audio. L'avantage clé dans Hermes est le chaînage -- générer de la parole, puis transmettre l'URL audio à InfiniteTalk pour un avatar parlant ou à un modèle vidéo pour un contenu audiovisuel complet, le tout en une seule exécution d'agent. Six endpoints sont disponibles, dont TTS turbo, voix multilingues, dialogue multi-locuteurs et effets sonores.

Cas d'utilisation d'ElevenLabs

Agents vocaux IA conversationnels

Construire des agents vocaux qui parlent naturellement en générant de la parole via turbo-v2.5 avec une latence sous-seconde, adapté aux bots de service client, aux assistants interactifs ou aux interfaces téléphoniques.

Narration de contenu YouTube

Produire des voix off pour des vidéos YouTube avec des voix de personnages cohérentes, en ajustant la stabilité pour la cohérence du narrateur et l'exagération de style pour la plage émotionnelle sur toute une série.

Pipelines texte-vers-vidéo-parlante

Enchaîner ElevenLabs TTS avec InfiniteTalk ou d'autres modèles vidéo dans un workflow Hermes Agent pour passer du texte à une vidéo narrée avec un avatar parlant en une seule exécution automatisée.

FAQ

Questions sur ElevenLabs + Hermes Agent

Configuration générale de Hermes Agent

Pas encore configuré ? Commencez par le guide de configuration RunAPI pour Hermes Agent.

Guide de configuration Hermes Agent →

Catalogue des modèles ElevenLabs

Voir toutes les variantes ElevenLabs, la tarification et la documentation API.

ElevenLabs sur RunAPI →

Essayez ElevenLabs dans Hermes Agent dès aujourd'hui.

Obtenez une clé RunAPI gratuite, configurez le fournisseur custom:runapi et générez de l'audio vocal avec ElevenLabs — six endpoints, une seule clé API, facturation par caractère.