Puis-je utiliser ElevenLabs dans Hermes Agent ?

Oui. Configurez RunAPI comme fournisseur custom:runapi dans Hermes Agent avec base_url https://runapi.ai/v1 et key_env RUNAPI_API_KEY, puis appelez n'importe quel endpoint ElevenLabs — text_to_speech, speech_to_text, text_to_dialogue, text_to_sound ou isolate_audio.

Quelle est la différence entre turbo-v2.5 et multilingual-v2 ?

Turbo-v2.5 est optimisé pour la faible latence et une sortie orientée anglais — il applique une voix par défaut si aucune n'est spécifiée. Multilingual-v2 prend en charge 29 langues et nécessite un ID de voix explicite et un language_code optionnel. Turbo coûte environ deux fois moins cher par caractère.

Comment ElevenLabs est-il facturé sur RunAPI ?

Les endpoints text-to-speech et dialogue sont facturés par caractère de texte d'entrée. Speech-to-text est facturé par minute d'audio. L'isolation audio est facturée par tâche. Consultez la page de tarification RunAPI pour les tarifs actuels.

Puis-je transcrire de l'audio avec ElevenLabs dans Hermes Agent ?

Oui. Appelez l'endpoint speech_to_text à /api/v1/elevenlabs/speech_to_text avec un source_audio_url. L'endpoint prend en charge la diarisation optionnelle des locuteurs via le paramètre diarize et l'étiquetage des événements audio via tag_audio_events. Les résultats sont retournés de manière asynchrone.

Comment fonctionne l'isolation audio via RunAPI ?

Appelez l'endpoint isolate_audio à /api/v1/elevenlabs/isolate_audio avec un source_audio_url pointant vers votre fichier audio mixé. L'endpoint extrait les voix du bruit de fond et retourne une URL audio nettoyée. La tâche est asynchrone — interrogez ou utilisez un callback_url.

HERMES + ELEVENLABS

Utiliser ElevenLabs dans Hermes Agent.

ElevenLabs fournit six endpoints audio via RunAPI — TTS turbo-v2.5 à latence inférieure à la seconde, multilingual-v2 couvrant 29 langues, dialogue-v3 pour les conversations multi-locuteurs, effets sonores, transcription speech-to-text et isolation vocale. Hermes Agent les appelle via le fournisseur custom:runapi avec une seule clé API.

Obtenir une API Key Lire la documentation

une seule clé API · endpoint text-to-speech · facturation par caractère

Utilisez RunAPI pour générer de l'audio vocal avec ElevenLabs text-to-speech.


  Exigences :

  - Lire la clé API depuis RUNAPI_API_KEY.

  - Utiliser le fournisseur custom:runapi avec base_url https://runapi.ai/v1.

  - Appeler POST https://runapi.ai/api/v1/elevenlabs/text_to_speech

  - Définir le modèle sur "text-to-speech-turbo-v2.5".

  - Définir text sur le contenu que vous souhaitez narrer.

  - Optionnellement définir voice sur un ID de voix ElevenLabs spécifique.

  - Optionnellement définir speed entre 0.7 et 1.2.

  - La tâche est asynchrone. Interroger le task_id retourné jusqu'à ce que le statut soit "completed".

  - Une fois terminé, lire l'URL audio depuis la réponse.

curl -X POST https://runapi.ai/api/v1/elevenlabs/text_to_speech \
  -H "Authorization: Bearer $RUNAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "text-to-speech-turbo-v2.5",
    "text": "Welcome to RunAPI. This audio was generated by ElevenLabs turbo v2.5.",
    "speed": 1.0,
    "stability": 0.5,
    "similarity_boost": 0.75
  }'

{
  "task_id": "tsk_abc123",
  "status": "pending",
  "model": "text-to-speech-turbo-v2.5"
}

Copiez la commande curl pour tester elevenlabs

FONCTIONNEMENT

Utiliser ElevenLabs dans Hermes Agent en trois étapes

Configurer RunAPI

Définissez RUNAPI_API_KEY dans l'environnement où Hermes Agent s'exécute. Si vous avez déjà ajouté RunAPI comme fournisseur custom:runapi, la même clé et base_url gèrent tous les endpoints ElevenLabs — TTS, STT, dialogue, effets sonores et isolation audio.

export RUNAPI_API_KEY=runapi_xxx

Appeler text_to_speech

Envoyez un POST à l'endpoint text_to_speech avec le modèle défini sur text-to-speech-turbo-v2.5, le texte que vous souhaitez narrer, et les paramètres optionnels voice, speed et stability. Hermes Agent route la requête via le fournisseur custom:runapi. Pour une sortie multilingue, utilisez text-to-speech-multilingual-v2 avec une voix et language_code.

POST /api/v1/elevenlabs/text_to_speech

Obtenir le résultat

L'endpoint retourne immédiatement un task_id. Interrogez l'endpoint de statut de tâche jusqu'à ce que le statut soit completed, puis lisez l'URL audio de sortie depuis la réponse.

GET /api/v1/elevenlabs/text_to_speech/tsk_abc123

PARAMÈTRES

Paramètres API text_to_speech de ElevenLabs

Paramètre	Type	Description
`model`	`string`	Requis. text-to-speech-turbo-v2.5 (faible latence) ou text-to-speech-multilingual-v2 (29 langues).
`text`	`string`	Requis. Le texte à convertir en parole. Maximum 5000 caractères.
`voice`	`string`	ID de voix ElevenLabs. Requis pour multilingual-v2. Turbo-v2.5 utilise une voix par défaut si omis.
`speed`	`float`	Optionnel. Multiplicateur de vitesse de lecture. Plage de 0.7 à 1.2.
`stability`	`float`	Optionnel. Cohérence vocale. Plage de 0.0 à 1.0. Des valeurs plus basses ajoutent de l'expressivité.
`similarity_boost`	`float`	Optionnel. Application de la similarité vocale. Plage de 0.0 à 1.0.
`style`	`float`	Optionnel. Exagération du style. Plage de 0.0 à 1.0.
`language_code`	`string`	Optionnel. Langue cible pour multilingual-v2, ex. en, es, ja.
`callback_url`	`string`	Optionnel. URL webhook qui reçoit un POST lorsque la tâche se termine.

Qu'est-ce qu'ElevenLabs sur Hermes Agent ?

ElevenLabs est l'API texte-vers-parole de référence, et Hermes Agent l'appelle via le fournisseur custom:runapi pour la génération vocale, la transcription et le traitement audio. L'avantage clé dans Hermes est le chaînage -- générer de la parole, puis transmettre l'URL audio à InfiniteTalk pour un avatar parlant ou à un modèle vidéo pour un contenu audiovisuel complet, le tout en une seule exécution d'agent. Six endpoints sont disponibles, dont TTS turbo, voix multilingues, dialogue multi-locuteurs et effets sonores.

Cas d'utilisation d'ElevenLabs

Agents vocaux IA conversationnels

Construire des agents vocaux qui parlent naturellement en générant de la parole via turbo-v2.5 avec une latence sous-seconde, adapté aux bots de service client, aux assistants interactifs ou aux interfaces téléphoniques.

Narration de contenu YouTube

Produire des voix off pour des vidéos YouTube avec des voix de personnages cohérentes, en ajustant la stabilité pour la cohérence du narrateur et l'exagération de style pour la plage émotionnelle sur toute une série.

Pipelines texte-vers-vidéo-parlante

Enchaîner ElevenLabs TTS avec InfiniteTalk ou d'autres modèles vidéo dans un workflow Hermes Agent pour passer du texte à une vidéo narrée avec un avatar parlant en une seule exécution automatisée.

FAQ

Questions sur ElevenLabs + Hermes Agent

Configuration générale de Hermes Agent

Pas encore configuré ? Commencez par le guide de configuration RunAPI pour Hermes Agent.

Guide de configuration Hermes Agent →

Catalogue des modèles ElevenLabs

Voir toutes les variantes ElevenLabs, la tarification et la documentation API.

ElevenLabs sur RunAPI →

Essayez ElevenLabs dans Hermes Agent dès aujourd'hui.

Obtenez une clé RunAPI gratuite, configurez le fournisseur custom:runapi et générez de l'audio vocal avec ElevenLabs — six endpoints, une seule clé API, facturation par caractère.

Parcourir les modèles →