Quels endpoints ElevenLabs puis-je utiliser depuis OpenClaw ?

RunAPI expose six endpoints ElevenLabs : text_to_speech (turbo-v2.5 et multilingual-v2), text_to_dialogue (dialogue-v3 pour multi-locuteurs), text_to_sound (effets sonores), speech_to_text (transcription) et isolate_audio (extraction vocale). Tous partagent la même RUNAPI_API_KEY.

Quelle est la différence entre turbo-v2.5 et multilingual-v2 ?

Turbo-v2.5 est optimisé pour la faible latence et une sortie orientée anglais — il applique une voix par défaut si aucune n'est spécifiée. Multilingual-v2 prend en charge 29 langues et nécessite un ID de voix explicite et un language_code optionnel. Turbo coûte environ deux fois moins cher par caractère.

ElevenLabs TTS est-il synchrone ou asynchrone sur RunAPI ?

Asynchrone. L'endpoint de création retourne immédiatement un task_id. Interrogez l'endpoint de statut de tâche ou fournissez un callback_url pour recevoir un webhook lorsque le fichier audio est prêt à télécharger.

Comment ElevenLabs est-il facturé sur RunAPI ?

Les endpoints text-to-speech et dialogue sont facturés par caractère de texte d'entrée. Speech-to-text est facturé par minute d'audio. L'isolation audio est facturée par tâche. Consultez la page de tarification RunAPI pour les tarifs actuels.

Puis-je utiliser ElevenLabs dialogue-v3 pour l'audio multi-locuteurs dans OpenClaw ?

Oui. Appelez l'endpoint text_to_dialogue avec le modèle text-to-dialogue-v3. Passez un tableau dialogue où chaque élément a un text et un ID de voix. Le texte total de tous les locuteurs doit être inférieur à 5000 caractères.

OPENCLAW + ELEVENLABS

Utiliser ElevenLabs dans OpenClaw.

ElevenLabs fournit six endpoints audio via RunAPI — TTS turbo-v2.5 à latence inférieure à la seconde, multilingual-v2 couvrant 29 langues, dialogue-v3 pour les conversations multi-locuteurs, effets sonores, transcription speech-to-text et isolation vocale. Les agents OpenClaw les appellent tous avec la même clé RunAPI utilisée pour le chat.

Obtenir une API Key Lire la documentation

une seule clé API · endpoint text-to-speech · facturation par caractère

Utilisez RunAPI pour générer de l'audio vocal avec ElevenLabs text-to-speech.


  Exigences :

  - Lire la clé API depuis RUNAPI_API_KEY.

  - Appeler POST https://runapi.ai/api/v1/elevenlabs/text_to_speech

  - Définir le modèle sur "text-to-speech-turbo-v2.5".

  - Définir text sur le contenu que vous souhaitez narrer.

  - Optionnellement définir voice sur un ID de voix ElevenLabs spécifique.

  - Optionnellement définir speed entre 0.7 et 1.2.

  - La tâche est asynchrone. Interroger le task_id retourné jusqu'à ce que le statut soit "completed".

  - Une fois terminé, lire l'URL audio depuis la réponse.

curl -X POST https://runapi.ai/api/v1/elevenlabs/text_to_speech \
  -H "Authorization: Bearer $RUNAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "text-to-speech-turbo-v2.5",
    "text": "Welcome to RunAPI. This audio was generated by ElevenLabs turbo v2.5.",
    "speed": 1.0,
    "stability": 0.5,
    "similarity_boost": 0.75
  }'

{
  "task_id": "tsk_abc123",
  "status": "pending",
  "model": "text-to-speech-turbo-v2.5"
}

Copiez la commande curl pour tester elevenlabs

FONCTIONNEMENT

Utiliser ElevenLabs dans OpenClaw en trois étapes

Configurer RunAPI

Définissez RUNAPI_API_KEY dans votre environnement. Si vous avez déjà configuré RunAPI pour le chat dans OpenClaw, la même clé fonctionne pour tous les endpoints ElevenLabs — TTS, STT, dialogue, effets sonores et isolation audio.

export RUNAPI_API_KEY=runapi_xxx

Appeler text_to_speech

Envoyez un POST à l'endpoint text_to_speech avec le modèle défini sur text-to-speech-turbo-v2.5, le texte que vous souhaitez narrer, et les paramètres optionnels voice, speed et stability. Pour une sortie multilingue, utilisez text-to-speech-multilingual-v2 avec une voix et language_code.

POST /api/v1/elevenlabs/text_to_speech

Obtenir le résultat

L'endpoint retourne immédiatement un task_id. Interrogez l'endpoint de statut de tâche jusqu'à ce que le statut soit completed, puis lisez l'URL audio de sortie depuis la réponse.

GET /api/v1/elevenlabs/text_to_speech/tsk_abc123

PARAMÈTRES

Paramètres API text_to_speech de ElevenLabs

Paramètre	Type	Description
`model`	`string`	Requis. text-to-speech-turbo-v2.5 (faible latence) ou text-to-speech-multilingual-v2 (29 langues).
`text`	`string`	Requis. Le texte à convertir en parole. Maximum 5000 caractères.
`voice`	`string`	ID de voix ElevenLabs. Requis pour multilingual-v2. Turbo-v2.5 utilise une voix par défaut si omis.
`speed`	`float`	Optionnel. Multiplicateur de vitesse de lecture. Plage de 0.7 à 1.2.
`stability`	`float`	Optionnel. Cohérence vocale. Plage de 0.0 à 1.0. Des valeurs plus basses ajoutent de l'expressivité.
`similarity_boost`	`float`	Optionnel. Application de la similarité vocale. Plage de 0.0 à 1.0.
`style`	`float`	Optionnel. Exagération du style. Plage de 0.0 à 1.0.
`language_code`	`string`	Optionnel. Langue cible pour multilingual-v2, ex. en, es, ja.
`callback_url`	`string`	Optionnel. URL webhook qui reçoit un POST lorsque la tâche se termine.

Qu'est-ce qu'ElevenLabs sur OpenClaw ?

ElevenLabs est l'API texte-vers-parole de référence pour une sortie vocale naturelle. Via RunAPI, les agents OpenClaw accèdent à turbo-v2.5 (latence sous-seconde pour l'anglais), multilingual-v2 (29 langues), dialogue-v3 (conversations multi-locuteurs), génération d'effets sonores, transcription parole-vers-texte et isolation vocale. Vous pouvez ajuster la sortie vocale avec des curseurs de stabilité et de boost de similarité pour contrôler l'expressivité ou la cohérence de la voix.

Cas d'utilisation d'ElevenLabs

Narration de livres audio et de podcasts

Convertir de longs textes en audio parlé avec des voix de personnages cohérentes. Ajuster la stabilité pour la cohérence du narrateur et le boost de similarité pour garder la voix proche du profil original sur des heures de contenu.

Doublage vidéo en plusieurs langues

Doubler du contenu vidéo en 29 langues avec multilingual-v2 en utilisant le même profil vocal, produisant des versions localisées qui maintiennent les caractéristiques vocales du locuteur original.

Effets sonores pour la production vidéo et de jeux

Générer des sons Foley personnalisés, de l'audio ambiant et des cues sonores à partir de descriptions textuelles via l'endpoint text_to_sound, remplaçant les recherches dans les bibliothèques audio de stock par une génération à la demande.

FAQ

Questions sur ElevenLabs + OpenClaw

Configuration générale de OpenClaw

Pas encore configuré ? Commencez par le guide de configuration RunAPI pour OpenClaw.

Guide de configuration OpenClaw →

Catalogue des modèles ElevenLabs

Voir toutes les variantes ElevenLabs, la tarification et la documentation API.

ElevenLabs sur RunAPI →

Essayez ElevenLabs dans OpenClaw dès aujourd'hui.

Obtenez une clé RunAPI gratuite, collez le prompt dans OpenClaw et générez de l'audio vocal avec ElevenLabs — six endpoints, une seule clé API, facturation par caractère.

Parcourir les modèles →