استخدم ElevenLabs في Hermes Agent.
توفر ElevenLabs ستة نقاط نهاية صوتية عبر RunAPI — تحويل نص إلى كلام turbo-v2.5 بزمن استجابة أقل من ثانية، وmultilingual-v2 يغطي 29 لغة، وdialogue-v3 للمحادثات متعددة المتحدثين، والمؤثرات الصوتية، والتفريغ النصي، وعزل الأصوات. يستدعيها Hermes Agent عبر مزوّد custom:runapi بمفتاح API واحد.
Use RunAPI to generate speech audio with ElevenLabs text-to-speech.
Requirements:
- Read the API key from RUNAPI_API_KEY.
- Use the custom:runapi provider with base_url https://runapi.ai/v1.
- Call POST https://runapi.ai/api/v1/elevenlabs/text_to_speech
- Set model to "text-to-speech-turbo-v2.5".
- Set text to the content you want spoken.
- Optionally set voice to a specific ElevenLabs voice ID.
- Optionally set speed between 0.7 and 1.2.
- The task is async. Poll the returned task_id until status is "completed".
- When done, read the audio URL from the response output.
curl -X POST https://runapi.ai/api/v1/elevenlabs/text_to_speech \
-H "Authorization: Bearer $RUNAPI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "text-to-speech-turbo-v2.5",
"text": "Welcome to RunAPI. This audio was generated by ElevenLabs turbo v2.5.",
"speed": 1.0,
"stability": 0.5,
"similarity_boost": 0.75
}'
{
"task_id": "tsk_abc123",
"status": "pending",
"model": "text-to-speech-turbo-v2.5"
}
استخدم ElevenLabs في Hermes Agent في ثلاث خطوات
هيّئ RunAPI
عيّن RUNAPI_API_KEY في البيئة التي يعمل فيها Hermes Agent. إذا أضفت RunAPI مسبقاً كمزوّد custom:runapi، فإن نفس المفتاح وbase_url يعالجان جميع نقاط نهاية ElevenLabs — تحويل النص إلى كلام، والنص إلى نص، والحوار، والمؤثرات الصوتية، وعزل الصوت.
export RUNAPI_API_KEY=runapi_xxx
استدعِ text_to_speech
أرسل طلب POST إلى نقطة نهاية text_to_speech مع تعيين النموذج على text-to-speech-turbo-v2.5، والنص المراد تحويله إلى كلام، ومعاملات اختيارية للصوت والسرعة والثبات. يوجّه Hermes Agent الطلب عبر مزوّد custom:runapi. للإخراج متعدد اللغات، استخدم text-to-speech-multilingual-v2 مع voice وlanguage_code.
POST /api/v1/elevenlabs/text_to_speech
استطلع النتيجة
تُعيد نقطة النهاية task_id فوراً. استطلع نقطة نهاية حالة المهمة حتى تصبح الحالة مكتملة، ثم اقرأ رابط الصوت من الاستجابة.
GET /api/v1/elevenlabs/text_to_speech/tsk_abc123
معاملات واجهة برمجة text_to_speech لـ ElevenLabs
| المعامل | النوع | الوصف |
|---|---|---|
model |
string |
مطلوب. text-to-speech-turbo-v2.5 (زمن استجابة منخفض) أو text-to-speech-multilingual-v2 (29 لغة). |
text |
string |
مطلوب. النص المراد تحويله إلى كلام. الحد الأقصى 5000 حرف. |
voice |
string |
معرّف صوت ElevenLabs. مطلوب لـ multilingual-v2. يستخدم turbo-v2.5 صوتاً افتراضياً إذا لم يُحدَّد. |
speed |
float |
اختياري. مضاعف سرعة التشغيل. النطاق من 0.7 إلى 1.2. |
stability |
float |
اختياري. اتساق الصوت. النطاق من 0.0 إلى 1.0. القيم المنخفضة تضيف تعبيرية. |
similarity_boost |
float |
اختياري. تعزيز تشابه الصوت. النطاق من 0.0 إلى 1.0. |
style |
float |
اختياري. مبالغة الأسلوب. النطاق من 0.0 إلى 1.0. |
language_code |
string |
اختياري. اللغة المستهدفة لـ multilingual-v2، مثل en أو es أو ja. |
callback_url |
string |
اختياري. رابط webhook يستقبل طلب POST عند اكتمال المهمة. |
ما هو ElevenLabs في Hermes Agent؟
ElevenLabs API تحويل النص إلى كلام الرائدة، ويستدعيها Hermes Agent عبر RunAPI custom provider. هذا يُسهّل ربط TTS بنماذج RunAPI الأخرى — أنتج الكلام ومرّر رابط الصوت إلى InfiniteTalk أو نماذج الفيديو في سير عمل واحد.
حالات استخدام ElevenLabs
وكلاء صوتيون للذكاء الاصطناعي التحادثي
ابنِ وكلاء صوتيين يتحدثون بشكل طبيعي بتوليد الكلام كخطوة في سير عمل Hermes Agent.
تعليق صوتي لمحتوى YouTube
أنتج تعليقاً صوتياً لمقاطع YouTube بأصوات شخصيات متسقة عبر API التحويل النصي إلى كلام.
خطوط أنابيب النص إلى الفيديو المنطوق
اجمع ElevenLabs TTS مع InfiniteTalk أو نماذج الفيديو الأخرى لسير عمل متكاملة من النص إلى الفيديو.
أسئلة ElevenLabs + Hermes Agent
نعم. هيّئ RunAPI كمزوّد custom:runapi في Hermes Agent مع تعيين base_url إلى https://runapi.ai/v1 وkey_env إلى RUNAPI_API_KEY، ثم استدعِ أي نقطة نهاية من ElevenLabs — text_to_speech أو speech_to_text أو text_to_dialogue أو text_to_sound أو isolate_audio.
turbo-v2.5 محسَّن لزمن استجابة منخفض وإخراج يُعطي الأولوية للغة الإنجليزية — ويطبّق صوتاً افتراضياً عند عدم التحديد. أما multilingual-v2 فيدعم 29 لغة ويتطلب معرّف صوت صريحاً وlanguage_code اختياري. يكلّف turbo نحو نصف سعر multilingual بالحرف.
تُفوتَر نقاط نهاية تحويل النص إلى كلام والحوار بالحرف من النص المُدخل. ويُفوتَر النص إلى نص بالدقيقة من الصوت. ويُفوتَر عزل الصوت بالمهمة. تحقق من صفحة أسعار RunAPI للاطلاع على الأسعار الحالية.
نعم. استدعِ نقطة نهاية speech_to_text على /api/v1/elevenlabs/speech_to_text مع source_audio_url. تدعم نقطة النهاية تمييز المتحدثين اختيارياً عبر معامل diarize وتوسيم أحداث الصوت عبر tag_audio_events. تُعاد النتائج بشكل غير متزامن.
استدعِ نقطة نهاية isolate_audio على /api/v1/elevenlabs/isolate_audio مع source_audio_url يشير إلى ملف الصوت المختلط. تستخرج نقطة النهاية الأصوات من الضوضاء الخلفية وتُعيد رابط صوت نظيف. المهمة غير متزامنة — استطلع أو استخدم callback_url.
إعداد Hermes Agent العام
لم تُهيّئه بعد؟ ابدأ بدليل إعداد RunAPI لـ Hermes Agent.
دليل إعداد Hermes Agent →كتالوج نماذج ElevenLabs
اطّلع على جميع إصدارات ElevenLabs والأسعار ونقاط النهاية المتاحة.
نماذج ElevenLabs →جرّب ElevenLabs في Hermes Agent اليوم.
احصل على مفتاح RunAPI مجاني، وهيّئ مزوّد custom:runapi، وأنشئ صوتاً من نص مع ElevenLabs — ستة نقاط نهاية، مفتاح API واحد، فوترة بالحرف.