هل يمكنني استخدام ElevenLabs في Hermes Agent؟

نعم. هيّئ RunAPI كمزوّد custom:runapi في Hermes Agent مع تعيين base_url إلى https://runapi.ai/v1 وkey_env إلى RUNAPI_API_KEY، ثم استدعِ أي نقطة نهاية من ElevenLabs — text_to_speech أو speech_to_text أو text_to_dialogue أو text_to_sound أو isolate_audio.

ما الفرق بين turbo-v2.5 وmultilingual-v2؟

turbo-v2.5 محسَّن لزمن استجابة منخفض وإخراج يُعطي الأولوية للغة الإنجليزية — ويطبّق صوتاً افتراضياً عند عدم التحديد. أما multilingual-v2 فيدعم 29 لغة ويتطلب معرّف صوت صريحاً وlanguage_code اختياري. يكلّف turbo نحو نصف سعر multilingual بالحرف.

كيف تُحتسب تكلفة ElevenLabs في RunAPI؟

تُفوتَر نقاط نهاية تحويل النص إلى كلام والحوار بالحرف من النص المُدخل. ويُفوتَر النص إلى نص بالدقيقة من الصوت. ويُفوتَر عزل الصوت بالمهمة. تحقق من صفحة أسعار RunAPI للاطلاع على الأسعار الحالية.

هل يمكنني تفريغ الصوت نصاً مع ElevenLabs في Hermes Agent؟

نعم. استدعِ نقطة نهاية speech_to_text على /api/v1/elevenlabs/speech_to_text مع source_audio_url. تدعم نقطة النهاية تمييز المتحدثين اختيارياً عبر معامل diarize وتوسيم أحداث الصوت عبر tag_audio_events. تُعاد النتائج بشكل غير متزامن.

كيف يعمل عزل الصوت عبر RunAPI؟

استدعِ نقطة نهاية isolate_audio على /api/v1/elevenlabs/isolate_audio مع source_audio_url يشير إلى ملف الصوت المختلط. تستخرج نقطة النهاية الأصوات من الضوضاء الخلفية وتُعيد رابط صوت نظيف. المهمة غير متزامنة — استطلع أو استخدم callback_url.

HERMES + ELEVENLABS

استخدم ElevenLabs في Hermes Agent.

توفر ElevenLabs ستة نقاط نهاية صوتية عبر RunAPI — تحويل نص إلى كلام turbo-v2.5 بزمن استجابة أقل من ثانية، وmultilingual-v2 يغطي 29 لغة، وdialogue-v3 للمحادثات متعددة المتحدثين، والمؤثرات الصوتية، والتفريغ النصي، وعزل الأصوات. يستدعيها Hermes Agent عبر مزوّد custom:runapi بمفتاح API واحد.

احصل على API Key اقرأ الوثائق

مفتاح API واحد · نقطة نهاية تحويل النص إلى كلام · فوترة بالحرف

Use RunAPI to generate speech audio with ElevenLabs text-to-speech.

Requirements:
- Read the API key from RUNAPI_API_KEY.
- Use the custom:runapi provider with base_url https://runapi.ai/v1.
- Call POST https://runapi.ai/api/v1/elevenlabs/text_to_speech
- Set model to "text-to-speech-turbo-v2.5".
- Set text to the content you want spoken.
- Optionally set voice to a specific ElevenLabs voice ID.
- Optionally set speed between 0.7 and 1.2.
- The task is async. Poll the returned task_id until status is "completed".
- When done, read the audio URL from the response output.

curl -X POST https://runapi.ai/api/v1/elevenlabs/text_to_speech \
  -H "Authorization: Bearer $RUNAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "text-to-speech-turbo-v2.5",
    "text": "Welcome to RunAPI. This audio was generated by ElevenLabs turbo v2.5.",
    "speed": 1.0,
    "stability": 0.5,
    "similarity_boost": 0.75
  }'

{
  "task_id": "tsk_abc123",
  "status": "pending",
  "model": "text-to-speech-turbo-v2.5"
}

انسخ أمر curl للاختبار elevenlabs

HOW IT WORKS

استخدم ElevenLabs في Hermes Agent في ثلاث خطوات

هيّئ RunAPI

عيّن RUNAPI_API_KEY في البيئة التي يعمل فيها Hermes Agent. إذا أضفت RunAPI مسبقاً كمزوّد custom:runapi، فإن نفس المفتاح وbase_url يعالجان جميع نقاط نهاية ElevenLabs — تحويل النص إلى كلام، والنص إلى نص، والحوار، والمؤثرات الصوتية، وعزل الصوت.

export RUNAPI_API_KEY=runapi_xxx

استدعِ text_to_speech

أرسل طلب POST إلى نقطة نهاية text_to_speech مع تعيين النموذج على text-to-speech-turbo-v2.5، والنص المراد تحويله إلى كلام، ومعاملات اختيارية للصوت والسرعة والثبات. يوجّه Hermes Agent الطلب عبر مزوّد custom:runapi. للإخراج متعدد اللغات، استخدم text-to-speech-multilingual-v2 مع voice وlanguage_code.

POST /api/v1/elevenlabs/text_to_speech

استطلع النتيجة

تُعيد نقطة النهاية task_id فوراً. استطلع نقطة نهاية حالة المهمة حتى تصبح الحالة مكتملة، ثم اقرأ رابط الصوت من الاستجابة.

GET /api/v1/elevenlabs/text_to_speech/tsk_abc123

PARAMETERS

معاملات واجهة برمجة text_to_speech لـ ElevenLabs

المعامل	النوع	الوصف
`model`	`string`	مطلوب. text-to-speech-turbo-v2.5 (زمن استجابة منخفض) أو text-to-speech-multilingual-v2 (29 لغة).
`text`	`string`	مطلوب. النص المراد تحويله إلى كلام. الحد الأقصى 5000 حرف.
`voice`	`string`	معرّف صوت ElevenLabs. مطلوب لـ multilingual-v2. يستخدم turbo-v2.5 صوتاً افتراضياً إذا لم يُحدَّد.
`speed`	`float`	اختياري. مضاعف سرعة التشغيل. النطاق من 0.7 إلى 1.2.
`stability`	`float`	اختياري. اتساق الصوت. النطاق من 0.0 إلى 1.0. القيم المنخفضة تضيف تعبيرية.
`similarity_boost`	`float`	اختياري. تعزيز تشابه الصوت. النطاق من 0.0 إلى 1.0.
`style`	`float`	اختياري. مبالغة الأسلوب. النطاق من 0.0 إلى 1.0.
`language_code`	`string`	اختياري. اللغة المستهدفة لـ multilingual-v2، مثل en أو es أو ja.
`callback_url`	`string`	اختياري. رابط webhook يستقبل طلب POST عند اكتمال المهمة.

ما هو ElevenLabs في Hermes Agent؟

ElevenLabs API تحويل النص إلى كلام الرائدة، ويستدعيها Hermes Agent عبر RunAPI custom provider. هذا يُسهّل ربط TTS بنماذج RunAPI الأخرى — أنتج الكلام ومرّر رابط الصوت إلى InfiniteTalk أو نماذج الفيديو في سير عمل واحد.

حالات استخدام ElevenLabs

وكلاء صوتيون للذكاء الاصطناعي التحادثي

ابنِ وكلاء صوتيين يتحدثون بشكل طبيعي بتوليد الكلام كخطوة في سير عمل Hermes Agent.

تعليق صوتي لمحتوى YouTube

أنتج تعليقاً صوتياً لمقاطع YouTube بأصوات شخصيات متسقة عبر API التحويل النصي إلى كلام.

خطوط أنابيب النص إلى الفيديو المنطوق

اجمع ElevenLabs TTS مع InfiniteTalk أو نماذج الفيديو الأخرى لسير عمل متكاملة من النص إلى الفيديو.

FAQ

أسئلة ElevenLabs + Hermes Agent

إعداد Hermes Agent العام

لم تُهيّئه بعد؟ ابدأ بدليل إعداد RunAPI لـ Hermes Agent.

دليل إعداد Hermes Agent →

كتالوج نماذج ElevenLabs

اطّلع على جميع إصدارات ElevenLabs والأسعار ونقاط النهاية المتاحة.

نماذج ElevenLabs →

جرّب ElevenLabs في Hermes Agent اليوم.

احصل على مفتاح RunAPI مجاني، وهيّئ مزوّد custom:runapi، وأنشئ صوتاً من نص مع ElevenLabs — ستة نقاط نهاية، مفتاح API واحد، فوترة بالحرف.

تصفّح النماذج →