استخدم Kling في OpenClaw.
يولّد Kling 3.0 من Kuaishou مقاطع فيديو من النصوص أو الصور بدقة تصل إلى 1080p مع صوت مدمج ومشاهد متعددة ومدة من 3 إلى 15 ثانية. تستدعيه وكلاء OpenClaw عبر RunAPI بنفس مفتاح API المستخدم في الدردشة — أرسل طلبًا، استطلع المهمة، واحصل على رابط الفيديو.
Use RunAPI to generate a video with Kling 3.0.
Requirements:
- Call POST https://runapi.ai/api/v1/kling/text_to_video
- Set model to "kling-3.0"
- Read the API key from RUNAPI_API_KEY environment variable
- Set duration_seconds to control length (3–15 seconds)
- Set aspect_ratio to "16:9" for landscape video
- Enable sound with enable_sound: true for native audio
- The response is async — poll the task status endpoint until the task completes, then retrieve the video URL
curl -X POST https://runapi.ai/api/v1/kling/text_to_video \
-H "Authorization: Bearer $RUNAPI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "kling-3.0",
"prompt": "A drone shot pulling back from a mountain lake at sunrise, mist rising off the water, cinematic lighting",
"duration_seconds": 5,
"aspect_ratio": "16:9",
"enable_sound": true,
"output_resolution": "1080p"
}'
{
"task_id": "tsk_abc123",
"status": "pending",
"model": "kling-3.0"
}
استخدام Kling في OpenClaw في ثلاث خطوات
تهيئة RunAPI
عيّن متغير البيئة RUNAPI_API_KEY. إذا قمت بالفعل بتهيئة RunAPI كمزود OpenClaw للدردشة، فإن نفس المفتاح يعمل لتوليد الفيديو — لا حاجة لإعداد إضافي.
export RUNAPI_API_KEY=runapi_xxx
استدعاء Kling text_to_video
أرسل طلب POST إلى /api/v1/kling/text_to_video مع ضبط النموذج على kling-3.0. أضف prompt وduration_seconds (3–15) وaspect_ratio، واختياريًا enable_sound للصوت المدمج. للتوليد من صورة، استخدم /api/v1/kling/image_to_video مع first_frame_image_url عوضًا عن ذلك.
POST /api/v1/kling/text_to_video
استطلاع النتيجة
تُعيد نقطة النهاية task_id فورًا. استطلع نقطة نهاية حالة المهمة حتى تتغير الحالة إلى completed، ثم احصل على رابط الفيديو من الاستجابة. يستغرق التوليد عادةً 30–120 ثانية حسب المدة والدقة.
GET /api/v1/kling/text_to_video/tsk_abc123
معاملات Kling text_to_video API
| المعامل | النوع | الوصف |
|---|---|---|
model |
string |
مطلوب. kling-3.0 للإصدار الأحدث. |
prompt |
string |
وصف الفيديو. مطلوب إلا إذا كان multi_shots مفعّلاً. |
duration_seconds |
integer |
مدة الفيديو. يدعم Kling 3.0 من 3 إلى 15 ثانية. الإصدارات الأقدم تقبل 5 أو 10 فقط. |
aspect_ratio |
string |
نسبة أبعاد الإخراج: 16:9 أو 9:16 أو 1:1. |
output_resolution |
string |
الدقة: 720p أو 1080p أو 4k. الدقة الأعلى تكلف أكثر في الثانية. |
enable_sound |
boolean |
يولّد صوتًا مدمجًا مع الفيديو. يزيد تكلفة الثانية. |
negative_prompt |
string |
عناصر يجب استبعادها من التوليد. |
first_frame_image_url |
string |
رابط صورة لاستخدامها كإطار افتتاحي (وضع اللقطة الواحدة). |
cfg_scale |
number |
مقياس التوجيه (0–1). القيم الأعلى تتبع الطلب بدقة أكبر. |
multi_shots |
boolean |
تفعيل توليد مشاهد متعددة اللقطات مع طلبات منفصلة لكل مقطع. |
ما هو Kling في OpenClaw؟
Kling 3.0 من Kuaishou معروف بجودة الفيديو السينمائية مع محاكاة قوية للأقمشة وديناميكيات السوائل وفيزياء الحركة. يُنشئ مقاطع تصل إلى 3 دقائق من النص أو الصور بدقة تصل إلى 1080p مع صوت أصلي ومشاهد متعددة اللقطات. تستدعيه وكلاء OpenClaw عبر نقطة نهاية RunAPI بنفس مفتاح API المستخدم للمحادثة.
حالات استخدام Kling
B-roll ولقطات تأسيسية
أنتج لقطات B-roll بطول المشهد لمواعيد نهائية ضيقة دون فريق تصوير أو موقع.
محتوى نمط حياة المنتجات
أنشئ مقاطع فيديو للمنتجات لعلامات الطعام والموضة أو نمط الحياة بسلوك حركة واقعي.
مقاطع قصيرة لوسائل التواصل الاجتماعي
أنتج مقاطع قصيرة لـ TikTok وReels وYouTube Shorts بدقة تصل إلى 1080p.
أسئلة Kling + OpenClaw
يُفوتر Kling بالثانية للفيديو المولَّد. يعتمد السعر على output_resolution وما إذا كان enable_sound مفعّلاً. مقطع 5 ثوانٍ بدقة 720p بدون صوت هو الخيار الأقل تكلفة؛ 1080p مع الصوت يكلف ضعف ذلك تقريبًا في الثانية. راجع صفحة الأسعار في RunAPI للأسعار الدقيقة.
يولّد text_to_video مقطعًا من طلب نصي فقط. يتطلب image_to_video first_frame_image_url ويحرّك الصورة للخارج. كلتا نقطتَي النهاية تُعيدان task_id غير متزامن وتدعمان نفس خيارات المدة والدقة.
نعم. اضبط enable_sound على true في جسم الطلب. يولّد Kling 3.0 صوتًا متزامنًا يتناسب مع محتوى الفيديو. توليد الصوت يزيد التكلفة بالثانية — عند 720p، يُضيف الصوت نحو 3 سنتات في الثانية.
يدعم Kling 3.0 من 3 إلى 15 ثانية عبر معامل duration_seconds. الإصدارات الأقدم مثل kling-v2.5-turbo-text-to-video-pro تقبل 5 أو 10 ثوانٍ فقط.
يمتلك Kling 3.0 نقطة نهاية motion_control منفصلة على /api/v1/kling/motion_control لتطبيق إعدادات الحركة المسبقة على صورة مصدر مع فيديو مرجعي. تعتمد نقطة نهاية text_to_video على وصف الطلب لتحديد اتجاه الكاميرا.
جرّب Kling في OpenClaw اليوم.
احصل على مفتاح RunAPI مجاني، الصق الطلب في OpenClaw، وابدأ في توليد الفيديو بـ Kling 3.0.