استخدم GPT Image في Hermes Agent.
GPT Image 2 هو نموذج توليد الصور المخصص من OpenAI — يدعم تحويل النص إلى صورة وتحرير الصور بالتعليمات اللغوية، بدقة إخراج تصل إلى 4K ودعم الخلفيات الشفافة. يستدعيه Hermes Agent عبر نفس مزوّد custom:runapi ومفتاح API المستخدم للدردشة، دون الحاجة إلى إعداد ComfyUI أو GPU.
Use RunAPI to generate an image with OpenAI GPT Image 2 from Hermes Agent.
Requirements:
- Use the RunAPI API at https://runapi.ai/v1/text_to_image.
- Read the API key from RUNAPI_API_KEY environment variable.
- Use the custom:runapi provider already configured in Hermes Agent.
- Set the model to "gpt-image-2-text-to-image".
- Write a descriptive prompt. GPT Image 2 follows natural language instructions closely — describe layout, style, text overlays, and transparency needs.
- Optionally set output_resolution to 1k, 2k, or 4k. Default is 1k.
- The response returns a task_id. Poll the task status endpoint until the task completes, then retrieve the output URL.
curl -X POST https://runapi.ai/v1/text_to_image \
-H "Authorization: Bearer $RUNAPI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-image-2-text-to-image",
"prompt": "A product photo of a glass perfume bottle on a marble surface, transparent background, studio lighting, the label reads AURORA in gold serif font",
"output_resolution": "2k",
"aspect_ratio": "3:4"
}'
{
"task_id": "tsk_abc123",
"status": "pending",
"model": "gpt-image-2-text-to-image"
}
استخدم GPT Image في Hermes Agent في ثلاث خطوات
هيّئ RunAPI
عيّن متغير البيئة RUNAPI_API_KEY في ملف تعريف shell. إذا كان مزوّد custom:runapi مُهيَّأً مسبقًا في Hermes Agent للدردشة، فإن المفتاح ذاته وbase_url يعملان مع GPT Image — دون الحاجة إلى إعداد إضافي.
export RUNAPI_API_KEY=runapi_xxx
استدعِ GPT Image 2
أرسل طلب POST إلى نقطة نهاية text_to_image مع تعيين النموذج إلى gpt-image-2-text-to-image. أضف مطالبة وصفية تتضمن تعليمات التخطيط والأسلوب. عيّن output_resolution على 2k أو 4k للحصول على دقة أعلى. لتعديل صور موجودة، استخدم نقطة نهاية edit_image مع gpt-image-2-image-to-image وأمدّ source_image_urls.
POST /v1/text_to_image
احصل على النتيجة
تُعيد الواجهة البرمجية task_id فورًا. استعلم عن نقطة نهاية حالة المهمة حتى تتغير الحالة إلى completed، ثم استرجع رابط صورة الإخراج من الاستجابة. يُكمل GPT Image 2 عادةً في غضون 10–30 ثانية تبعًا للدقة.
task_id: tsk_abc123
معاملات واجهة برمجة GPT Image
| المعامل | النوع | الوصف |
|---|---|---|
model |
string |
مطلوب. gpt-image-2-text-to-image للتوليد، وgpt-image-2-image-to-image للتعديل. |
prompt |
string |
مطلوب. وصف بلغة طبيعية للصورة المطلوبة. يدعم تعليمات تفصيلية للتخطيط ونصوص التراكب والأسلوب. |
output_resolution |
string |
اختياري. دقة الإخراج — 1k (افتراضي)، أو 2k، أو 4k. الدقة الأعلى تكلّف أكثر لكل صورة. |
aspect_ratio |
string |
اختياري. الافتراضي auto. يدعم 1:1، 3:2، 2:3، 4:3، 3:4، 16:9، 9:16، والمزيد. |
source_image_urls |
array |
مطلوب لنقطة نهاية edit_image. رابط واحد أو أكثر لصور المصدر المراد تعديلها. |
ما هو GPT Image في Hermes Agent؟
يتعامل GPT Image 2 مع التعليمات كموجزات إنتاج بدلاً من قوائم كلمات مفتاحية فضفاضة. يستدعيه Hermes Agent عبر RunAPI custom provider لتوليد الصور الدقيق في سير عمل التصميم الآلي.
حالات استخدام GPT Image
تصوير منتجات بخلفيات شفافة
أنتج صور منتجات بخلفيات شفافة للدمج في المواد التسويقية.
رسوميات حملات وسائل التواصل الاجتماعي
أنشئ مرئيات وسائل التواصل الاجتماعي مع نص مُضمَّن وألوان العلامة التجارية وعناصر خاصة بالحملة.
لقطات سينمائية لتحويل الفيديو
أنتج إطارات أولى جاهزة للفيديو ولقطات سينمائية لخطوط أنابيب التحريك.
أسئلة حول GPT Image و Hermes Agent
نعم. يستدعي Hermes Agent نموذج GPT Image 2 عبر نقطة نهاية text_to_image في RunAPI. عيّن حقل النموذج إلى gpt-image-2-text-to-image وأرسل الطلب بنفس RUNAPI_API_KEY الذي هيّأته لمزوّد custom:runapi. لا حاجة إلى ComfyUI أو استئجار GPU.
GPT Image 2 هو نموذج توليد الصور المخصص من OpenAI بجودة أعلى ودقة 4K ودعم الخلفيات الشفافة. أما GPT-4o Image فيولّد الصور في سياق الدردشة لكنه محدود بنسب عرض إلى ارتفاع 1:1 أو 3:2 أو 2:3. كلاهما متاح عبر RunAPI — استخدم gpt-image-2-text-to-image للتوليد المستقل وgpt-4o-image لإخراج الصور المدمج في الدردشة.
نعم. يمكن لـ GPT Image 2 إخراج صور بخلفيات شفافة عند تحديد ذلك في المطالبة. هذا مفيد لصور المنتجات والشعارات وعناصر واجهة المستخدم التي تحتاج إلى دمج. حدّد الشفافية في مطالبتك — على سبيل المثال، "صورة منتج بخلفية شفافة."
يُفوتر GPT Image 2 لكل صورة بحسب دقة الإخراج: 1k أو 2k أو 4k. أما GPT-4o Image فيُفوتر لكل صورة بحسب عدد الصور المُخرجة — توليد 2 أو 4 صور في طلب واحد يكلّف أكثر لكل صورة. كلاهما يعمل بنظام الدفع حسب الاستخدام بدون حد أدنى شهري. راجع صفحة التسعيرة في RunAPI للأسعار الحالية.
نعم. استخدم نقطة نهاية edit_image مع تعيين النموذج إلى gpt-image-2-image-to-image. أمدّ الصور المصدر في source_image_urls وصف التعديل بلغة طبيعية — "احذف الخلفية"، "أضف نظارات شمسية"، "غيّر النص إلى HELLO." لا حاجة إلى رسوم بيانية لـ ComfyUI، ولا GPU، ولا أقنعة inpainting.
إعداد Hermes Agent العام
لم تُهيّئه بعد؟ ابدأ بدليل إعداد RunAPI لـ Hermes Agent.
دليل إعداد Hermes Agent →كتالوج نماذج GPT Image
اطّلع على جميع متغيرات GPT Image والتسعيرة ووثائق الواجهة البرمجية.
نماذج GPT Image →جرّب GPT Image في Hermes Agent اليوم.
احصل على مفتاح RunAPI مجاني، هيّئ مزوّد custom:runapi، وابدأ بتوليد الصور وتعديلها بـ GPT Image 2 من OpenAI.