Hermes Agent에서 GPT Image를 사용하세요.
GPT Image 2는 OpenAI의 전용 이미지 생성 모델로 — 최대 4K 출력 해상도와 투명 배경 지원으로 텍스트-이미지 생성 및 지시 기반 이미지 편집을 제공합니다. Hermes Agent는 ComfyUI나 GPU 설정 없이 채팅에 사용하는 동일한 RunAPI 커스텀 프로바이더와 API key로 호출합니다.
Use RunAPI to generate an image with OpenAI GPT Image 2 from Hermes Agent.
Requirements:
- Use the RunAPI API at https://runapi.ai/v1/text_to_image.
- Read the API key from RUNAPI_API_KEY environment variable.
- Use the custom:runapi provider already configured in Hermes Agent.
- Set the model to "gpt-image-2-text-to-image".
- Write a descriptive prompt. GPT Image 2 follows natural language instructions closely — describe layout, style, text overlays, and transparency needs.
- Optionally set output_resolution to 1k, 2k, or 4k. Default is 1k.
- The response returns a task_id. Poll the task status endpoint until the task completes, then retrieve the output URL.
curl -X POST https://runapi.ai/v1/text_to_image \
-H "Authorization: Bearer $RUNAPI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-image-2-text-to-image",
"prompt": "A product photo of a glass perfume bottle on a marble surface, transparent background, studio lighting, the label reads AURORA in gold serif font",
"output_resolution": "2k",
"aspect_ratio": "3:4"
}'
{
"task_id": "tsk_abc123",
"status": "pending",
"model": "gpt-image-2-text-to-image"
}
3단계로 Hermes Agent에서 GPT Image 사용하기
RunAPI 설정
셸 프로필에 RUNAPI_API_KEY 환경 변수를 설정하세요. 이미 채팅을 위해 Hermes Agent에 custom:runapi 프로바이더가 설정되어 있다면, 동일한 key와 base_url로 GPT Image를 사용할 수 있습니다 — 추가 설정이 필요 없습니다.
export RUNAPI_API_KEY=runapi_xxx
GPT Image 2 호출
model을 gpt-image-2-text-to-image로 설정하여 text_to_image 엔드포인트에 POST 요청을 보내세요. 레이아웃과 스타일 지시가 포함된 설명적인 프롬프트를 포함하세요. 더 높은 디테일을 위해 output_resolution을 2k 또는 4k로 설정하세요. 기존 이미지 편집의 경우 gpt-image-2-image-to-image로 edit_image 엔드포인트를 사용하고 source_image_urls를 제공하세요.
POST /v1/text_to_image
결과 받기
API는 즉시 task_id를 반환합니다. status가 completed로 변경될 때까지 task status 엔드포인트를 폴링한 후 응답에서 출력 이미지 URL을 가져오세요. GPT Image 2는 해상도에 따라 일반적으로 10~30초 내에 완료됩니다.
task_id: tsk_abc123
GPT Image API 파라미터
| 파라미터 | 유형 | 설명 |
|---|---|---|
model |
string |
필수. 생성에는 gpt-image-2-text-to-image, 편집에는 gpt-image-2-image-to-image. |
prompt |
string |
필수. 원하는 이미지에 대한 자연어 설명. 레이아웃, 텍스트 오버레이, 스타일에 대한 상세한 지시를 지원합니다. |
output_resolution |
string |
선택 사항. 출력 해상도 — 1k (기본값), 2k, 또는 4k. 해상도가 높을수록 이미지당 비용이 더 높습니다. |
aspect_ratio |
string |
선택 사항. 기본값은 auto. 1:1, 3:2, 2:3, 4:3, 3:4, 16:9, 9:16 등을 지원합니다. |
source_image_urls |
array |
edit_image 엔드포인트에 필수. 편집할 소스 이미지의 URL 하나 이상. |
Hermes Agent의 GPT Image란?
GPT Image 2는 프롬프트를 키워드 목록이 아닌 제작 브리프로 취급합니다. 생성 전에 추론 단계를 포함하며, 레이아웃·텍스트 배치·구도에 대한 구조화된 지시를 따르는 데 도움이 됩니다. Hermes Agent는 RunAPI custom provider를 통해 호출합니다.
GPT Image 활용 사례
구조화 프롬프트를 활용한 일괄 이미지 생성
Hermes Agent를 통해 구조화된 디자인 브리프를 일괄 처리하며, 제품 카탈로그·마케팅 캠페인·콘텐츠 시리즈의 이미지를 생성합니다. GPT Image 2가 각 브리프의 레이아웃과 스타일 사양을 엄격히 따릅니다.
멀티모달 콘텐츠 파이프라인
GPT Image 2와 GPT 텍스트 모델을 연결합니다——먼저 GPT로 상세한 디자인 브리프를 생성하고, 그 다음 GPT Image 2로 생성을 실행해 비주얼 출력이 콘텐츠 전략과 긴밀하게 정렬되게 합니다.
투명 에셋의 브랜드 스위트 생성
투명 배경이 있는 브랜드 에셋——아이콘·배지·UI 요소——을 생성해 디자인 워크플로나 Hermes Agent의 다운스트림 단계에서 바로 합성해 사용합니다.
GPT Image + Hermes Agent 질문
네. Hermes Agent는 RunAPI text_to_image 엔드포인트를 통해 GPT Image 2를 호출합니다. model 필드를 gpt-image-2-text-to-image로 설정하고 custom:runapi 프로바이더에 설정한 동일한 RUNAPI_API_KEY로 요청을 보내세요. ComfyUI나 GPU 대여가 필요 없습니다.
GPT Image 2는 더 높은 품질, 4K 출력, 투명 배경 지원을 갖춘 OpenAI의 전용 이미지 생성 모델입니다. GPT-4o Image는 채팅 컨텍스트 내에서 이미지를 생성하지만 1:1, 3:2, 2:3 종횡비로 제한됩니다. 두 모델 모두 RunAPI를 통해 사용 가능합니다 — 독립적인 생성에는 gpt-image-2-text-to-image를, 채팅 통합 이미지 출력에는 gpt-4o-image를 사용하세요.
네. GPT Image 2는 프롬프트에서 지시할 때 투명 배경이 있는 이미지를 출력할 수 있습니다. 이는 합성이 필요한 제품 사진, 로고, UI 요소에 유용합니다. 프롬프트에 투명도를 명시하세요 — 예: "transparent background가 있는 제품 사진."
GPT Image 2는 출력 해상도(1k, 2k, 4k)에 따라 이미지당 청구됩니다. GPT-4o Image는 출력 수에 따라 이미지당 청구됩니다 — 단일 요청에서 2개 또는 4개의 이미지를 생성하면 이미지당 비용이 더 높아집니다. 두 모델 모두 월 최소 지출 없이 종량제 청구를 사용합니다. 현재 요금은 RunAPI 가격 페이지를 확인하세요.
네. model을 gpt-image-2-image-to-image로 설정하여 edit_image 엔드포인트를 사용하세요. source_image_urls에 소스 이미지를 전달하고 자연어로 편집 내용을 설명하세요 — "배경 제거", "선글라스 추가", "텍스트를 HELLO로 변경." ComfyUI 워크플로우 그래프, GPU 인스턴스, 인페인팅 마스크가 필요 없습니다.
지금 Hermes Agent에서 GPT Image를 사용해보세요.
무료 RunAPI key를 발급받고, custom:runapi 프로바이더를 설정한 후 OpenAI GPT Image 2로 이미지 생성 및 편집을 시작하세요.