HERMES + GPT IMAGE

Hermes Agent에서 GPT Image를 사용하세요.

GPT Image 2는 OpenAI의 전용 이미지 생성 모델로 — 최대 4K 출력 해상도와 투명 배경 지원으로 텍스트-이미지 생성 및 지시 기반 이미지 편집을 제공합니다. Hermes Agent는 ComfyUI나 GPU 설정 없이 채팅에 사용하는 동일한 RunAPI 커스텀 프로바이더와 API key로 호출합니다.

하나의 API key · 텍스트-이미지 + 이미지 편집 · 최대 4K 출력
Use RunAPI to generate an image with OpenAI GPT Image 2 from Hermes Agent.

Requirements:
- Use the RunAPI API at https://runapi.ai/v1/text_to_image.
- Read the API key from RUNAPI_API_KEY environment variable.
- Use the custom:runapi provider already configured in Hermes Agent.
- Set the model to "gpt-image-2-text-to-image".
- Write a descriptive prompt. GPT Image 2 follows natural language instructions closely — describe layout, style, text overlays, and transparency needs.
- Optionally set output_resolution to 1k, 2k, or 4k. Default is 1k.
- The response returns a task_id. Poll the task status endpoint until the task completes, then retrieve the output URL.
curl -X POST https://runapi.ai/v1/text_to_image \
  -H "Authorization: Bearer $RUNAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-image-2-text-to-image",
    "prompt": "A product photo of a glass perfume bottle on a marble surface, transparent background, studio lighting, the label reads AURORA in gold serif font",
    "output_resolution": "2k",
    "aspect_ratio": "3:4"
  }'
{
  "task_id": "tsk_abc123",
  "status": "pending",
  "model": "gpt-image-2-text-to-image"
}
curl 명령어를 복사하여 테스트하세요 gpt-image
작동 방식

3단계로 Hermes Agent에서 GPT Image 사용하기

1

RunAPI 설정

셸 프로필에 RUNAPI_API_KEY 환경 변수를 설정하세요. 이미 채팅을 위해 Hermes Agent에 custom:runapi 프로바이더가 설정되어 있다면, 동일한 key와 base_url로 GPT Image를 사용할 수 있습니다 — 추가 설정이 필요 없습니다.

export RUNAPI_API_KEY=runapi_xxx
2

GPT Image 2 호출

model을 gpt-image-2-text-to-image로 설정하여 text_to_image 엔드포인트에 POST 요청을 보내세요. 레이아웃과 스타일 지시가 포함된 설명적인 프롬프트를 포함하세요. 더 높은 디테일을 위해 output_resolution을 2k 또는 4k로 설정하세요. 기존 이미지 편집의 경우 gpt-image-2-image-to-image로 edit_image 엔드포인트를 사용하고 source_image_urls를 제공하세요.

POST /v1/text_to_image
3

결과 받기

API는 즉시 task_id를 반환합니다. status가 completed로 변경될 때까지 task status 엔드포인트를 폴링한 후 응답에서 출력 이미지 URL을 가져오세요. GPT Image 2는 해상도에 따라 일반적으로 10~30초 내에 완료됩니다.

task_id: tsk_abc123
파라미터

GPT Image API 파라미터

파라미터 유형 설명
model string 필수. 생성에는 gpt-image-2-text-to-image, 편집에는 gpt-image-2-image-to-image.
prompt string 필수. 원하는 이미지에 대한 자연어 설명. 레이아웃, 텍스트 오버레이, 스타일에 대한 상세한 지시를 지원합니다.
output_resolution string 선택 사항. 출력 해상도 — 1k (기본값), 2k, 또는 4k. 해상도가 높을수록 이미지당 비용이 더 높습니다.
aspect_ratio string 선택 사항. 기본값은 auto. 1:1, 3:2, 2:3, 4:3, 3:4, 16:9, 9:16 등을 지원합니다.
source_image_urls array edit_image 엔드포인트에 필수. 편집할 소스 이미지의 URL 하나 이상.

Hermes Agent의 GPT Image란?

GPT Image 2는 프롬프트를 키워드 목록이 아닌 제작 브리프로 취급합니다. 생성 전에 추론 단계를 포함하며, 레이아웃·텍스트 배치·구도에 대한 구조화된 지시를 따르는 데 도움이 됩니다. Hermes Agent는 RunAPI custom provider를 통해 호출합니다.

GPT Image 활용 사례

구조화 프롬프트를 활용한 일괄 이미지 생성

Hermes Agent를 통해 구조화된 디자인 브리프를 일괄 처리하며, 제품 카탈로그·마케팅 캠페인·콘텐츠 시리즈의 이미지를 생성합니다. GPT Image 2가 각 브리프의 레이아웃과 스타일 사양을 엄격히 따릅니다.

멀티모달 콘텐츠 파이프라인

GPT Image 2와 GPT 텍스트 모델을 연결합니다——먼저 GPT로 상세한 디자인 브리프를 생성하고, 그 다음 GPT Image 2로 생성을 실행해 비주얼 출력이 콘텐츠 전략과 긴밀하게 정렬되게 합니다.

투명 에셋의 브랜드 스위트 생성

투명 배경이 있는 브랜드 에셋——아이콘·배지·UI 요소——을 생성해 디자인 워크플로나 Hermes Agent의 다운스트림 단계에서 바로 합성해 사용합니다.

FAQ

GPT Image + Hermes Agent 질문

Hermes Agent 일반 설정

아직 설정하지 않으셨나요? Hermes Agent용 RunAPI 설정 가이드로 시작하세요.

Hermes Agent 설정 가이드 →

GPT Image 모델 카탈로그

GPT Image의 모든 변형, 가격, API 문서를 확인하세요.

GPT Image 모델 →

지금 Hermes Agent에서 GPT Image를 사용해보세요.

무료 RunAPI key를 발급받고, custom:runapi 프로바이더를 설정한 후 OpenAI GPT Image 2로 이미지 생성 및 편집을 시작하세요.