HERMES + GPT

Hermes Agent에서 GPT를 사용하세요.

GPT-5.5는 OpenAI의 주력 LLM으로, 공식 토큰당 가격의 절반으로 RunAPI를 통해 이용할 수 있습니다. Hermes Agent는 chat_completions 모드를 사용하는 custom:runapi 공급자를 통해 연결하며 — 하나의 설정 블록으로 스트리밍, 함수 호출, 구조화된 출력을 지원하는 모든 GPT 변형(5.5, 5.4, 5.4-mini, 5.3-codex)을 사용할 수 있습니다.

하나의 API key · OpenAI 호환 · 스트리밍 응답
Use RunAPI to call GPT-5.5 through the OpenAI-compatible Chat Completions endpoint.

Requirements:
- Read the API key from RUNAPI_API_KEY.
- Use the custom:runapi provider with base_url https://runapi.ai/v1.
- Call POST https://runapi.ai/v1/chat/completions
- Set model to "gpt-5.5".
- Include a messages array with at least one user message.
- The response is synchronous — the completion arrives in the same HTTP response.
- For streaming, set "stream": true to receive server-sent events.
- For the Responses API, call POST https://runapi.ai/v1/responses instead.
curl -X POST https://runapi.ai/v1/chat/completions \
  -H "Authorization: Bearer $RUNAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-5.5",
    "messages": [
      {"role": "system", "content": "You are a concise coding assistant."},
      {"role": "user", "content": "Write a Python function that merges two sorted lists in O(n) time."}
    ],
    "temperature": 0.3,
    "max_tokens": 1024
  }'
{
  "id": "chatcmpl-abc123",
  "object": "chat.completion",
  "model": "gpt-5.5",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "def merge_sorted(a, b):\n    result = []\n    i = j = 0\n    while i < len(a) and j < len(b):\n        if a[i] <= b[j]:\n            result.append(a[i]); i += 1\n        else:\n            result.append(b[j]); j += 1\n    result.extend(a[i:])\n    result.extend(b[j:])\n    return result"
      },
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 38,
    "completion_tokens": 95,
    "total_tokens": 133
  }
}
curl 명령어를 복사하여 테스트하세요 gpt
작동 방식

Hermes Agent에서 GPT를 세 단계로 사용하기

1

RunAPI를 커스텀 공급자로 추가

Hermes Agent에 이미 custom:runapi 공급자가 설정되어 있다면 동일한 key로 GPT를 사용할 수 있습니다. 그렇지 않은 경우 base_url을 https://runapi.ai/v1로, key_env를 RUNAPI_API_KEY로, api_mode를 chat_completions로 설정하여 커스텀 공급자를 추가하세요.

export RUNAPI_API_KEY=runapi_xxx
2

GPT 모델 선택

주력 모델로 gpt-5.5를, 비용 절감을 위해 gpt-5.4 또는 gpt-5.4-mini를, 코드 집중 작업에는 gpt-5.3-codex를 기본 모델로 설정하세요. /v1/chat/completions 엔드포인트는 사용량 카운트와 finish_reason이 포함된 표준 OpenAI 응답을 반환합니다.

default: gpt-5.5
3

스트리밍 또는 함수 호출 사용

Hermes Agent가 custom:runapi 공급자를 통해 stream, tools, response_format 파라미터를 전달합니다. 모든 표준 OpenAI Chat Completions 파라미터가 RunAPI를 통해 수정 없이 작동합니다.

"stream": true
파라미터

GPT Chat Completions 파라미터

파라미터 유형 설명
model string 필수. gpt-5.5, gpt-5.4, gpt-5.4-mini, gpt-5.4-nano, gpt-5.3-codex, 또는 gpt-5.2.
messages array 필수. role(system, user, assistant)과 content 필드가 있는 메시지 객체 배열.
temperature number 선택 사항. 0~2 사이의 샘플링 온도. 낮을수록 결정론적 출력이 생성됩니다. 기본값 1.
max_tokens integer 선택 사항. 완성에서 생성할 최대 토큰 수.
stream boolean 선택 사항. true이면 증분 토큰 델타가 포함된 서버 전송 이벤트를 반환합니다. 기본값 false.
tools array 선택 사항. 함수 호출용 도구 정의 배열. 각 도구에는 type, 함수 이름, 설명, 파라미터 스키마가 있습니다.
response_format object 선택 사항. 구조화된 JSON 출력을 위해 type을 "json_object" 또는 "json_schema"로 설정하세요.
reasoning_effort string 선택 사항. 지원 모델의 사고 깊이를 제어합니다. 허용 값은 low, medium, high.

Hermes Agent의 GPT란?

GPT는 OpenAI의 LLM 패밀리로 RunAPI의 custom:runapi provider를 통해 공식 토큰당 가격의 절반으로 제공됩니다. Hermes Agent는 표준 chat_completions API 모드로 연결하므로 GPT-5.5·5.4·5.4-mini·5.3-codex 모두 스트리밍·함수 호출·구조화 JSON 출력·비전 입력을 지원하며——모두 Claude나 Gemini와 동일한 provider 설정을 사용합니다.

GPT 활용 사례

Codex 모델을 활용한 Agentic Coding

Hermes Agent에서 GPT-5.3-codex를 코드 생성·리팩터링·자동화된 PR 워크플로에 사용하며, 플래그십 모델보다 낮은 비용으로 실행합니다.

구조화 출력을 활용한 일괄 처리

GPT의 json_schema 응답 형식으로 대량 문서를 처리해 RAG 파이프라인·청구서 파싱·콘텐츠 분류를 위한 구조화 데이터를 대규모로 추출합니다.

작업 복잡도별 동적 라우팅

간단한 쿼리는 비용 효율을 위해 GPT-5.4-mini로, 복잡한 추론 작업은 품질을 위해 GPT-5.5로 라우팅하며——모두 동일한 custom:runapi provider와 API 키를 통해 처리합니다.

FAQ

GPT + Hermes Agent 자주 묻는 질문

Hermes Agent 일반 설정

아직 설정하지 않으셨나요? Hermes Agent용 RunAPI 설정 가이드로 시작하세요.

Hermes Agent 설정 가이드 →

GPT 모델 카탈로그

모든 GPT 변형, 토큰당 가격, API 문서를 확인하세요.

RunAPI의 GPT →

지금 Hermes Agent에서 GPT-5.5를 사용해보세요.

무료 RunAPI key를 발급받고, custom:runapi 공급자를 설정하여 공식 OpenAI 토큰 가격의 절반으로 GPT-5.5를 호출하세요 — 스트리밍, 함수 호출, 구조화된 출력 포함.