RunAPI GPT 가격은 공식 OpenAI 가격과 어떻게 다른가요?

RunAPI는 모든 GPT 모델에 대해 공식 OpenAI 토큰당 요금의 50%를 청구합니다. 할인은 입력 및 출력 토큰 모두에 적용됩니다. 정확한 백만 토큰당 요금은 RunAPI 가격 페이지를 확인하세요.

공급자 설정을 변경하지 않고 GPT 변형 간에 전환할 수 있나요?

네. custom:runapi 공급자는 모든 GPT 변형에서 작동합니다. 요청의 model 필드만 변경하면 됩니다 — gpt-5.5, gpt-5.4, gpt-5.4-mini, 또는 gpt-5.3-codex. base URL, API key, api_mode는 동일하게 유지됩니다.

Hermes Agent에서 RunAPI를 통해 Responses API가 작동하나요?

네. RunAPI는 /v1/responses에서 OpenAI Responses API도 프록시합니다. Hermes Agent가 Responses API 인터페이스를 지원하는 경우 엔드포인트를 https://runapi.ai/v1/responses로 설정하세요. 동일한 API key와 커스텀 공급자가 두 엔드포인트 모두에서 작동합니다.

RunAPI에서 GPT로 함수 호출과 구조화된 출력을 사용할 수 있나요?

네. 함수 호출을 위해 tools 배열을 전달하거나 구조화된 출력을 위해 response_format을 json_schema로 설정하세요. RunAPI가 이 파라미터들을 GPT 모델로 전달하고 표준 OpenAI 응답 형식으로 tool_calls 또는 구조화된 JSON을 반환합니다.

HERMES + GPT

Hermes Agent에서 GPT를 사용하세요.

GPT-5.5는 OpenAI의 주력 LLM으로, 공식 토큰당 가격의 절반으로 RunAPI를 통해 이용할 수 있습니다. Hermes Agent는 chat_completions 모드를 사용하는 custom:runapi 공급자를 통해 연결하며 — 하나의 설정 블록으로 스트리밍, 함수 호출, 구조화된 출력을 지원하는 모든 GPT 변형(5.5, 5.4, 5.4-mini, 5.3-codex)을 사용할 수 있습니다.

API Key 받기 문서 읽기

하나의 API key · OpenAI 호환 · 스트리밍 응답

Use RunAPI to call GPT-5.5 through the OpenAI-compatible Chat Completions endpoint.

Requirements:
- Read the API key from RUNAPI_API_KEY.
- Use the custom:runapi provider with base_url https://runapi.ai/v1.
- Call POST https://runapi.ai/v1/chat/completions
- Set model to "gpt-5.5".
- Include a messages array with at least one user message.
- The response is synchronous — the completion arrives in the same HTTP response.
- For streaming, set "stream": true to receive server-sent events.
- For the Responses API, call POST https://runapi.ai/v1/responses instead.

curl -X POST https://runapi.ai/v1/chat/completions \
  -H "Authorization: Bearer $RUNAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-5.5",
    "messages": [
      {"role": "system", "content": "You are a concise coding assistant."},
      {"role": "user", "content": "Write a Python function that merges two sorted lists in O(n) time."}
    ],
    "temperature": 0.3,
    "max_tokens": 1024
  }'

{
  "id": "chatcmpl-abc123",
  "object": "chat.completion",
  "model": "gpt-5.5",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "def merge_sorted(a, b):\n    result = []\n    i = j = 0\n    while i < len(a) and j < len(b):\n        if a[i] <= b[j]:\n            result.append(a[i]); i += 1\n        else:\n            result.append(b[j]); j += 1\n    result.extend(a[i:])\n    result.extend(b[j:])\n    return result"
      },
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 38,
    "completion_tokens": 95,
    "total_tokens": 133
  }
}

curl 명령어를 복사하여 테스트하세요 gpt

작동 방식

Hermes Agent에서 GPT를 세 단계로 사용하기

RunAPI를 커스텀 공급자로 추가

Hermes Agent에 이미 custom:runapi 공급자가 설정되어 있다면 동일한 key로 GPT를 사용할 수 있습니다. 그렇지 않은 경우 base_url을 https://runapi.ai/v1로, key_env를 RUNAPI_API_KEY로, api_mode를 chat_completions로 설정하여 커스텀 공급자를 추가하세요.

export RUNAPI_API_KEY=runapi_xxx

GPT 모델 선택

주력 모델로 gpt-5.5를, 비용 절감을 위해 gpt-5.4 또는 gpt-5.4-mini를, 코드 집중 작업에는 gpt-5.3-codex를 기본 모델로 설정하세요. /v1/chat/completions 엔드포인트는 사용량 카운트와 finish_reason이 포함된 표준 OpenAI 응답을 반환합니다.

default: gpt-5.5

스트리밍 또는 함수 호출 사용

Hermes Agent가 custom:runapi 공급자를 통해 stream, tools, response_format 파라미터를 전달합니다. 모든 표준 OpenAI Chat Completions 파라미터가 RunAPI를 통해 수정 없이 작동합니다.

"stream": true

파라미터

GPT Chat Completions 파라미터

파라미터	유형	설명
`model`	`string`	필수. gpt-5.5, gpt-5.4, gpt-5.4-mini, gpt-5.4-nano, gpt-5.3-codex, 또는 gpt-5.2.
`messages`	`array`	필수. role(system, user, assistant)과 content 필드가 있는 메시지 객체 배열.
`temperature`	`number`	선택 사항. 0~2 사이의 샘플링 온도. 낮을수록 결정론적 출력이 생성됩니다. 기본값 1.
`max_tokens`	`integer`	선택 사항. 완성에서 생성할 최대 토큰 수.
`stream`	`boolean`	선택 사항. true이면 증분 토큰 델타가 포함된 서버 전송 이벤트를 반환합니다. 기본값 false.
`tools`	`array`	선택 사항. 함수 호출용 도구 정의 배열. 각 도구에는 type, 함수 이름, 설명, 파라미터 스키마가 있습니다.
`response_format`	`object`	선택 사항. 구조화된 JSON 출력을 위해 type을 "json_object" 또는 "json_schema"로 설정하세요.
`reasoning_effort`	`string`	선택 사항. 지원 모델의 사고 깊이를 제어합니다. 허용 값은 low, medium, high.

Hermes Agent의 GPT란?

GPT는 OpenAI의 LLM 패밀리로 RunAPI의 custom:runapi provider를 통해 공식 토큰당 가격의 절반으로 제공됩니다. Hermes Agent는 표준 chat_completions API 모드로 연결하므로 GPT-5.5·5.4·5.4-mini·5.3-codex 모두 스트리밍·함수 호출·구조화 JSON 출력·비전 입력을 지원하며——모두 Claude나 Gemini와 동일한 provider 설정을 사용합니다.

GPT 활용 사례

Codex 모델을 활용한 Agentic Coding

Hermes Agent에서 GPT-5.3-codex를 코드 생성·리팩터링·자동화된 PR 워크플로에 사용하며, 플래그십 모델보다 낮은 비용으로 실행합니다.

구조화 출력을 활용한 일괄 처리

GPT의 json_schema 응답 형식으로 대량 문서를 처리해 RAG 파이프라인·청구서 파싱·콘텐츠 분류를 위한 구조화 데이터를 대규모로 추출합니다.

작업 복잡도별 동적 라우팅

간단한 쿼리는 비용 효율을 위해 GPT-5.4-mini로, 복잡한 추론 작업은 품질을 위해 GPT-5.5로 라우팅하며——모두 동일한 custom:runapi provider와 API 키를 통해 처리합니다.

FAQ

GPT + Hermes Agent 자주 묻는 질문

Hermes Agent 일반 설정

아직 설정하지 않으셨나요? Hermes Agent용 RunAPI 설정 가이드로 시작하세요.

Hermes Agent 설정 가이드 →

GPT 모델 카탈로그

모든 GPT 변형, 토큰당 가격, API 문서를 확인하세요.

RunAPI의 GPT →

지금 Hermes Agent에서 GPT-5.5를 사용해보세요.

무료 RunAPI key를 발급받고, custom:runapi 공급자를 설정하여 공식 OpenAI 토큰 가격의 절반으로 GPT-5.5를 호출하세요 — 스트리밍, 함수 호출, 구조화된 출력 포함.

모델 보기 →