Hermes Agent에서 GPT를 사용하세요.
GPT-5.5는 OpenAI의 주력 LLM으로, 공식 토큰당 가격의 절반으로 RunAPI를 통해 이용할 수 있습니다. Hermes Agent는 chat_completions 모드를 사용하는 custom:runapi 공급자를 통해 연결하며 — 하나의 설정 블록으로 스트리밍, 함수 호출, 구조화된 출력을 지원하는 모든 GPT 변형(5.5, 5.4, 5.4-mini, 5.3-codex)을 사용할 수 있습니다.
Use RunAPI to call GPT-5.5 through the OpenAI-compatible Chat Completions endpoint.
Requirements:
- Read the API key from RUNAPI_API_KEY.
- Use the custom:runapi provider with base_url https://runapi.ai/v1.
- Call POST https://runapi.ai/v1/chat/completions
- Set model to "gpt-5.5".
- Include a messages array with at least one user message.
- The response is synchronous — the completion arrives in the same HTTP response.
- For streaming, set "stream": true to receive server-sent events.
- For the Responses API, call POST https://runapi.ai/v1/responses instead.
curl -X POST https://runapi.ai/v1/chat/completions \
-H "Authorization: Bearer $RUNAPI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-5.5",
"messages": [
{"role": "system", "content": "You are a concise coding assistant."},
{"role": "user", "content": "Write a Python function that merges two sorted lists in O(n) time."}
],
"temperature": 0.3,
"max_tokens": 1024
}'
{
"id": "chatcmpl-abc123",
"object": "chat.completion",
"model": "gpt-5.5",
"choices": [
{
"index": 0,
"message": {
"role": "assistant",
"content": "def merge_sorted(a, b):\n result = []\n i = j = 0\n while i < len(a) and j < len(b):\n if a[i] <= b[j]:\n result.append(a[i]); i += 1\n else:\n result.append(b[j]); j += 1\n result.extend(a[i:])\n result.extend(b[j:])\n return result"
},
"finish_reason": "stop"
}
],
"usage": {
"prompt_tokens": 38,
"completion_tokens": 95,
"total_tokens": 133
}
}
Hermes Agent에서 GPT를 세 단계로 사용하기
RunAPI를 커스텀 공급자로 추가
Hermes Agent에 이미 custom:runapi 공급자가 설정되어 있다면 동일한 key로 GPT를 사용할 수 있습니다. 그렇지 않은 경우 base_url을 https://runapi.ai/v1로, key_env를 RUNAPI_API_KEY로, api_mode를 chat_completions로 설정하여 커스텀 공급자를 추가하세요.
export RUNAPI_API_KEY=runapi_xxx
GPT 모델 선택
주력 모델로 gpt-5.5를, 비용 절감을 위해 gpt-5.4 또는 gpt-5.4-mini를, 코드 집중 작업에는 gpt-5.3-codex를 기본 모델로 설정하세요. /v1/chat/completions 엔드포인트는 사용량 카운트와 finish_reason이 포함된 표준 OpenAI 응답을 반환합니다.
default: gpt-5.5
스트리밍 또는 함수 호출 사용
Hermes Agent가 custom:runapi 공급자를 통해 stream, tools, response_format 파라미터를 전달합니다. 모든 표준 OpenAI Chat Completions 파라미터가 RunAPI를 통해 수정 없이 작동합니다.
"stream": true
GPT Chat Completions 파라미터
| 파라미터 | 유형 | 설명 |
|---|---|---|
model |
string |
필수. gpt-5.5, gpt-5.4, gpt-5.4-mini, gpt-5.4-nano, gpt-5.3-codex, 또는 gpt-5.2. |
messages |
array |
필수. role(system, user, assistant)과 content 필드가 있는 메시지 객체 배열. |
temperature |
number |
선택 사항. 0~2 사이의 샘플링 온도. 낮을수록 결정론적 출력이 생성됩니다. 기본값 1. |
max_tokens |
integer |
선택 사항. 완성에서 생성할 최대 토큰 수. |
stream |
boolean |
선택 사항. true이면 증분 토큰 델타가 포함된 서버 전송 이벤트를 반환합니다. 기본값 false. |
tools |
array |
선택 사항. 함수 호출용 도구 정의 배열. 각 도구에는 type, 함수 이름, 설명, 파라미터 스키마가 있습니다. |
response_format |
object |
선택 사항. 구조화된 JSON 출력을 위해 type을 "json_object" 또는 "json_schema"로 설정하세요. |
reasoning_effort |
string |
선택 사항. 지원 모델의 사고 깊이를 제어합니다. 허용 값은 low, medium, high. |
Hermes Agent의 GPT란?
GPT는 OpenAI의 LLM 패밀리로 RunAPI의 custom:runapi provider를 통해 공식 토큰당 가격의 절반으로 제공됩니다. Hermes Agent는 표준 chat_completions API 모드로 연결하므로 GPT-5.5·5.4·5.4-mini·5.3-codex 모두 스트리밍·함수 호출·구조화 JSON 출력·비전 입력을 지원하며——모두 Claude나 Gemini와 동일한 provider 설정을 사용합니다.
GPT 활용 사례
Codex 모델을 활용한 Agentic Coding
Hermes Agent에서 GPT-5.3-codex를 코드 생성·리팩터링·자동화된 PR 워크플로에 사용하며, 플래그십 모델보다 낮은 비용으로 실행합니다.
구조화 출력을 활용한 일괄 처리
GPT의 json_schema 응답 형식으로 대량 문서를 처리해 RAG 파이프라인·청구서 파싱·콘텐츠 분류를 위한 구조화 데이터를 대규모로 추출합니다.
작업 복잡도별 동적 라우팅
간단한 쿼리는 비용 효율을 위해 GPT-5.4-mini로, 복잡한 추론 작업은 품질을 위해 GPT-5.5로 라우팅하며——모두 동일한 custom:runapi provider와 API 키를 통해 처리합니다.
GPT + Hermes Agent 자주 묻는 질문
네. Hermes Agent는 OpenAI 호환 커스텀 공급자를 지원합니다. base_url을 https://runapi.ai/v1로, key_env를 RUNAPI_API_KEY로, api_mode를 chat_completions로 설정하여 RunAPI를 custom:runapi로 추가하세요. 기본 모델을 gpt-5.5로 설정하세요.
RunAPI는 모든 GPT 모델에 대해 공식 OpenAI 토큰당 요금의 50%를 청구합니다. 할인은 입력 및 출력 토큰 모두에 적용됩니다. 정확한 백만 토큰당 요금은 RunAPI 가격 페이지를 확인하세요.
네. custom:runapi 공급자는 모든 GPT 변형에서 작동합니다. 요청의 model 필드만 변경하면 됩니다 — gpt-5.5, gpt-5.4, gpt-5.4-mini, 또는 gpt-5.3-codex. base URL, API key, api_mode는 동일하게 유지됩니다.
네. RunAPI는 /v1/responses에서 OpenAI Responses API도 프록시합니다. Hermes Agent가 Responses API 인터페이스를 지원하는 경우 엔드포인트를 https://runapi.ai/v1/responses로 설정하세요. 동일한 API key와 커스텀 공급자가 두 엔드포인트 모두에서 작동합니다.
네. 함수 호출을 위해 tools 배열을 전달하거나 구조화된 출력을 위해 response_format을 json_schema로 설정하세요. RunAPI가 이 파라미터들을 GPT 모델로 전달하고 표준 OpenAI 응답 형식으로 tool_calls 또는 구조화된 JSON을 반환합니다.
지금 Hermes Agent에서 GPT-5.5를 사용해보세요.
무료 RunAPI key를 발급받고, custom:runapi 공급자를 설정하여 공식 OpenAI 토큰 가격의 절반으로 GPT-5.5를 호출하세요 — 스트리밍, 함수 호출, 구조화된 출력 포함.