Hermes Agent에서 Claude를 사용하세요.
Anthropic Claude는 최고 성능을 위한 Opus 4.8(200K 컨텍스트, 확장 사고), 균형 잡힌 성능의 Sonnet 4.6, 속도 중심의 Haiku 4.5를 제공합니다. Hermes Agent는 채팅용으로 설정한 동일한 key와 base_url로 custom:runapi 공급자를 통해 Anthropic 공식 토큰당 요금의 50%로 Claude를 호출합니다.
Use RunAPI to send a Claude chat completion request through Hermes Agent.
Requirements:
- Use the custom:runapi provider already configured in Hermes Agent
- Call the RunAPI chat completions endpoint at https://runapi.ai/v1/chat/completions
- Set model to "claude-opus-4.8"
- The RUNAPI_API_KEY environment variable provides authorization
- The response is synchronous — the assistant message is returned directly in the response body
- For streaming, set "stream": true to receive server-sent events
curl -X POST https://runapi.ai/v1/chat/completions \
-H "Authorization: Bearer $RUNAPI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "claude-opus-4.8",
"max_tokens": 1024,
"messages": [
{"role": "user", "content": "Explain the difference between a mutex and a semaphore in three sentences."}
]
}'
{
"id": "chatcmpl-abc123",
"object": "chat.completion",
"model": "claude-opus-4.8",
"choices": [
{
"index": 0,
"message": {
"role": "assistant",
"content": "A mutex is a locking mechanism that allows only one thread to access a resource at a time..."
},
"finish_reason": "stop"
}
],
"usage": {
"prompt_tokens": 24,
"completion_tokens": 87,
"total_tokens": 111
}
}
Hermes Agent에서 Claude를 세 단계로 사용하기
RunAPI 설정
RUNAPI_API_KEY 환경 변수를 설정하세요. 이미 Hermes Agent에 RunAPI를 custom:runapi 공급자로 추가했다면 동일한 key와 base_url로 Claude를 사용할 수 있습니다 — Hermes 설정에서 model 파라미터를 claude-opus-4.8로 변경하거나 /model 명령어를 사용하세요.
export RUNAPI_API_KEY=runapi_xxx
Claude 호출
model을 claude-opus-4.8로 설정하고 최소 하나의 사용자 메시지가 포함된 messages 배열을 포함하여 /v1/chat/completions로 POST 요청을 보내세요. max_tokens로 응답 길이를 제어하세요. Hermes 세션에서 토큰 단위 SSE 출력을 위해 "stream" true를 추가하세요.
POST /v1/chat/completions
응답 읽기
엔드포인트는 어시스턴트 메시지를 동기적으로 반환합니다 — 작업 폴링이 필요하지 않습니다. Hermes Agent가 응답을 인라인으로 표시합니다. 응답에는 청구 투명성을 위한 토큰 사용량 카운트가 포함됩니다. 스트리밍 응답은 실시간 표시를 위해 SSE 이벤트로 도착합니다.
usage.total_tokens: 111
Claude API 파라미터 (OpenAI 호환)
| 파라미터 | 유형 | 설명 |
|---|---|---|
model |
string |
필수. claude-opus-4.8, claude-sonnet-4.6, claude-haiku-4.5, 또는 RunAPI 카탈로그에 있는 모든 Claude 변형. |
messages |
array |
필수. role(system, user, assistant)과 content 필드가 있는 메시지 객체 배열. |
max_tokens |
integer |
응답의 최대 토큰 수. 기본값은 모델마다 다릅니다 — 예측 가능한 청구를 위해 명시적으로 설정하세요. |
stream |
boolean |
true이면 단일 JSON 응답 대신 증분 토큰 델타가 포함된 서버 전송 이벤트를 반환합니다. |
temperature |
float |
0~1 사이의 샘플링 온도. 낮을수록 결정론적 출력이 생성됩니다. |
top_p |
float |
핵 샘플링 컷오프. temperature의 대안 — 둘 중 하나만 사용하세요. |
Hermes Agent의 Claude란?
Claude는 Anthropic의 LLM으로, Hermes Agent는 custom:runapi provider를 통해 공식 Anthropic 토큰당 가격의 절반으로 호출합니다. 세 가지 티어——Opus 4.8(200K 컨텍스트·확장 사고)·Sonnet 4.6(속도와 품질의 균형)·Haiku 4.5(빠르고 저렴함)——모두 동일한 provider 설정으로 사용할 수 있습니다. model 필드만 변경하면 요청별로 전환할 수 있으며 재설정이 필요 없습니다.
Claude 활용 사례
도구 호출과 MCP를 활용한 AI 에이전트 구축
Hermes Agent에서 Claude의 함수 호출과 모델 컨텍스트 프로토콜 지원을 사용해 파일 읽기·데이터베이스 쿼리·추론 기반 행동을 수행하는 멀티 스텝 자동화 워크플로를 구축합니다.
코드 생성 및 리뷰
코딩 작업을 Hermes Agent를 통해 Claude에 라우팅합니다——Opus 4.8은 복잡한 아키텍처 결정과 멀티 파일 리팩터링·Sonnet 4.6은 일상적인 PR 리뷰와 테스트 생성에 사용합니다.
프롬프트 캐싱을 활용한 콘텐츠 생성
프롬프트 캐싱을 사용해 마케팅 카피·문서·보고서를 대규모로 생성하며, 시스템 프롬프트와 컨텍스트가 여러 요청에 걸쳐 동일하게 유지될 때 비용을 절감합니다.
Claude + Hermes Agent 자주 묻는 질문
네. Hermes Agent에서 base_url https://runapi.ai/v1과 api_mode chat_completions로 RunAPI를 custom:runapi 공급자로 설정하세요. model을 claude-opus-4.8이나 다른 Claude 변형으로 설정하세요. 동일한 RUNAPI_API_KEY가 채팅, 이미지, 영상, 음악 모델을 모두 처리합니다.
RunAPI는 Anthropic 공식 토큰당 요금의 50%를 청구합니다. Opus 4.8은 RunAPI를 통해 입력/출력 백만 토큰당 $7.50/$37.50이며, 직접 구매 시 $15/$75입니다. 구독이나 볼륨 약정이 필요하지 않습니다.
아니요. Hermes 설정에서 model 파라미터만 변경하거나 세션 중 /model 명령어를 사용하세요. custom:runapi 공급자, base_url, API key는 모든 Claude 변형 — Opus 4.8, Sonnet 4.6, Haiku 4.5, 날짜 스냅샷 — 에서 동일하게 유지됩니다.
RunAPI는 /v1/chat/completions(OpenAI 호환, Hermes Agent의 chat_completions 모드에서 사용)와 /v1/messages(네이티브 Anthropic 형식) 모두를 제공합니다. 네이티브 엔드포인트는 확장 사고와 Anthropic 전용 기능을 지원합니다. Hermes Agent의 경우 OpenAI 호환 경로가 표준 채팅과 스트리밍을 처리합니다.
복잡한 다중 파일 리팩토링과 아키텍처 결정에는 Opus 4.8. 일상적인 코딩 — PR 리뷰, 테스트 생성, 버그 수정 — 에는 Sonnet 4.6. 깊이보다 지연 시간이 중요한 빠른 자동 완성과 인라인 제안에는 Haiku 4.5.
지금 Hermes Agent에서 Claude를 사용해보세요.
무료 RunAPI key를 발급받고, custom:runapi 공급자를 설정하여 공식 Anthropic 요금의 50%로 Claude를 사용하세요.