在 Hermes Agent 中使用 Claude。
Anthropic Claude 提供 Opus 4.8 的頂級能力(200K 上下文、延伸思考)、Sonnet 4.6 的均衡效能,以及 Haiku 4.5 的速度。Hermes Agent 透過 custom:runapi 供應商呼叫 Claude,定價為 Anthropic 官方每 token 費率的 50%——與您為聊天設定的相同 key 與 base_url。
Use RunAPI to send a Claude chat completion request through Hermes Agent.
Requirements:
- Use the custom:runapi provider already configured in Hermes Agent
- Call the RunAPI chat completions endpoint at https://runapi.ai/v1/chat/completions
- Set model to "claude-opus-4.8"
- The RUNAPI_API_KEY environment variable provides authorization
- The response is synchronous — the assistant message is returned directly in the response body
- For streaming, set "stream": true to receive server-sent events
curl -X POST https://runapi.ai/v1/chat/completions \
-H "Authorization: Bearer $RUNAPI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "claude-opus-4.8",
"max_tokens": 1024,
"messages": [
{"role": "user", "content": "Explain the difference between a mutex and a semaphore in three sentences."}
]
}'
{
"id": "chatcmpl-abc123",
"object": "chat.completion",
"model": "claude-opus-4.8",
"choices": [
{
"index": 0,
"message": {
"role": "assistant",
"content": "A mutex is a locking mechanism that allows only one thread to access a resource at a time..."
},
"finish_reason": "stop"
}
],
"usage": {
"prompt_tokens": 24,
"completion_tokens": 87,
"total_tokens": 111
}
}
三步驟在 Hermes Agent 中使用 Claude
設定 RunAPI
設定 RUNAPI_API_KEY 環境變數。如果您已在 Hermes Agent 中將 RunAPI 加為 custom:runapi 供應商,相同的 key 與 base_url 即可用於 Claude——在 Hermes 設定中將 model 參數切換為 claude-opus-4.8,或使用 /model 指令。
export RUNAPI_API_KEY=runapi_xxx
呼叫 Claude
發送 POST 請求至 /v1/chat/completions,將 model 設為 claude-opus-4.8。包含至少一則使用者訊息的 messages 陣列。設定 max_tokens 控制回應長度。加入 "stream" true 以在 Hermes 工作階段中取得逐 token 的 SSE 輸出。
POST /v1/chat/completions
讀取回應
端點同步回傳助理訊息——無需輪詢任務。Hermes Agent 會內嵌顯示回應。回應中包含 token 使用量統計以確保計費透明。串流回應以 SSE 事件形式送達,實現即時顯示。
usage.total_tokens: 111
Claude API 參數(相容 OpenAI)
| 參數 | 類型 | 說明 |
|---|---|---|
model |
string |
必填。claude-opus-4.8、claude-sonnet-4.6、claude-haiku-4.5,或 RunAPI 目錄中列出的任何 Claude 變體。 |
messages |
array |
必填。訊息物件陣列,每個物件包含 role(system、user、assistant)與 content 欄位。 |
max_tokens |
integer |
回應中的最大 token 數量。預設值依模型而異——請明確設定以確保計費可預測。 |
stream |
boolean |
設為 true 時,以 server-sent events 回傳增量 token 差異,而非單一 JSON 回應。 |
temperature |
float |
取樣溫度,介於 0 到 1 之間。較低的值產生更具確定性的輸出。 |
top_p |
float |
核取樣截斷值。替代 temperature 使用——兩者擇一,不要同時使用。 |
Hermes Agent 上的 Claude 是什麼?
Claude 是 Anthropic 的 LLM,Hermes Agent 透過 custom:runapi provider 以官方 Anthropic 每 token 價格的一半呼叫它。三個層級——Opus 4.8(200K 上下文、延伸思考)、Sonnet 4.6(速度與品質平衡)和 Haiku 4.5(快速且低成本)——全部透過相同的 provider 設定運作。只需更改 model 欄位即可在請求間切換,無需重新設定。
Claude 使用情境
構建使用工具呼叫和 MCP 的 AI 代理
在 Hermes Agent 中使用 Claude 的函數呼叫和 Model Context Protocol 支援,構建讀取檔案、查詢資料庫並基於推理採取行動的多步驟自動化工作流程。
程式碼生成與審查
在 Hermes Agent 中將程式設計任務路由至 Claude——Opus 4.8 用於複雜的架構決策和多檔案重構,Sonnet 4.6 用於日常的 Pull Request 審查和測試生成。
使用提示詞快取的內容生成
透過提示詞快取大規模生成行銷文案、文件或報告,在多個請求中系統提示詞和上下文保持不變時降低成本。
Claude + Hermes Agent 常見問題
可以。在 Hermes Agent 中將 RunAPI 設定為 custom:runapi 供應商,base_url 設為 https://runapi.ai/v1,api_mode 設為 chat_completions。將 model 設為 claude-opus-4.8 或任何其他 Claude 變體。相同的 RUNAPI_API_KEY 可處理聊天、圖像、影片與音樂模型。
RunAPI 收取 Anthropic 官方每 token 費率的 50%。Opus 4.8 透過 RunAPI 的費用為每百萬輸入/輸出 token $7.50/$37.50,而直接使用為 $15/$75。無需訂閱或量級承諾。
不需要。只需更改 Hermes 設定中的 model 參數,或在工作階段中使用 /model 指令。custom:runapi 供應商、base_url 與 API key 在所有 Claude 變體之間保持不變——Opus 4.8、Sonnet 4.6、Haiku 4.5 及日期快照。
RunAPI 同時提供 /v1/chat/completions(相容 OpenAI,由 Hermes Agent 的 chat_completions 模式使用)與 /v1/messages(原生 Anthropic 格式)。原生端點支援延伸思考與 Anthropic 專屬功能。對於 Hermes Agent,相容 OpenAI 的路徑涵蓋標準聊天與串流。
Opus 4.8 適合複雜的多檔案重構與架構決策。Sonnet 4.6 適合日常編碼——pull request 審查、測試生成與 bug 修復。Haiku 4.5 適合快速自動完成與行內建議,適用於延遲比深度更重要的場景。
立即在 Hermes Agent 中試用 Claude。
取得免費 RunAPI key,設定 custom:runapi 供應商,以 Anthropic 官方費率的 50% 開始使用 Claude。