HERMES + CLAUDE

在 Hermes Agent 中使用 Claude。

Anthropic Claude 提供 Opus 4.8 的頂級能力(200K 上下文、延伸思考)、Sonnet 4.6 的均衡效能,以及 Haiku 4.5 的速度。Hermes Agent 透過 custom:runapi 供應商呼叫 Claude,定價為 Anthropic 官方每 token 費率的 50%——與您為聊天設定的相同 key 與 base_url。

一個 API key · 相容 OpenAI 端點 · 每 token 計費五折
Use RunAPI to send a Claude chat completion request through Hermes Agent.

Requirements:
- Use the custom:runapi provider already configured in Hermes Agent
- Call the RunAPI chat completions endpoint at https://runapi.ai/v1/chat/completions
- Set model to "claude-opus-4.8"
- The RUNAPI_API_KEY environment variable provides authorization
- The response is synchronous — the assistant message is returned directly in the response body
- For streaming, set "stream": true to receive server-sent events
curl -X POST https://runapi.ai/v1/chat/completions \
  -H "Authorization: Bearer $RUNAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "claude-opus-4.8",
    "max_tokens": 1024,
    "messages": [
      {"role": "user", "content": "Explain the difference between a mutex and a semaphore in three sentences."}
    ]
  }'
{
  "id": "chatcmpl-abc123",
  "object": "chat.completion",
  "model": "claude-opus-4.8",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "A mutex is a locking mechanism that allows only one thread to access a resource at a time..."
      },
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 24,
    "completion_tokens": 87,
    "total_tokens": 111
  }
}
複製 curl 指令進行測試 claude
運作原理

三步驟在 Hermes Agent 中使用 Claude

1

設定 RunAPI

設定 RUNAPI_API_KEY 環境變數。如果您已在 Hermes Agent 中將 RunAPI 加為 custom:runapi 供應商,相同的 key 與 base_url 即可用於 Claude——在 Hermes 設定中將 model 參數切換為 claude-opus-4.8,或使用 /model 指令。

export RUNAPI_API_KEY=runapi_xxx
2

呼叫 Claude

發送 POST 請求至 /v1/chat/completions,將 model 設為 claude-opus-4.8。包含至少一則使用者訊息的 messages 陣列。設定 max_tokens 控制回應長度。加入 "stream" true 以在 Hermes 工作階段中取得逐 token 的 SSE 輸出。

POST /v1/chat/completions
3

讀取回應

端點同步回傳助理訊息——無需輪詢任務。Hermes Agent 會內嵌顯示回應。回應中包含 token 使用量統計以確保計費透明。串流回應以 SSE 事件形式送達,實現即時顯示。

usage.total_tokens: 111
參數

Claude API 參數(相容 OpenAI)

參數 類型 說明
model string 必填。claude-opus-4.8、claude-sonnet-4.6、claude-haiku-4.5,或 RunAPI 目錄中列出的任何 Claude 變體。
messages array 必填。訊息物件陣列,每個物件包含 role(system、user、assistant)與 content 欄位。
max_tokens integer 回應中的最大 token 數量。預設值依模型而異——請明確設定以確保計費可預測。
stream boolean 設為 true 時,以 server-sent events 回傳增量 token 差異,而非單一 JSON 回應。
temperature float 取樣溫度,介於 0 到 1 之間。較低的值產生更具確定性的輸出。
top_p float 核取樣截斷值。替代 temperature 使用——兩者擇一,不要同時使用。

Hermes Agent 上的 Claude 是什麼?

Claude 是 Anthropic 的 LLM,Hermes Agent 通過 custom:runapi provider 以官方 Anthropic 單 token 價格的一半呼叫它。三個檔位——Opus 4.8(200K 上下文、擴展思考)、Sonnet 4.6(平衡速度與質量)、Haiku 4.5(快速低成本)——全部通過同一個 provider 設定。只需修改 model 字段即可在各檔位間按請求切換,無需重新設定。

Claude 使用場景

構建帶工具呼叫和 MCP 的 AI agent

在 Hermes Agent 中使用 Claude 的函數呼叫和模型上下文協議支持,構建能讀取文件、查詢數據庫並基於推理採取行動的多步驟自動化工作流。

代碼生成與審查

將編程任務通過 Hermes Agent 路由給 Claude——Opus 4.8 用於複雜架構決策和多文件重構,Sonnet 4.6 用於日常 PR 審查和測試生成。

帶提示詞緩存的內容生成

使用提示詞緩存大批量生成營銷文案、文檔或報告,在系統提示詞和上下文跨多次請求保持不變時降低成本。

FAQ

Claude + Hermes Agent 常見問題

Hermes Agent 通用設定

尚未設定?請從 Hermes Agent 的 RunAPI 設定指南開始。

Hermes Agent 設定指南 →

Claude 模型目錄

查看所有 Claude 變體、每 token 定價與上下文視窗詳情。

Claude models →

立即在 Hermes Agent 中試用 Claude。

取得免費 RunAPI key,設定 custom:runapi 供應商,以 Anthropic 官方費率的 50% 開始使用 Claude。