HERMES + GPT

在 Hermes Agent 中使用 GPT。

GPT-5.5 是 OpenAI 的旗艦 LLM,透過 RunAPI 提供,每 token 價格僅為官方的一半。Hermes Agent 透過 custom:runapi 供應商以 chat_completions 模式連接——一個設定區塊即可解鎖所有 GPT 變體(5.5、5.4、5.4-mini、5.3-codex),支援串流、函式呼叫與結構化輸出。

一個 API key · 相容 OpenAI · 串流回應
Use RunAPI to call GPT-5.5 through the OpenAI-compatible Chat Completions endpoint.

Requirements:
- Read the API key from RUNAPI_API_KEY.
- Use the custom:runapi provider with base_url https://runapi.ai/v1.
- Call POST https://runapi.ai/v1/chat/completions
- Set model to "gpt-5.5".
- Include a messages array with at least one user message.
- The response is synchronous — the completion arrives in the same HTTP response.
- For streaming, set "stream": true to receive server-sent events.
- For the Responses API, call POST https://runapi.ai/v1/responses instead.
curl -X POST https://runapi.ai/v1/chat/completions \
  -H "Authorization: Bearer $RUNAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-5.5",
    "messages": [
      {"role": "system", "content": "You are a concise coding assistant."},
      {"role": "user", "content": "Write a Python function that merges two sorted lists in O(n) time."}
    ],
    "temperature": 0.3,
    "max_tokens": 1024
  }'
{
  "id": "chatcmpl-abc123",
  "object": "chat.completion",
  "model": "gpt-5.5",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "def merge_sorted(a, b):\n    result = []\n    i = j = 0\n    while i < len(a) and j < len(b):\n        if a[i] <= b[j]:\n            result.append(a[i]); i += 1\n        else:\n            result.append(b[j]); j += 1\n    result.extend(a[i:])\n    result.extend(b[j:])\n    return result"
      },
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 38,
    "completion_tokens": 95,
    "total_tokens": 133
  }
}
複製 curl 指令進行測試 gpt
運作原理

三步驟在 Hermes Agent 中使用 GPT

1

將 RunAPI 加為自訂供應商

如果 custom:runapi 供應商已在 Hermes Agent 中設定,相同的 key 即可用於 GPT。否則,新增自訂供應商並設定 base_url 為 https://runapi.ai/v1,key_env 設為 RUNAPI_API_KEY,api_mode 設為 chat_completions。

export RUNAPI_API_KEY=runapi_xxx
2

選擇 GPT 模型

將預設模型設為 gpt-5.5 使用旗艦版,gpt-5.4 或 gpt-5.4-mini 降低成本,或 gpt-5.3-codex 處理程式碼密集任務。/v1/chat/completions 端點回傳標準 OpenAI 回應,包含使用量統計與 finish_reason。

default: gpt-5.5
3

使用串流或函式呼叫

Hermes Agent 透過 custom:runapi 供應商轉發 stream、tools 與 response_format 參數。所有標準 OpenAI Chat Completions 參數均可透過 RunAPI 直接使用,無需修改。

"stream": true
參數

GPT Chat Completions 參數

參數 類型 說明
model string 必填。gpt-5.5、gpt-5.4、gpt-5.4-mini、gpt-5.4-nano、gpt-5.3-codex 或 gpt-5.2。
messages array 必填。訊息物件陣列,每個物件包含 role(system、user、assistant)與 content 欄位。
temperature number 選填。取樣溫度,介於 0 到 2 之間。較低的值產生更具確定性的輸出。預設為 1。
max_tokens integer 選填。completion 中生成的最大 token 數量。
stream boolean 選填。設為 true 時,以 server-sent events 回傳增量 token 差異。預設為 false。
tools array 選填。函式呼叫的工具定義陣列。每個工具包含 type、函式名稱、描述與參數 schema。
response_format object 選填。將 type 設為 "json_object" 或 "json_schema" 以取得結構化 JSON 輸出。
reasoning_effort string 選填。控制支援模型的思考深度。接受的值為 low、medium、high。

Hermes Agent 上的 GPT 是什麼?

GPT 是 OpenAI 的 LLM 家族,透過 RunAPI 的 custom:runapi provider 以官方每 token 價格的一半提供。Hermes Agent 使用標準的 chat_completions API 模式連接,讓你透過與 Claude 或 Gemini 相同的 provider 設定,取得 GPT-5.5、5.4、5.4-mini 和 5.3-codex,支援串流傳輸、函數呼叫、結構化 JSON 輸出和視覺輸入。

GPT 使用情境

使用 Codex 模型進行代理式程式設計

透過 Hermes Agent 使用 GPT-5.3-codex 進行程式碼生成、重構和自動化 PR 工作流程,每 token 成本低於旗艦模型。

含結構化輸出的批次處理

透過 GPT 以 json_schema 回應格式處理大量文件集,大規模提取結構化資料,用於 RAG 流程、發票解析或內容分類。

依任務複雜度動態選擇模型

將簡單查詢路由至 GPT-5.4-mini 以降低成本,將複雜推理任務路由至 GPT-5.5 以確保品質,全部透過同一個 custom:runapi provider 和 API key。

FAQ

GPT + Hermes Agent 常見問題

Hermes Agent 通用設定

尚未設定?請從 Hermes Agent 的 RunAPI 設定指南開始。

Hermes Agent 設定指南 →

GPT 模型目錄

查看所有 GPT 變體、每 token 定價與 API 文件。

GPT on RunAPI →

立即在 Hermes Agent 中試用 GPT-5.5。

取得免費 RunAPI key,設定 custom:runapi 供應商,以 OpenAI 官方 token 價格的一半呼叫 GPT-5.5——含串流、函式呼叫與結構化輸出。