在 Hermes Agent 中使用 GPT。
GPT-5.5 是 OpenAI 的旗艦 LLM,透過 RunAPI 提供,每 token 價格僅為官方的一半。Hermes Agent 透過 custom:runapi 供應商以 chat_completions 模式連接——一個設定區塊即可解鎖所有 GPT 變體(5.5、5.4、5.4-mini、5.3-codex),支援串流、函式呼叫與結構化輸出。
Use RunAPI to call GPT-5.5 through the OpenAI-compatible Chat Completions endpoint.
Requirements:
- Read the API key from RUNAPI_API_KEY.
- Use the custom:runapi provider with base_url https://runapi.ai/v1.
- Call POST https://runapi.ai/v1/chat/completions
- Set model to "gpt-5.5".
- Include a messages array with at least one user message.
- The response is synchronous — the completion arrives in the same HTTP response.
- For streaming, set "stream": true to receive server-sent events.
- For the Responses API, call POST https://runapi.ai/v1/responses instead.
curl -X POST https://runapi.ai/v1/chat/completions \
-H "Authorization: Bearer $RUNAPI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-5.5",
"messages": [
{"role": "system", "content": "You are a concise coding assistant."},
{"role": "user", "content": "Write a Python function that merges two sorted lists in O(n) time."}
],
"temperature": 0.3,
"max_tokens": 1024
}'
{
"id": "chatcmpl-abc123",
"object": "chat.completion",
"model": "gpt-5.5",
"choices": [
{
"index": 0,
"message": {
"role": "assistant",
"content": "def merge_sorted(a, b):\n result = []\n i = j = 0\n while i < len(a) and j < len(b):\n if a[i] <= b[j]:\n result.append(a[i]); i += 1\n else:\n result.append(b[j]); j += 1\n result.extend(a[i:])\n result.extend(b[j:])\n return result"
},
"finish_reason": "stop"
}
],
"usage": {
"prompt_tokens": 38,
"completion_tokens": 95,
"total_tokens": 133
}
}
三步驟在 Hermes Agent 中使用 GPT
將 RunAPI 加為自訂供應商
如果 custom:runapi 供應商已在 Hermes Agent 中設定,相同的 key 即可用於 GPT。否則,新增自訂供應商並設定 base_url 為 https://runapi.ai/v1,key_env 設為 RUNAPI_API_KEY,api_mode 設為 chat_completions。
export RUNAPI_API_KEY=runapi_xxx
選擇 GPT 模型
將預設模型設為 gpt-5.5 使用旗艦版,gpt-5.4 或 gpt-5.4-mini 降低成本,或 gpt-5.3-codex 處理程式碼密集任務。/v1/chat/completions 端點回傳標準 OpenAI 回應,包含使用量統計與 finish_reason。
default: gpt-5.5
使用串流或函式呼叫
Hermes Agent 透過 custom:runapi 供應商轉發 stream、tools 與 response_format 參數。所有標準 OpenAI Chat Completions 參數均可透過 RunAPI 直接使用,無需修改。
"stream": true
GPT Chat Completions 參數
| 參數 | 類型 | 說明 |
|---|---|---|
model |
string |
必填。gpt-5.5、gpt-5.4、gpt-5.4-mini、gpt-5.4-nano、gpt-5.3-codex 或 gpt-5.2。 |
messages |
array |
必填。訊息物件陣列,每個物件包含 role(system、user、assistant)與 content 欄位。 |
temperature |
number |
選填。取樣溫度,介於 0 到 2 之間。較低的值產生更具確定性的輸出。預設為 1。 |
max_tokens |
integer |
選填。completion 中生成的最大 token 數量。 |
stream |
boolean |
選填。設為 true 時,以 server-sent events 回傳增量 token 差異。預設為 false。 |
tools |
array |
選填。函式呼叫的工具定義陣列。每個工具包含 type、函式名稱、描述與參數 schema。 |
response_format |
object |
選填。將 type 設為 "json_object" 或 "json_schema" 以取得結構化 JSON 輸出。 |
reasoning_effort |
string |
選填。控制支援模型的思考深度。接受的值為 low、medium、high。 |
Hermes Agent 上的 GPT 是什麼?
GPT 是 OpenAI 的 LLM 系列,通過 RunAPI 的 custom:runapi provider 以官方單 token 價格的一半提供。Hermes Agent 使用標準 chat_completions API 模式連接,因此 GPT-5.5、5.4、5.4-mini 和 5.3-codex 均支持流式輸出、函數呼叫、結構化 JSON 輸出和視覺輸入——全部通過與 Claude 或 Gemini 相同的 provider 設定。
GPT 使用場景
使用 Codex 模型進行 agent 編程
通過 Hermes Agent 使用 GPT-5.3-codex 完成代碼生成、重構和自動化 PR 工作流,成本低於旗艦模型。
結構化輸出批量處理
通過 GPT 的 json_schema 響應格式處理大量文檔,為 RAG 工作流程、發票解析或內容分類在規模上提取結構化數據。
按任務複雜度動態路由
將簡單查詢路由到 GPT-5.4-mini 以節省成本,將複雜推理任務路由到 GPT-5.5 以保證質量——全部通過同一個 custom:runapi provider 和 API key。
GPT + Hermes Agent 常見問題
可以。Hermes Agent 支援自訂的相容 OpenAI 供應商。將 RunAPI 以 custom:runapi 加入,設定 base_url 為 https://runapi.ai/v1,key_env 設為 RUNAPI_API_KEY,api_mode 設為 chat_completions。將預設模型設為 gpt-5.5。
RunAPI 對所有 GPT 模型收取 OpenAI 官方每 token 費率的 50%。此折扣適用於輸入與輸出 token。請查看 RunAPI 定價頁面以了解每百萬 token 的確切費率。
可以。custom:runapi 供應商適用於所有 GPT 變體。只需更改請求中的 model 欄位——gpt-5.5、gpt-5.4、gpt-5.4-mini 或 gpt-5.3-codex。base URL、API key 與 api_mode 保持不變。
可以。RunAPI 也在 /v1/responses 代理 OpenAI Responses API。如果 Hermes Agent 支援 Responses API 介面,將端點設為 https://runapi.ai/v1/responses。相同的 API key 與自訂供應商適用於兩個端點。
可以。傳入 tools 陣列進行函式呼叫,或將 response_format 設為 json_schema 取得結構化輸出。RunAPI 將這些參數轉發給 GPT 模型,並以標準 OpenAI 回應格式回傳 tool_calls 或結構化 JSON。
立即在 Hermes Agent 中試用 GPT-5.5。
取得免費 RunAPI key,設定 custom:runapi 供應商,以 OpenAI 官方 token 價格的一半呼叫 GPT-5.5——含串流、函式呼叫與結構化輸出。