快取輸入
重複的提示前綴以較低的輸入費率計費。RunAPI 以 OpenAI 快取費率的 50% 傳遞此折扣。
GPT-5.4 每百萬 token 輸入費用 $2.50,輸出 $15;GPT-5.5 為 $5 和 $30。RunAPI 以官方費率的一半鏡像所有 GPT 模型——相同 API、相同輸出,發票上減少 50%。
OpenAI 按每百萬 token 為每個 GPT 模型定價,輸入和輸出費率不同,快取輸入費率更低。以下所有數字均為每百萬 token,即 OpenAI 使用的計費單位。
透過 RunAPI,GPT-5.4 輸入 $1.25/M,輸出 $7.50/M。官方費率為 $2.50/$15。
GPT-5.4-mini 費率遠低於旗艦模型,透過 RunAPI 享有 50% 折扣。
透過 RunAPI,GPT-5.5 輸入 $2.50/M,輸出 $15/M。官方費率為 $5/$30。
快取輸入 token 費率遠低於標準輸入——在 RunAPI 上傳遞 50% 折扣。
下表顯示 OpenAI 官方定價與 RunAPI 定價的對比。RunAPI 對所有 GPT 模型統一提供 50% 折扣。無需批量承諾,無需訂閱。
| 模型 | 官方輸入 /M | 官方輸出 /M | RunAPI 輸入 /M | RunAPI 輸出 /M | 上下文視窗 |
|---|---|---|---|---|---|
| GPT-5.5 | $5.00 | $30.00 | $2.50 | $15.00 | 400K |
| GPT-5.4 | $2.50 | $15.00 | $1.25 | $7.50 | 400K |
| GPT-5.4-mini | $0.25 | $2.00 | $0.13 | $1.00 | 400K |
| GPT-5.3-codex | $2.50 | $15.00 | $1.25 | $7.50 | 400K |
OpenAI 對快取輸入 token 收費較低,並對可接受延遲回應的批次請求提供大幅折扣。這對編碼代理和批量處理等重複性工作負載尤為重要。
重複的提示前綴以較低的輸入費率計費。RunAPI 以 OpenAI 快取費率的 50% 傳遞此折扣。
提交到 Batch API 的請求以標準費率的一半計費,回應時間最長 24 小時。RunAPI 在其自身折扣之上傳遞此折扣。
GPT-5 模型允許你設定推理力度。較低的力度產生較少的推理 token,直接降低計量計費的輸出費用。
每次請求設定最大輸出 token 上限,以控制費用並避免長時間代理任務產生過多輸出。
費率在與實際任務掛鉤之前顯得抽象。以下是常見開發者工作負載在兩種使用量層級下以 RunAPI 費率計費的預估月費。
| 工作負載 | 模型 | 輕度使用(每天約 50 個任務) | 重度使用(每天約 200 個任務) | 與官方相比每月節省 |
|---|---|---|---|---|
| 程式碼代理(Codex) | GPT-5.3-codex | $20/月 | $80/月 | $20–$80 |
| 客戶服務聊天機器人 | GPT-5.4-mini | $6/月 | $24/月 | $6–$24 |
| RAG 知識助理 | GPT-5.4 | $18/月 | $72/月 | $18–$72 |
| 內容生成 pipeline | GPT-5.4 | $25/月 | $100/月 | $25–$100 |
| 多代理協調器 | GPT-5.5 | $90/月 | $360/月 | $90–$360 |
開發者在 GPT 與 Claude 和 Gemini 之間進行比較。以下是旗艦模型在每百萬 token 費用方面的比較,並附上 RunAPI 費率。
| 供應商 | 旗艦模型 | 輸入 /M | 輸出 /M | RunAPI 費率 |
|---|---|---|---|---|
| OpenAI | GPT-5.4 | $2.50 | $15.00 | $1.25 / $7.50 |
| Anthropic | Claude Opus 4.7 | $10.00 | $50.00 | $5.00 / $25.00 |
| Gemini 2.5 Pro | $1.25 | $10.00 | $0.63 / $5.00 |
RunAPI 對上表所有供應商提供 50% 折扣。價格已於 2026 年 6 月驗證。
在 runapi.ai 註冊。免費方案無需信用卡。
前往 Dashboard → API Keys。建立金鑰並儲存——你將以此作為 OpenAI API key 使用。
將基礎 URL 設定為 https://api.runapi.ai/v1 並使用你的 RunAPI 金鑰。任何相容 OpenAI 的客戶端都可使用。
在模型參數中使用 gpt-5.4、gpt-5.5 或任何 GPT 模型 ID。RunAPI 以官方費率的 50% 處理路由和計費。
GPT-5.4 官方費用為每百萬輸入 token $2.50,每百萬輸出 token $15。GPT-5.5 為 $5 和 $30。透過 RunAPI,每個 GPT 模型均以這些費率的一半計費——GPT-5.4 每百萬 token 輸入 $1.25,輸出 $7.50。
RunAPI 與模型供應商協商批量定價,並將節省的費用傳遞給開發者。請求到達相同的 OpenAI 模型,輸出、安全過濾器和行為完全相同,因此唯一的區別是你發票上更低的費率。沒有任何品質取捨,也沒有單獨的計費層級——折扣自動應用於每個 GPT 模型。
有。OpenAI 對重複的提示前綴以較低的快取輸入費率計費,這降低了重複傳送相同上下文的代理的費用。RunAPI 以 OpenAI 快取費率的 50% 傳遞快取折扣,因此快取節省與基礎折扣疊加。
Batch API 以換取最長 24 小時回應時間為代價,以標準費率的 50% 計費。它適合不需要即時回應的批量任務。RunAPI 傳遞此折扣,因此批量工作以已折扣費率的一半計費。
在旗艦輸入 token 上,GPT-5.4 的 $2.50 介於 Gemini 2.5 Pro 的 $1.25 和 Claude Opus 的 $10 之間。最便宜的選擇取決於模型層級和工作負載。RunAPI 將三者的費率都減半,因此相對排名保持不變。
可以。RunAPI 與 OpenAI 相容。將任何 OpenAI 客戶端指向 https://api.runapi.ai/v1,使用你的 RunAPI 金鑰並傳入 GPT 模型 ID。已使用 OpenAI SDK 的現有程式碼除基礎 URL 和金鑰外無需任何修改,因此遷移一個已建立的專案大約只需一分鐘。
可以。GPT-5.3-codex 可透過 RunAPI 以官方費率的 50% 使用,即每百萬 token 輸入 $1.25,輸出 $7.50。透過在設定中覆蓋基礎 URL 和金鑰,它可與 Codex 和其他相容 OpenAI 的程式碼工具搭配使用。快取輸入和批次折扣也會傳遞,進一步降低重複程式碼作業的實際費用。
有。新 RunAPI 帳戶在承諾使用前可獲得免費點數來測試任何 GPT 模型。之後,完全按使用量計費,無最低消費、無訂閱、無月費承諾——你為帳戶儲值,每次呼叫扣除其 token 費用。你可以隨時充值任意金額,並在儀表板中按模型查看使用情況。