緩存輸入
重複的提示前置內容按較低的輸入費率計費。RunAPI 以 OpenAI 緩存費率的 50% 傳遞折扣。
GPT-5.4 每百萬 token 輸入 $2.50,輸出 $15;GPT-5.5 為 $5 和 $30。RunAPI 以官方費率的一半映射每個 GPT 模型——相同 API、相同輸出、帳單少 50%。
OpenAI 按每百萬 token 對每個 GPT 模型定價,輸入和輸出費率分開,並提供較低的緩存輸入費率。以下所有數字均為每百萬 token,即 OpenAI 使用的計費單位。
透過 RunAPI,GPT-5.4 輸入 $1.25/M,輸出 $7.50/M。官方費率為 $2.50/$15。
GPT-5.4-mini 費率遠低於旗艦版,透過 RunAPI 享 50% 折扣。
透過 RunAPI,GPT-5.5 輸入 $2.50/M,輸出 $15/M。官方費率為 $5/$30。
緩存輸入 token 的費用遠低於標準輸入——透過 RunAPI 享 50% 折扣。
下表顯示 OpenAI 官方定價和 RunAPI 定價。RunAPI 對所有 GPT 模型一律提供 50% 折扣。無需批量承諾,無需訂閱。
| 模型 | 官方輸入 /M | 官方輸出 /M | RunAPI 輸入 /M | RunAPI 輸出 /M | 上下文視窗 |
|---|---|---|---|---|---|
| GPT-5.5 | $5.00 | $30.00 | $2.50 | $15.00 | 400K |
| GPT-5.4 | $2.50 | $15.00 | $1.25 | $7.50 | 400K |
| GPT-5.4-mini | $0.25 | $2.00 | $0.13 | $1.00 | 400K |
| GPT-5.3-codex | $2.50 | $15.00 | $1.25 | $7.50 | 400K |
OpenAI 對緩存的輸入 token 收費較低,並對可容忍延遲回應的批量請求提供深度折扣。兩者對於重複性工作負載(如編程 Agent 和批量處理)都很重要。
重複的提示前置內容按較低的輸入費率計費。RunAPI 以 OpenAI 緩存費率的 50% 傳遞折扣。
提交到 Batch API 的請求以標準費率的一半運行,回應時間最長 24 小時。RunAPI 在自身折扣之上傳遞此折扣。
GPT-5 模型讓你設置推理力度。較低的力度會產生更少的推理 token,直接降低按量計費的輸出費用。
限制每次請求的最大輸出 token 數量,以控制費用並避免長時間代理任務中的失控生成。
token 費率在與實際任務掛鉤之前看起來很抽象。以下是常見開發者工作負載在兩個使用量級別下,按 RunAPI 費率計費的每月估計費用。
| 工作負載 | 模型 | 輕度使用(每天約 50 個任務) | 重度使用(每天約 200 個任務) | 相比官方的每月節省 |
|---|---|---|---|---|
| 編程 Agent(Codex) | GPT-5.3-codex | $20/月 | $80/月 | $20–$80 |
| 客戶支持聊天機器人 | GPT-5.4-mini | $6/月 | $24/月 | $6–$24 |
| RAG 知識助手 | GPT-5.4 | $18/月 | $72/月 | $18–$72 |
| 內容生成流水線 | GPT-5.4 | $25/月 | $100/月 | $25–$100 |
| 多 Agent 協調器 | GPT-5.5 | $90/月 | $360/月 | $90–$360 |
開發者將 GPT 與 Claude 和 Gemini 進行權衡比較。以下是旗艦模型在每百萬 token 費用上的對比,並附上 RunAPI 費率。
| 供應商 | 旗艦模型 | 輸入 /M | 輸出 /M | RunAPI 費率 |
|---|---|---|---|---|
| OpenAI | GPT-5.4 | $2.50 | $15.00 | $1.25 / $7.50 |
| Anthropic | Claude Opus 4.7 | $10.00 | $50.00 | $5.00 / $25.00 |
| Gemini 2.5 Pro | $1.25 | $10.00 | $0.63 / $5.00 |
RunAPI 對以上所有供應商均提供 50% 折扣。價格已於 2026 年 6 月核實。
在 runapi.ai 註冊。免費方案無需信用卡。
前往 Dashboard → API Keys。創建一個密鑰並保存——你將以此作為 OpenAI API key。
將 base URL 設定為 https://api.runapi.ai/v1,並使用你的 RunAPI 密鑰。任何兼容 OpenAI 的客戶端均可使用。
在 model 參數中使用 gpt-5.4、gpt-5.5 或任何 GPT 模型 ID。RunAPI 以官方費率的 50% 處理路由和計費。
GPT-5.4 的官方定價為每百萬輸入 token $2.50,每百萬輸出 token $15。GPT-5.5 為 $5 和 $30。透過 RunAPI,每個 GPT 模型均以這些費率的一半計費——GPT-5.4 的輸入為 $1.25/M,輸出為 $7.50/M。
RunAPI 與模型供應商協商批量定價,並將節省的費用傳遞給開發者。請求到達相同的 OpenAI 模型,輸出、安全過濾器和行為完全相同,因此唯一的差異是你帳單上更低的費率。沒有質量上的取捨,也沒有單獨的計費層級——折扣自動應用於每個 GPT 模型。
有。OpenAI 對重複的提示前置內容按較低的緩存輸入費率計費,這對重新發送相同上下文的 Agent 降低了費用。RunAPI 以 OpenAI 緩存費率的 50% 傳遞緩存折扣,因此緩存節省與基礎折扣疊加。
Batch API 以標準費率的 50% 運行請求,換取最長 24 小時的回應時間。它適合不需要即時回應的批量任務。RunAPI 傳遞此折扣,因此批量工作按已打折費率的一半計費。
就旗艦輸入 token 而言,GPT-5.4 的 $2.50 介於 Gemini 2.5 Pro 的 $1.25 和 Claude Opus 的 $10 之間。最便宜的選擇取決於模型層級和工作負載。RunAPI 將三者的費率均減半,因此相對排名保持不變。
可以。RunAPI 兼容 OpenAI。將任何 OpenAI 客戶端指向 https://api.runapi.ai/v1,使用你的 RunAPI 密鑰,並傳遞 GPT 模型 ID。已使用 OpenAI SDK 的現有代碼除了 base URL 和密鑰外無需任何修改,因此遷移一個現有項目大約需要一分鐘。
可以。GPT-5.3-codex 透過 RunAPI 以官方費率的 50% 提供,即每百萬 token 輸入 $1.25,輸出 $7.50。透過覆蓋其設置中的 base URL 和密鑰,它可與 Codex 和其他兼容 OpenAI 的編程工具配合使用。緩存輸入和批量折扣也會傳遞,進一步降低重複編程會話的實際費用。
有。新 RunAPI 帳戶在承諾之前可獲得免費積分以測試任何 GPT 模型。之後,計費嚴格按使用量付費,無最低消費、無訂閱、無月度承諾——你充值一個餘額,每次呼叫扣除其 token 費用。你可以充值任意金額,並在 Dashboard 中按模型查看使用情況。