LLM API 定價

2026 年 OpenAI API 定價

GPT-5.4 每百萬 token 輸入 $2.50，輸出 $15；GPT-5.5 為 $5 和 $30。RunAPI 以官方費率的一半映射每個 GPT 模型——相同 API、相同輸出、帳單少 50%。

獲取 API key——免費閱讀 API 文件

更新於 June 18, 2026 RunAPI Editorial

一覽

OpenAI API 目前的費用是多少？

OpenAI 按每百萬 token 對每個 GPT 模型定價，輸入和輸出費率分開，並提供較低的緩存輸入費率。以下所有數字均為每百萬 token，即 OpenAI 使用的計費單位。

最受歡迎

透過 RunAPI，GPT-5.4 輸入 $1.25/M，輸出 $7.50/M。官方費率為 $2.50/$15。

最低價選項

GPT-5.4-mini 費率遠低於旗艦版，透過 RunAPI 享 50% 折扣。

最高能力

透過 RunAPI，GPT-5.5 輸入 $2.50/M，輸出 $15/M。官方費率為 $5/$30。

緩存折扣

緩存輸入 token 的費用遠低於標準輸入——透過 RunAPI 享 50% 折扣。

按模型逐一細分

每個 GPT 模型每百萬 token 的費用是多少？

下表顯示 OpenAI 官方定價和 RunAPI 定價。RunAPI 對所有 GPT 模型一律提供 50% 折扣。無需批量承諾，無需訂閱。

模型	官方輸入 /M	官方輸出 /M	RunAPI 輸入 /M	RunAPI 輸出 /M	上下文視窗
GPT-5.5	$5.00	$30.00	$2.50	$15.00	400K
GPT-5.4	$2.50	$15.00	$1.25	$7.50	400K
GPT-5.4-mini	$0.25	$2.00	$0.13	$1.00	400K
GPT-5.3-codex	$2.50	$15.00	$1.25	$7.50	400K

OpenAI 官方定價 ↗ RunAPI 定價 ↗

緩存與批量

緩存和批量折扣如何降低你的 GPT 帳單？

OpenAI 對緩存的輸入 token 收費較低，並對可容忍延遲回應的批量請求提供深度折扣。兩者對於重複性工作負載（如編程 Agent 和批量處理）都很重要。

緩存輸入

重複的提示前置內容按較低的輸入費率計費。RunAPI 以 OpenAI 緩存費率的 50% 傳遞折扣。

Batch API（50% 折扣）

提交到 Batch API 的請求以標準費率的一半運行，回應時間最長 24 小時。RunAPI 在自身折扣之上傳遞此折扣。

推理力度

GPT-5 模型讓你設置推理力度。較低的力度會產生更少的推理 token，直接降低按量計費的輸出費用。

輸出 token 控制

限制每次請求的最大輸出 token 數量，以控制費用並避免長時間代理任務中的失控生成。

真實場景費用

GPT API 在真實工作負載下的費用是多少？

token 費率在與實際任務掛鉤之前看起來很抽象。以下是常見開發者工作負載在兩個使用量級別下，按 RunAPI 費率計費的每月估計費用。

工作負載	模型	輕度使用（每天約 50 個任務）	重度使用（每天約 200 個任務）	相比官方的每月節省
編程 Agent（Codex）	GPT-5.3-codex	$20/月	$80/月	$20–$80
客戶支持聊天機器人	GPT-5.4-mini	$6/月	$24/月	$6–$24
RAG 知識助手	GPT-5.4	$18/月	$72/月	$18–$72
內容生成流水線	GPT-5.4	$25/月	$100/月	$25–$100
多 Agent 協調器	GPT-5.5	$90/月	$360/月	$90–$360

供應商比較

OpenAI API 比 Claude 和 Gemini 便宜嗎？

開發者將 GPT 與 Claude 和 Gemini 進行權衡比較。以下是旗艦模型在每百萬 token 費用上的對比，並附上 RunAPI 費率。

供應商	旗艦模型	輸入 /M	輸出 /M	RunAPI 費率
OpenAI	GPT-5.4	$2.50	$15.00	$1.25 / $7.50
Anthropic	Claude Opus 4.7	$10.00	$50.00	$5.00 / $25.00
Google	Gemini 2.5 Pro	$1.25	$10.00	$0.63 / $5.00

RunAPI 對以上所有供應商均提供 50% 折扣。價格已於 2026 年 6 月核實。

快速開始

如何透過 RunAPI 使用 GPT API

創建 RunAPI 帳戶

在 runapi.ai 註冊。免費方案無需信用卡。

複製你的 API key

前往 Dashboard → API Keys。創建一個密鑰並保存——你將以此作為 OpenAI API key。

將你的 SDK 指向 RunAPI

將 base URL 設定為 https://api.runapi.ai/v1，並使用你的 RunAPI 密鑰。任何兼容 OpenAI 的客戶端均可使用。

開始發送請求

在 model 參數中使用 gpt-5.4、gpt-5.5 或任何 GPT 模型 ID。RunAPI 以官方費率的 50% 處理路由和計費。

常見問題

OpenAI API 定價 FAQ

OpenAI GPT-5 API 的費用是多少？

GPT-5.4 的官方定價為每百萬輸入 token $2.50，每百萬輸出 token $15。GPT-5.5 為 $5 和 $30。透過 RunAPI，每個 GPT 模型均以這些費率的一半計費——GPT-5.4 的輸入為 $1.25/M，輸出為 $7.50/M。

為什麼 RunAPI 比 OpenAI 便宜 50%？

RunAPI 與模型供應商協商批量定價，並將節省的費用傳遞給開發者。請求到達相同的 OpenAI 模型，輸出、安全過濾器和行為完全相同，因此唯一的差異是你帳單上更低的費率。沒有質量上的取捨，也沒有單獨的計費層級——折扣自動應用於每個 GPT 模型。

GPT-5 有緩存定價嗎？

有。OpenAI 對重複的提示前置內容按較低的緩存輸入費率計費，這對重新發送相同上下文的 Agent 降低了費用。RunAPI 以 OpenAI 緩存費率的 50% 傳遞緩存折扣，因此緩存節省與基礎折扣疊加。

OpenAI Batch API 折扣是如何運作的？

Batch API 以標準費率的 50% 運行請求，換取最長 24 小時的回應時間。它適合不需要即時回應的批量任務。RunAPI 傳遞此折扣，因此批量工作按已打折費率的一半計費。

GPT 比 Claude 或 Gemini 便宜嗎？

就旗艦輸入 token 而言，GPT-5.4 的 $2.50 介於 Gemini 2.5 Pro 的 $1.25 和 Claude Opus 的 $10 之間。最便宜的選擇取決於模型層級和工作負載。RunAPI 將三者的費率均減半，因此相對排名保持不變。

我可以將 OpenAI SDK 與 RunAPI 一起使用嗎？

可以。RunAPI 兼容 OpenAI。將任何 OpenAI 客戶端指向 https://api.runapi.ai/v1，使用你的 RunAPI 密鑰，並傳遞 GPT 模型 ID。已使用 OpenAI SDK 的現有代碼除了 base URL 和密鑰外無需任何修改，因此遷移一個現有項目大約需要一分鐘。

RunAPI 支持 GPT-5.3-codex 用於編程嗎？

可以。GPT-5.3-codex 透過 RunAPI 以官方費率的 50% 提供，即每百萬 token 輸入 $1.25，輸出 $7.50。透過覆蓋其設置中的 base URL 和密鑰，它可與 Codex 和其他兼容 OpenAI 的編程工具配合使用。緩存輸入和批量折扣也會傳遞，進一步降低重複編程會話的實際費用。

是否有免費方案？

有。新 RunAPI 帳戶在承諾之前可獲得免費積分以測試任何 GPT 模型。之後，計費嚴格按使用量付費，無最低消費、無訂閱、無月度承諾——你充值一個餘額，每次呼叫扣除其 token 費用。你可以充值任意金額，並在 Dashboard 中按模型查看使用情況。

以半價運行 GPT-5。

創建免費 RunAPI 帳戶，獲取你的 API key，以官方定價的 50% 呼叫任何 OpenAI GPT 模型。

獲取免費 API key 比較定價