緩存讀取
輸入 token 享 90% 折扣。透過 RunAPI,Sonnet 4.6 的緩存讀取費用為 $0.30/M,而非 $3.00/M。
Anthropic 根據模型收取每百萬 token $3 至 $15 的費用。RunAPI 以官方費率的一半映射每個 Claude 模型——相同 API、相同輸出、帳單少 50%。
Anthropic 針對三個模型層級公佈每 token 價格:Haiku 適用於輕量級任務,Sonnet 適用於均衡工作負載,Opus 適用於最高能力需求。以下所有價格均為每百萬 token,即 Anthropic 使用的計費單位。
透過 RunAPI,Haiku 4.5 輸入 $1/M,輸出 $5/M。官方費率為 $2/$10。
透過 RunAPI,Sonnet 4.6 輸入 $3/M,輸出 $15/M。官方費率為 $6/$30。
透過 RunAPI,Opus 4.7 輸入 $5/M,輸出 $25/M。官方費率為 $10/$50。
緩存讀取比標準輸入 token 便宜 90%——透過 RunAPI,Haiku 的緩存讀取為 $0.10/M。
下表顯示 Anthropic 官方定價和 RunAPI 定價。RunAPI 對所有 Claude 模型一律提供 50% 折扣。無需批量承諾,無需訂閱。
| 模型 | 官方輸入 /M | 官方輸出 /M | RunAPI 輸入 /M | RunAPI 輸出 /M | 上下文視窗 |
|---|---|---|---|---|---|
| Opus 4.8 | $15.00 | $75.00 | $7.50 | $37.50 | 200K |
| Opus 4.7 | $10.00 | $50.00 | $5.00 | $25.00 | 200K |
| Opus 4.6 | $10.00 | $50.00 | $5.00 | $25.00 | 200K |
| Sonnet 4.6 | $6.00 | $30.00 | $3.00 | $15.00 | 200K |
| Sonnet 4.5 | $6.00 | $30.00 | $3.00 | $15.00 | 200K |
| Haiku 4.5 | $2.00 | $10.00 | $1.00 | $5.00 | 200K |
Anthropic 的提示緩存會儲存重複的前置內容,當緩存版本被重用時收費更低。這對 Claude Code 等編程 Agent 尤為重要,因為它們每次請求都會發送相同的系統提示和文件上下文。
輸入 token 享 90% 折扣。透過 RunAPI,Sonnet 4.6 的緩存讀取費用為 $0.30/M,而非 $3.00/M。
輸入費用附加 25% 溢價——透過 RunAPI,Sonnet 4.6 為 $3.75/M。緩存前置內容可保留 5 分鐘。
為輸入費率的 2 倍——透過 RunAPI,Sonnet 4.6 為 $6.00/M。適合上下文重用頻繁的長時間編程會話。
Anthropic 對可容忍最長 24 小時回應時間的批量請求,所有模型均提供 50% 折扣。RunAPI 將此折扣原封不動傳遞給用戶。
在與實際任務掛鉤之前,token 費用看起來很抽象。以下是五種常見開發者工作負載在兩個使用量級別下的每月估計費用。
| 工作負載 | 模型 | 輕度使用(每天約 50 個任務) | 重度使用(每天約 200 個任務) | 相比官方的每月節省 |
|---|---|---|---|---|
| 氛圍編程會話(Claude Code) | Sonnet 4.6 | $45/月 | $180/月 | $45–$180 |
| PR 代碼審查 Agent | Opus 4.7 | $75/月 | $300/月 | $75–$300 |
| RAG 驅動的文件聊天機器人 | Haiku 4.5 | $12/月 | $48/月 | $12–$48 |
| 內容生成流水線 | Sonnet 4.6 | $30/月 | $120/月 | $30–$120 |
| 多 Agent 協調器 | Opus 4.7 | $150/月 | $600/月 | $150–$600 |
開發者常將 Claude 與 GPT-5 和 Gemini 2.5 Pro 進行比較。以下是旗艦模型在每百萬 token 費用上的對比。
| 供應商 | 旗艦模型 | 輸入 /M | 輸出 /M | RunAPI 費率 |
|---|---|---|---|---|
| Anthropic | Claude Opus 4.7 | $10.00 | $50.00 | $5.00 / $25.00 |
| OpenAI | GPT-5.4 | $2.50 | $15.00 | $1.25 / $7.50 |
| Gemini 2.5 Pro | $1.25 | $10.00 | $0.63 / $5.00 |
RunAPI 對以上所有供應商均提供 50% 折扣。價格已於 2026 年 6 月核實。
Claude Max 每月 $100,提供無限制的 Claude Code 使用(或 $200 的 5x 方案)。API 按 token 收費。對於每月在 Sonnet 4.6 上產生不足 1000 萬輸出 token 的開發者,RunAPI 路線的費用低於 Max 訂閱——且任何模型層級均無使用上限。
在 Claude Code 中無限使用 Sonnet,以及有限度使用 Opus。固定月費。無 API 訪問。
按 token 付費,無月度承諾。Sonnet 4.6 輸入 $3/M,輸出 $15/M。$100 可購買約 670 萬個輸出 token——對大多數個人開發者而言已綽綽有餘。
每月持續超過 1000 萬個輸出 token 的重度日常用戶。透過 RunAPI 使用 Sonnet 4.6 的盈虧平衡點約為 670 萬個輸出 token。
團隊、CI 流水線、多模型設置,以及希望同時訪問 Opus 或 Haiku 與 Sonnet 的開發者。無上限、無候補名單、無訂閱綁定。
在 runapi.ai 註冊。免費方案無需信用卡。
前往 Dashboard → API Keys。創建一個密鑰並保存——你將以此作為 OpenAI API key。
將 base URL 設定為 https://api.runapi.ai/v1,並使用你的 RunAPI API key。任何兼容 OpenAI 的客戶端均可使用——Python、Node.js、Go、Ruby 或 curl。
在 model 參數中使用 claude-sonnet-4-6、claude-opus-4-7 或任何 Claude 模型 ID。RunAPI 以官方費率的 50% 處理路由和計費。
不。RunAPI 直接將請求代理至 Anthropic 的 API。模型輸出、安全過濾器及行為與直接呼叫 Anthropic 完全相同。
RunAPI 與模型供應商協商批量定價,並將節省的費用傳遞給開發者。質量沒有任何差異——相同的模型,相同的 API。
可以。將 ANTHROPIC_BASE_URL 設定為 https://api.runapi.ai,並以你的 RunAPI 密鑰作為 API key。Claude Code 無需任何修改即可使用。
RunAPI 會在 24 小時內調整。50% 折扣相對於 Anthropic 公佈的費率保持不變。
有。新帳戶可獲得免費積分,用於測試任何模型。之後按使用量付費,無最低消費。
有。緩存讀取、5 分鐘寫入和 1 小時寫入均受支持,費率為 Anthropic 緩存定價的 50%。
可以。RunAPI 兼容 OpenAI。將任何 OpenAI 客戶端指向 api.runapi.ai/v1,並使用 Claude 模型 ID 即可。
按使用量付費。你為帳戶充值後,每次 API 呼叫都會扣除 token 費用。無需訂閱、無發票、無合約。
創建免費 RunAPI 帳戶,獲取你的 API key,以官方 Anthropic 定價的 50% 開始呼叫 Claude Opus、Sonnet 或 Haiku。