缓存读取
输入 token 享受 90% 折扣。通过 RunAPI,Sonnet 4.6 缓存读取费用为 $0.30/M,而非标准的 $3.00/M。
Anthropic 根据模型不同,每百万 token 收费 $3 至 $15。RunAPI 以官方费率的一半镜像所有 Claude 模型——相同的 API,相同的输出,账单直降 50%。
Anthropic 为三个模型层级发布按 token 计费的价格:Haiku 适合轻量任务,Sonnet 适合均衡负载,Opus 提供最强能力。以下所有价格均为每百万 token,这是 Anthropic 使用的计费单位。
通过 RunAPI,Haiku 4.5 输入 $1/M,输出 $5/M。官方费率为 $2/$10。
通过 RunAPI,Sonnet 4.6 输入 $3/M,输出 $15/M。官方费率为 $6/$30。
通过 RunAPI,Opus 4.7 输入 $5/M,输出 $25/M。官方费率为 $10/$50。
缓存读取费用比标准输入 token 低 90%——通过 RunAPI,Haiku 仅需 $0.10/M。
下表展示了 Anthropic 官方定价与 RunAPI 定价对比。RunAPI 对所有 Claude 模型统一提供 50% 折扣,无量承诺,无订阅要求。
| 模型 | 官方输入 /M | 官方输出 /M | RunAPI 输入 /M | RunAPI 输出 /M | 上下文窗口 |
|---|---|---|---|---|---|
| Opus 4.8 | $15.00 | $75.00 | $7.50 | $37.50 | 200K |
| Opus 4.7 | $10.00 | $50.00 | $5.00 | $25.00 | 200K |
| Opus 4.6 | $10.00 | $50.00 | $5.00 | $25.00 | 200K |
| Sonnet 4.6 | $6.00 | $30.00 | $3.00 | $15.00 | 200K |
| Sonnet 4.5 | $6.00 | $30.00 | $3.00 | $15.00 | 200K |
| Haiku 4.5 | $2.00 | $10.00 | $1.00 | $5.00 | 200K |
Anthropic 的提示词缓存功能会存储重复出现的前缀,并在复用缓存版本时收取更低费用。对于像 Claude Code 这样的编码智能体来说意义重大,因为它们每次请求都会发送相同的系统提示和文件上下文。
输入 token 享受 90% 折扣。通过 RunAPI,Sonnet 4.6 缓存读取费用为 $0.30/M,而非标准的 $3.00/M。
在输入基础上附加 25% 的费用——通过 RunAPI,Sonnet 4.6 为 $3.75/M。缓存前缀有效期为 5 分钟。
为标准输入费率的 2 倍——通过 RunAPI,Sonnet 4.6 为 $6.00/M。适合频繁复用上下文的长时间编码会话。
Anthropic 对可接受最长 24 小时响应延迟的批量请求,所有模型提供 50% 的折扣。RunAPI 将此折扣透传给用户。
token 费用看起来很抽象,直到你将其与实际任务关联起来。以下是五种常见开发者使用场景,以及两种使用量级下的估算月费用。
| 使用场景 | 模型 | 轻度使用(约 50 任务/天) | 重度使用(约 200 任务/天) | 相比官方的月节省 |
|---|---|---|---|---|
| Vibe coding 会话(Claude Code) | Sonnet 4.6 | $45/月 | $180/月 | $45–$180 |
| PR 代码审查智能体 | Opus 4.7 | $75/月 | $300/月 | $75–$300 |
| RAG 文档聊天机器人 | Haiku 4.5 | $12/月 | $48/月 | $12–$48 |
| 内容生成流水线 | Sonnet 4.6 | $30/月 | $120/月 | $30–$120 |
| 多智能体编排器 | Opus 4.7 | $150/月 | $600/月 | $150–$600 |
开发者常将 Claude 与 GPT-5 和 Gemini 2.5 Pro 进行比较。以下是各旗舰模型按每百万 token 计价的对比情况。
| 提供商 | 旗舰模型 | 输入 /M | 输出 /M | RunAPI 费率 |
|---|---|---|---|---|
| Anthropic | Claude Opus 4.7 | $10.00 | $50.00 | $5.00 / $25.00 |
| OpenAI | GPT-5.4 | $2.50 | $15.00 | $1.25 / $7.50 |
| Gemini 2.5 Pro | $1.25 | $10.00 | $0.63 / $5.00 |
RunAPI 对上述所有提供商统一提供 50% 折扣。价格已于 2026 年 6 月核实。
Claude Max 每月 $100,可无限制使用 Claude Code(5x 方案为 $200)。API 按 token 计费。对于每月 Sonnet 4.6 输出 token 不足 1000 万的开发者,通过 RunAPI 的费用低于 Max 订阅——且任何模型层级均无使用上限。
在 Claude Code 中无限制使用 Sonnet,Opus 有限制。固定月费,无 API 访问。
按 token 付费,无月度承诺。Sonnet 4.6 输入 $3/M,输出 $15/M。$100 大约可购买 670 万个输出 token——对大多数个人开发者来说已经足够。
每天大量使用且持续超过 1000 万输出 token 的重度用户。Sonnet 4.6 通过 RunAPI 的盈亏平衡点约为 670 万输出 token。
团队、CI 流水线、多模型场景,以及希望同时访问 Opus 或 Haiku 与 Sonnet 的开发者。无上限,无等待,无订阅锁定。
在 runapi.ai 注册。免费套餐无需信用卡。
前往「控制台 → API 密钥」,创建并保存密钥——你将把它用作 OpenAI API 密钥。
将 base URL 设置为 https://api.runapi.ai/v1,并使用你的 RunAPI API 密钥。任何兼容 OpenAI 的客户端均可使用——Python、Node.js、Go、Ruby 或 curl。
在 model 参数中使用 claude-sonnet-4-6、claude-opus-4-7 或任意 Claude 模型 ID。RunAPI 以官方费率的 50% 处理路由和计费。
不会。RunAPI 直接将请求代理至 Anthropic 的 API。模型输出、安全过滤器和行为与直接调用 Anthropic 完全一致。
RunAPI 与模型提供商协商批量定价,并将节省的费用转让给开发者。质量没有任何差异——相同的模型,相同的 API。
可以。将 ANTHROPIC_BASE_URL 设置为 https://api.runapi.ai,并将你的 RunAPI 密钥作为 API 密钥。Claude Code 无需任何修改即可使用。
RunAPI 会在 24 小时内进行调整。相对于 Anthropic 公布的费率,50% 的折扣始终保持。
有。新账户可获得免费额度以测试任意模型。之后按纯按量付费计费,无最低消费限制。
支持。缓存读取、5 分钟写入和 1 小时写入均以 Anthropic 缓存定价的 50% 计费。
可以。RunAPI 兼容 OpenAI 接口。将任意 OpenAI 客户端指向 api.runapi.ai/v1 并使用 Claude 模型 ID 即可。
按量付费。你为账户充值余额,每次 API 调用扣除相应 token 费用。无订阅、无账单、无合同。
创建免费 RunAPI 账户,获取 API 密钥,以官方 Anthropic 定价的 50% 开始调用 Claude Opus、Sonnet 或 Haiku。