LLM API 定价

2026 年 Claude API 定价

Anthropic 根据模型不同,每百万 token 收费 $3 至 $15。RunAPI 以官方费率的一半镜像所有 Claude 模型——相同的 API,相同的输出,账单直降 50%。

更新于 June 18, 2026 RunAPI Editorial
一览

Claude API 现在的费用是多少?

Anthropic 为三个模型层级发布按 token 计费的价格:Haiku 适合轻量任务,Sonnet 适合均衡负载,Opus 提供最强能力。以下所有价格均为每百万 token,这是 Anthropic 使用的计费单位。

最低价选项

通过 RunAPI,Haiku 4.5 输入 $1/M,输出 $5/M。官方费率为 $2/$10。

最受欢迎

通过 RunAPI,Sonnet 4.6 输入 $3/M,输出 $15/M。官方费率为 $6/$30。

最强能力

通过 RunAPI,Opus 4.7 输入 $5/M,输出 $25/M。官方费率为 $10/$50。

缓存折扣

缓存读取费用比标准输入 token 低 90%——通过 RunAPI,Haiku 仅需 $0.10/M。

逐模型对比

每个 Claude 模型每百万 token 的费用是多少?

下表展示了 Anthropic 官方定价与 RunAPI 定价对比。RunAPI 对所有 Claude 模型统一提供 50% 折扣,无量承诺,无订阅要求。

模型 官方输入 /M 官方输出 /M RunAPI 输入 /M RunAPI 输出 /M 上下文窗口
Opus 4.8 $15.00 $75.00 $7.50 $37.50 200K
Opus 4.7 $10.00 $50.00 $5.00 $25.00 200K
Opus 4.6 $10.00 $50.00 $5.00 $25.00 200K
Sonnet 4.6 $6.00 $30.00 $3.00 $15.00 200K
Sonnet 4.5 $6.00 $30.00 $3.00 $15.00 200K
Haiku 4.5 $2.00 $10.00 $1.00 $5.00 200K
提示词缓存

缓存折扣如何降低你的 Claude API 账单?

Anthropic 的提示词缓存功能会存储重复出现的前缀,并在复用缓存版本时收取更低费用。对于像 Claude Code 这样的编码智能体来说意义重大,因为它们每次请求都会发送相同的系统提示和文件上下文。

缓存读取

输入 token 享受 90% 折扣。通过 RunAPI,Sonnet 4.6 缓存读取费用为 $0.30/M,而非标准的 $3.00/M。

缓存写入(5 分钟有效期)

在输入基础上附加 25% 的费用——通过 RunAPI,Sonnet 4.6 为 $3.75/M。缓存前缀有效期为 5 分钟。

缓存写入(1 小时有效期)

为标准输入费率的 2 倍——通过 RunAPI,Sonnet 4.6 为 $6.00/M。适合频繁复用上下文的长时间编码会话。

批量处理

Anthropic 对可接受最长 24 小时响应延迟的批量请求,所有模型提供 50% 的折扣。RunAPI 将此折扣透传给用户。

真实使用成本

Claude API 在真实场景中实际费用是多少?

token 费用看起来很抽象,直到你将其与实际任务关联起来。以下是五种常见开发者使用场景,以及两种使用量级下的估算月费用。

使用场景 模型 轻度使用(约 50 任务/天) 重度使用(约 200 任务/天) 相比官方的月节省
Vibe coding 会话(Claude Code) Sonnet 4.6 $45/月 $180/月 $45–$180
PR 代码审查智能体 Opus 4.7 $75/月 $300/月 $75–$300
RAG 文档聊天机器人 Haiku 4.5 $12/月 $48/月 $12–$48
内容生成流水线 Sonnet 4.6 $30/月 $120/月 $30–$120
多智能体编排器 Opus 4.7 $150/月 $600/月 $150–$600
提供商对比

Claude API 比 OpenAI 和 Gemini 更便宜吗?

开发者常将 Claude 与 GPT-5 和 Gemini 2.5 Pro 进行比较。以下是各旗舰模型按每百万 token 计价的对比情况。

提供商 旗舰模型 输入 /M 输出 /M RunAPI 费率
Anthropic Claude Opus 4.7 $10.00 $50.00 $5.00 / $25.00
OpenAI GPT-5.4 $2.50 $15.00 $1.25 / $7.50
Google Gemini 2.5 Pro $1.25 $10.00 $0.63 / $5.00

RunAPI 对上述所有提供商统一提供 50% 折扣。价格已于 2026 年 6 月核实。

订阅 vs API

Claude API 比 Claude Max 订阅更便宜吗?

Claude Max 每月 $100,可无限制使用 Claude Code(5x 方案为 $200)。API 按 token 计费。对于每月 Sonnet 4.6 输出 token 不足 1000 万的开发者,通过 RunAPI 的费用低于 Max 订阅——且任何模型层级均无使用上限。

Claude Max($100/月)

在 Claude Code 中无限制使用 Sonnet,Opus 有限制。固定月费,无 API 访问。

通过 RunAPI 使用 Claude API

按 token 付费,无月度承诺。Sonnet 4.6 输入 $3/M,输出 $15/M。$100 大约可购买 670 万个输出 token——对大多数个人开发者来说已经足够。

Max 更划算的场景

每天大量使用且持续超过 1000 万输出 token 的重度用户。Sonnet 4.6 通过 RunAPI 的盈亏平衡点约为 670 万输出 token。

API 更划算的场景

团队、CI 流水线、多模型场景,以及希望同时访问 Opus 或 Haiku 与 Sonnet 的开发者。无上限,无等待,无订阅锁定。

快速上手

如何通过 RunAPI 访问 Claude API

1

创建 RunAPI 账户

在 runapi.ai 注册。免费套餐无需信用卡。

2

复制你的 API 密钥

前往「控制台 → API 密钥」,创建并保存密钥——你将把它用作 OpenAI API 密钥。

3

将你的 SDK 指向 RunAPI

将 base URL 设置为 https://api.runapi.ai/v1,并使用你的 RunAPI API 密钥。任何兼容 OpenAI 的客户端均可使用——Python、Node.js、Go、Ruby 或 curl。

4

开始发起请求

在 model 参数中使用 claude-sonnet-4-6、claude-opus-4-7 或任意 Claude 模型 ID。RunAPI 以官方费率的 50% 处理路由和计费。

常见问题

Claude API 定价常见问题

RunAPI 会修改 Claude 的输出吗?

不会。RunAPI 直接将请求代理至 Anthropic 的 API。模型输出、安全过滤器和行为与直接调用 Anthropic 完全一致。

为什么 RunAPI 比官方 API 便宜 50%?

RunAPI 与模型提供商协商批量定价,并将节省的费用转让给开发者。质量没有任何差异——相同的模型,相同的 API。

我可以在 Claude Code 中使用 RunAPI 吗?

可以。将 ANTHROPIC_BASE_URL 设置为 https://api.runapi.ai,并将你的 RunAPI 密钥作为 API 密钥。Claude Code 无需任何修改即可使用。

如果 Anthropic 调整定价会怎样?

RunAPI 会在 24 小时内进行调整。相对于 Anthropic 公布的费率,50% 的折扣始终保持。

有免费套餐吗?

有。新账户可获得免费额度以测试任意模型。之后按纯按量付费计费,无最低消费限制。

RunAPI 支持提示词缓存吗?

支持。缓存读取、5 分钟写入和 1 小时写入均以 Anthropic 缓存定价的 50% 计费。

我可以通过 RunAPI 使用 OpenAI SDK 调用 Claude 吗?

可以。RunAPI 兼容 OpenAI 接口。将任意 OpenAI 客户端指向 api.runapi.ai/v1 并使用 Claude 模型 ID 即可。

计费方式是怎样的?

按量付费。你为账户充值余额,每次 API 调用扣除相应 token 费用。无订阅、无账单、无合同。

以半价开始使用 Claude。

创建免费 RunAPI 账户,获取 API 密钥,以官方 Anthropic 定价的 50% 开始调用 Claude Opus、Sonnet 或 Haiku。