LLM API 定价

2026 年 Claude API 定价

Anthropic 根据模型不同，每百万 token 收费 $3 至 $15。RunAPI 以官方费率的一半镜像所有 Claude 模型——相同的 API，相同的输出，账单直降 50%。

获取 API 密钥——免费阅读 API 文档

更新于 June 18, 2026 RunAPI Editorial

一览

Claude API 现在的费用是多少？

Anthropic 为三个模型层级发布按 token 计费的价格：Haiku 适合轻量任务，Sonnet 适合均衡负载，Opus 提供最强能力。以下所有价格均为每百万 token，这是 Anthropic 使用的计费单位。

最低价选项

通过 RunAPI，Haiku 4.5 输入 $1/M，输出 $5/M。官方费率为 $2/$10。

最受欢迎

通过 RunAPI，Sonnet 4.6 输入 $3/M，输出 $15/M。官方费率为 $6/$30。

最强能力

通过 RunAPI，Opus 4.7 输入 $5/M，输出 $25/M。官方费率为 $10/$50。

缓存折扣

缓存读取费用比标准输入 token 低 90%——通过 RunAPI，Haiku 仅需 $0.10/M。

逐模型对比

每个 Claude 模型每百万 token 的费用是多少？

下表展示了 Anthropic 官方定价与 RunAPI 定价对比。RunAPI 对所有 Claude 模型统一提供 50% 折扣，无量承诺，无订阅要求。

模型	官方输入 /M	官方输出 /M	RunAPI 输入 /M	RunAPI 输出 /M	上下文窗口
Opus 4.8	$15.00	$75.00	$7.50	$37.50	200K
Opus 4.7	$10.00	$50.00	$5.00	$25.00	200K
Opus 4.6	$10.00	$50.00	$5.00	$25.00	200K
Sonnet 4.6	$6.00	$30.00	$3.00	$15.00	200K
Sonnet 4.5	$6.00	$30.00	$3.00	$15.00	200K
Haiku 4.5	$2.00	$10.00	$1.00	$5.00	200K

Anthropic 官方定价 ↗ RunAPI 定价 ↗

提示词缓存

缓存折扣如何降低你的 Claude API 账单？

Anthropic 的提示词缓存功能会存储重复出现的前缀，并在复用缓存版本时收取更低费用。对于像 Claude Code 这样的编码智能体来说意义重大，因为它们每次请求都会发送相同的系统提示和文件上下文。

缓存读取

输入 token 享受 90% 折扣。通过 RunAPI，Sonnet 4.6 缓存读取费用为 $0.30/M，而非标准的 $3.00/M。

缓存写入（5 分钟有效期）

在输入基础上附加 25% 的费用——通过 RunAPI，Sonnet 4.6 为 $3.75/M。缓存前缀有效期为 5 分钟。

缓存写入（1 小时有效期）

为标准输入费率的 2 倍——通过 RunAPI，Sonnet 4.6 为 $6.00/M。适合频繁复用上下文的长时间编码会话。

批量处理

Anthropic 对可接受最长 24 小时响应延迟的批量请求，所有模型提供 50% 的折扣。RunAPI 将此折扣透传给用户。

真实使用成本

Claude API 在真实场景中实际费用是多少？

token 费用看起来很抽象，直到你将其与实际任务关联起来。以下是五种常见开发者使用场景，以及两种使用量级下的估算月费用。

使用场景	模型	轻度使用（约 50 任务/天）	重度使用（约 200 任务/天）	相比官方的月节省
Vibe coding 会话（Claude Code）	Sonnet 4.6	$45/月	$180/月	$45–$180
PR 代码审查智能体	Opus 4.7	$75/月	$300/月	$75–$300
RAG 文档聊天机器人	Haiku 4.5	$12/月	$48/月	$12–$48
内容生成流水线	Sonnet 4.6	$30/月	$120/月	$30–$120
多智能体编排器	Opus 4.7	$150/月	$600/月	$150–$600

提供商对比

Claude API 比 OpenAI 和 Gemini 更便宜吗？

开发者常将 Claude 与 GPT-5 和 Gemini 2.5 Pro 进行比较。以下是各旗舰模型按每百万 token 计价的对比情况。

提供商	旗舰模型	输入 /M	输出 /M	RunAPI 费率
Anthropic	Claude Opus 4.7	$10.00	$50.00	$5.00 / $25.00
OpenAI	GPT-5.4	$2.50	$15.00	$1.25 / $7.50
Google	Gemini 2.5 Pro	$1.25	$10.00	$0.63 / $5.00

RunAPI 对上述所有提供商统一提供 50% 折扣。价格已于 2026 年 6 月核实。

订阅 vs API

Claude API 比 Claude Max 订阅更便宜吗？

Claude Max 每月 $100，可无限制使用 Claude Code（5x 方案为 $200）。API 按 token 计费。对于每月 Sonnet 4.6 输出 token 不足 1000 万的开发者，通过 RunAPI 的费用低于 Max 订阅——且任何模型层级均无使用上限。

Claude Max（$100/月）

在 Claude Code 中无限制使用 Sonnet，Opus 有限制。固定月费，无 API 访问。

通过 RunAPI 使用 Claude API

按 token 付费，无月度承诺。Sonnet 4.6 输入 $3/M，输出 $15/M。$100 大约可购买 670 万个输出 token——对大多数个人开发者来说已经足够。

Max 更划算的场景

每天大量使用且持续超过 1000 万输出 token 的重度用户。Sonnet 4.6 通过 RunAPI 的盈亏平衡点约为 670 万输出 token。

API 更划算的场景

团队、CI 流水线、多模型场景，以及希望同时访问 Opus 或 Haiku 与 Sonnet 的开发者。无上限，无等待，无订阅锁定。

快速上手

如何通过 RunAPI 访问 Claude API

创建 RunAPI 账户

在 runapi.ai 注册。免费套餐无需信用卡。

复制你的 API 密钥

前往「控制台 → API 密钥」，创建并保存密钥——你将把它用作 OpenAI API 密钥。

将你的 SDK 指向 RunAPI

将 base URL 设置为 https://api.runapi.ai/v1，并使用你的 RunAPI API 密钥。任何兼容 OpenAI 的客户端均可使用——Python、Node.js、Go、Ruby 或 curl。

开始发起请求

在 model 参数中使用 claude-sonnet-4-6、claude-opus-4-7 或任意 Claude 模型 ID。RunAPI 以官方费率的 50% 处理路由和计费。

常见问题

Claude API 定价常见问题

RunAPI 会修改 Claude 的输出吗？

不会。RunAPI 直接将请求代理至 Anthropic 的 API。模型输出、安全过滤器和行为与直接调用 Anthropic 完全一致。

为什么 RunAPI 比官方 API 便宜 50%？

RunAPI 与模型提供商协商批量定价，并将节省的费用转让给开发者。质量没有任何差异——相同的模型，相同的 API。

我可以在 Claude Code 中使用 RunAPI 吗？

可以。将 ANTHROPIC_BASE_URL 设置为 https://api.runapi.ai，并将你的 RunAPI 密钥作为 API 密钥。Claude Code 无需任何修改即可使用。

如果 Anthropic 调整定价会怎样？

RunAPI 会在 24 小时内进行调整。相对于 Anthropic 公布的费率，50% 的折扣始终保持。

有免费套餐吗？

有。新账户可获得免费额度以测试任意模型。之后按纯按量付费计费，无最低消费限制。

RunAPI 支持提示词缓存吗？

支持。缓存读取、5 分钟写入和 1 小时写入均以 Anthropic 缓存定价的 50% 计费。

我可以通过 RunAPI 使用 OpenAI SDK 调用 Claude 吗？

可以。RunAPI 兼容 OpenAI 接口。将任意 OpenAI 客户端指向 api.runapi.ai/v1 并使用 Claude 模型 ID 即可。

计费方式是怎样的？

按量付费。你为账户充值余额，每次 API 调用扣除相应 token 费用。无订阅、无账单、无合同。

以半价开始使用 Claude。

创建免费 RunAPI 账户，获取 API 密钥，以官方 Anthropic 定价的 50% 开始调用 Claude Opus、Sonnet 或 Haiku。

免费获取 API 密钥对比所有模型定价