缓存输入
重复出现的提示词前缀以较低的输入费率计费。RunAPI 以 OpenAI 缓存费率的 50% 透传此折扣。
GPT-5.4 每百万 token 输入 $2.50,输出 $15;GPT-5.5 分别为 $5 和 $30。RunAPI 以官方费率的一半镜像所有 GPT 模型——相同的 API,相同的输出,账单直降 50%。
OpenAI 对每个 GPT 模型按每百万 token 计费,输入和输出费率分开,并提供更低的缓存输入费率。以下所有数字均为每百万 token,这是 OpenAI 使用的计费单位。
通过 RunAPI,GPT-5.4 输入 $1.25/M,输出 $7.50/M。官方费率为 $2.50/$15。
GPT-5.4-mini 以旗舰费率的零头计费,通过 RunAPI 享受 50% 折扣。
通过 RunAPI,GPT-5.5 输入 $2.50/M,输出 $15/M。官方费率为 $5/$30。
缓存输入 token 的费用仅为标准输入的零头——在 RunAPI 上以 50% 透传。
下表展示了 OpenAI 官方定价与 RunAPI 定价对比。RunAPI 对所有 GPT 模型统一提供 50% 折扣,无量承诺,无订阅要求。
| 模型 | 官方输入 /M | 官方输出 /M | RunAPI 输入 /M | RunAPI 输出 /M | 上下文窗口 |
|---|---|---|---|---|---|
| GPT-5.5 | $5.00 | $30.00 | $2.50 | $15.00 | 400K |
| GPT-5.4 | $2.50 | $15.00 | $1.25 | $7.50 | 400K |
| GPT-5.4-mini | $0.25 | $2.00 | $0.13 | $1.00 | 400K |
| GPT-5.3-codex | $2.50 | $15.00 | $1.25 | $7.50 | 400K |
OpenAI 对缓存输入 token 收取更低费用,并对可接受延迟响应的批量请求提供大幅折扣。两者对于像编码智能体和批量处理这样的重复性工作负载都非常重要。
重复出现的提示词前缀以较低的输入费率计费。RunAPI 以 OpenAI 缓存费率的 50% 透传此折扣。
提交到 Batch API 的请求以标准费率的一半计费,响应延迟最长 24 小时。RunAPI 在自身折扣之上透传此折扣。
GPT-5 系列模型允许你设置推理力度。降低推理力度可减少推理 token 的输出,直接降低按量计费的输出费用。
限制每次请求的最大输出 token 数,以控制费用,避免长时间智能体任务中的生成失控。
token 费率看起来很抽象,直到你将其与实际任务关联起来。以下是常见开发者使用场景,以及通过 RunAPI 在两种使用量级下的估算月费用。
| 使用场景 | 模型 | 轻度使用(约 50 任务/天) | 重度使用(约 200 任务/天) | 相比官方的月节省 |
|---|---|---|---|---|
| 编码智能体(Codex) | GPT-5.3-codex | $20/月 | $80/月 | $20–$80 |
| 客服聊天机器人 | GPT-5.4-mini | $6/月 | $24/月 | $6–$24 |
| RAG 知识助手 | GPT-5.4 | $18/月 | $72/月 | $18–$72 |
| 内容生成流水线 | GPT-5.4 | $25/月 | $100/月 | $25–$100 |
| 多智能体编排器 | GPT-5.5 | $90/月 | $360/月 | $90–$360 |
开发者常将 GPT 与 Claude 和 Gemini 进行比较。以下是旗舰模型按每百万 token 计价的对比情况,并附有 RunAPI 费率。
| 提供商 | 旗舰模型 | 输入 /M | 输出 /M | RunAPI 费率 |
|---|---|---|---|---|
| OpenAI | GPT-5.4 | $2.50 | $15.00 | $1.25 / $7.50 |
| Anthropic | Claude Opus 4.7 | $10.00 | $50.00 | $5.00 / $25.00 |
| Gemini 2.5 Pro | $1.25 | $10.00 | $0.63 / $5.00 |
RunAPI 对上述所有提供商统一提供 50% 折扣。价格已于 2026 年 6 月核实。
在 runapi.ai 注册。免费套餐无需信用卡。
前往「控制台 → API 密钥」,创建并保存密钥——你将把它用作 OpenAI API 密钥。
将 base URL 设置为 https://api.runapi.ai/v1,并使用你的 RunAPI 密钥。任何兼容 OpenAI 的客户端均可使用。
在 model 参数中使用 gpt-5.4、gpt-5.5 或任意 GPT 模型 ID。RunAPI 以官方费率的 50% 处理路由和计费。
GPT-5.4 官方定价为每百万输入 token $2.50,每百万输出 token $15。GPT-5.5 为 $5 和 $30。通过 RunAPI,每个 GPT 模型均以这些费率的一半计费——GPT-5.4 输入 $1.25,输出 $7.50,每百万 token。
RunAPI 与模型提供商协商批量定价,并将节省的费用传递给开发者。请求会路由到相同的 OpenAI 模型,输出、安全过滤器和行为完全相同,唯一的区别是你账单上的更低费率。没有质量折衷,也没有独立的计费层级——折扣自动适用于所有 GPT 模型。
支持。OpenAI 对重复出现的提示词前缀收取较低的缓存输入费率,对于重复发送相同上下文的智能体可降低费用。RunAPI 以 OpenAI 缓存费率的 50% 透传缓存折扣,因此缓存节省与基础折扣叠加生效。
Batch API 以标准费率的 50% 运行请求,响应延迟最长 24 小时。适合不需要即时响应的批量任务。RunAPI 透传此折扣,因此批量任务以已折扣费率的一半计费。
在旗舰输入 token 方面,GPT-5.4 以 $2.50 介于 Gemini 2.5 Pro($1.25)和 Claude Opus($10)之间。最便宜的选择取决于模型层级和工作负载。RunAPI 对三者均提供一半的费率,因此相对排名保持不变。
支持。RunAPI 兼容 OpenAI 接口。将任意 OpenAI 客户端指向 https://api.runapi.ai/v1,使用你的 RunAPI 密钥,并传入 GPT 模型 ID。已使用 OpenAI SDK 的现有代码,除 base URL 和密钥外无需任何修改,因此迁移一个成熟项目大约只需一分钟。
支持。GPT-5.3-codex 通过 RunAPI 可用,以官方费率的 50% 计费,即每百万 token 输入 $1.25,输出 $7.50。通过在设置中覆盖 base URL 和密钥,它可以与 Codex 和其他兼容 OpenAI 的编码工具配合使用。缓存输入和批量折扣也会透传,进一步降低重复编码会话的实际费用。
支持。新 RunAPI 账户在承诺消费前可获得免费额度以测试任意 GPT 模型。之后按纯按量付费计费,无最低消费、无订阅、无月度承诺——你充值余额,每次调用扣除其 token 费用。你可以充值任意金额,并在控制台中按模型查看使用情况。