LLM API 定价

2026 年 OpenAI API 定价

GPT-5.4 每百万 token 输入 $2.50，输出 $15；GPT-5.5 分别为 $5 和 $30。RunAPI 以官方费率的一半镜像所有 GPT 模型——相同的 API，相同的输出，账单直降 50%。

获取 API 密钥——免费阅读 API 文档

更新于 June 18, 2026 RunAPI Editorial

一览

OpenAI API 现在的费用是多少？

OpenAI 对每个 GPT 模型按每百万 token 计费，输入和输出费率分开，并提供更低的缓存输入费率。以下所有数字均为每百万 token，这是 OpenAI 使用的计费单位。

最受欢迎

通过 RunAPI，GPT-5.4 输入 $1.25/M，输出 $7.50/M。官方费率为 $2.50/$15。

最低价选项

GPT-5.4-mini 以旗舰费率的零头计费，通过 RunAPI 享受 50% 折扣。

最强能力

通过 RunAPI，GPT-5.5 输入 $2.50/M，输出 $15/M。官方费率为 $5/$30。

缓存折扣

缓存输入 token 的费用仅为标准输入的零头——在 RunAPI 上以 50% 透传。

逐模型对比

每个 GPT 模型每百万 token 的费用是多少？

下表展示了 OpenAI 官方定价与 RunAPI 定价对比。RunAPI 对所有 GPT 模型统一提供 50% 折扣，无量承诺，无订阅要求。

模型	官方输入 /M	官方输出 /M	RunAPI 输入 /M	RunAPI 输出 /M	上下文窗口
GPT-5.5	$5.00	$30.00	$2.50	$15.00	400K
GPT-5.4	$2.50	$15.00	$1.25	$7.50	400K
GPT-5.4-mini	$0.25	$2.00	$0.13	$1.00	400K
GPT-5.3-codex	$2.50	$15.00	$1.25	$7.50	400K

OpenAI 官方定价 ↗ RunAPI 定价 ↗

缓存与批量

缓存和批量折扣如何降低你的 GPT 账单？

OpenAI 对缓存输入 token 收取更低费用，并对可接受延迟响应的批量请求提供大幅折扣。两者对于像编码智能体和批量处理这样的重复性工作负载都非常重要。

缓存输入

重复出现的提示词前缀以较低的输入费率计费。RunAPI 以 OpenAI 缓存费率的 50% 透传此折扣。

Batch API（50% 折扣）

提交到 Batch API 的请求以标准费率的一半计费，响应延迟最长 24 小时。RunAPI 在自身折扣之上透传此折扣。

推理力度

GPT-5 系列模型允许你设置推理力度。降低推理力度可减少推理 token 的输出，直接降低按量计费的输出费用。

输出 token 控制

限制每次请求的最大输出 token 数，以控制费用，避免长时间智能体任务中的生成失控。

真实使用成本

GPT API 在真实场景中实际费用是多少？

token 费率看起来很抽象，直到你将其与实际任务关联起来。以下是常见开发者使用场景，以及通过 RunAPI 在两种使用量级下的估算月费用。

使用场景	模型	轻度使用（约 50 任务/天）	重度使用（约 200 任务/天）	相比官方的月节省
编码智能体（Codex）	GPT-5.3-codex	$20/月	$80/月	$20–$80
客服聊天机器人	GPT-5.4-mini	$6/月	$24/月	$6–$24
RAG 知识助手	GPT-5.4	$18/月	$72/月	$18–$72
内容生成流水线	GPT-5.4	$25/月	$100/月	$25–$100
多智能体编排器	GPT-5.5	$90/月	$360/月	$90–$360

提供商对比

OpenAI API 比 Claude 和 Gemini 更便宜吗？

开发者常将 GPT 与 Claude 和 Gemini 进行比较。以下是旗舰模型按每百万 token 计价的对比情况，并附有 RunAPI 费率。

提供商	旗舰模型	输入 /M	输出 /M	RunAPI 费率
OpenAI	GPT-5.4	$2.50	$15.00	$1.25 / $7.50
Anthropic	Claude Opus 4.7	$10.00	$50.00	$5.00 / $25.00
Google	Gemini 2.5 Pro	$1.25	$10.00	$0.63 / $5.00

RunAPI 对上述所有提供商统一提供 50% 折扣。价格已于 2026 年 6 月核实。

快速上手

如何通过 RunAPI 访问 GPT API

创建 RunAPI 账户

在 runapi.ai 注册。免费套餐无需信用卡。

复制你的 API 密钥

前往「控制台 → API 密钥」，创建并保存密钥——你将把它用作 OpenAI API 密钥。

将你的 SDK 指向 RunAPI

将 base URL 设置为 https://api.runapi.ai/v1，并使用你的 RunAPI 密钥。任何兼容 OpenAI 的客户端均可使用。

开始发起请求

在 model 参数中使用 gpt-5.4、gpt-5.5 或任意 GPT 模型 ID。RunAPI 以官方费率的 50% 处理路由和计费。

常见问题

OpenAI API 定价常见问题

OpenAI GPT-5 API 的费用是多少？

GPT-5.4 官方定价为每百万输入 token $2.50，每百万输出 token $15。GPT-5.5 为 $5 和 $30。通过 RunAPI，每个 GPT 模型均以这些费率的一半计费——GPT-5.4 输入 $1.25，输出 $7.50，每百万 token。

为什么 RunAPI 比 OpenAI 便宜 50%？

RunAPI 与模型提供商协商批量定价，并将节省的费用传递给开发者。请求会路由到相同的 OpenAI 模型，输出、安全过滤器和行为完全相同，唯一的区别是你账单上的更低费率。没有质量折衷，也没有独立的计费层级——折扣自动适用于所有 GPT 模型。

GPT-5 有缓存定价吗？

支持。OpenAI 对重复出现的提示词前缀收取较低的缓存输入费率，对于重复发送相同上下文的智能体可降低费用。RunAPI 以 OpenAI 缓存费率的 50% 透传缓存折扣，因此缓存节省与基础折扣叠加生效。

OpenAI Batch API 折扣如何运作？

Batch API 以标准费率的 50% 运行请求，响应延迟最长 24 小时。适合不需要即时响应的批量任务。RunAPI 透传此折扣，因此批量任务以已折扣费率的一半计费。

GPT 比 Claude 或 Gemini 更便宜吗？

在旗舰输入 token 方面，GPT-5.4 以 $2.50 介于 Gemini 2.5 Pro（$1.25）和 Claude Opus（$10）之间。最便宜的选择取决于模型层级和工作负载。RunAPI 对三者均提供一半的费率，因此相对排名保持不变。

我可以在 RunAPI 中使用 OpenAI SDK 吗？

支持。RunAPI 兼容 OpenAI 接口。将任意 OpenAI 客户端指向 https://api.runapi.ai/v1，使用你的 RunAPI 密钥，并传入 GPT 模型 ID。已使用 OpenAI SDK 的现有代码，除 base URL 和密钥外无需任何修改，因此迁移一个成熟项目大约只需一分钟。

RunAPI 支持用于编码的 GPT-5.3-codex 吗？

支持。GPT-5.3-codex 通过 RunAPI 可用，以官方费率的 50% 计费，即每百万 token 输入 $1.25，输出 $7.50。通过在设置中覆盖 base URL 和密钥，它可以与 Codex 和其他兼容 OpenAI 的编码工具配合使用。缓存输入和批量折扣也会透传，进一步降低重复编码会话的实际费用。

有免费套餐吗？

支持。新 RunAPI 账户在承诺消费前可获得免费额度以测试任意 GPT 模型。之后按纯按量付费计费，无最低消费、无订阅、无月度承诺——你充值余额，每次调用扣除其 token 费用。你可以充值任意金额，并在控制台中按模型查看使用情况。

以半价运行 GPT-5。

创建免费 RunAPI 账户，获取 API 密钥，以官方定价的 50% 调用任意 OpenAI GPT 模型。

免费获取 API 密钥对比定价