キャッシュ済み入力
繰り返しのプロンプトプレフィックスは入力レートを低減して課金されます。RunAPIはOpenAIのキャッシュレートの50%で割引を適用します。
GPT-5.4は100万トークンあたり入力$2.50、出力$15です。GPT-5.5は$5と$30です。RunAPIはすべてのGPTモデルを公式レートの半額でミラーリング——同じAPI、同じ出力、請求書は50%削減。
OpenAIは各GPTモデルを100万トークンごとに課金し、入力と出力で別々のレートを設定し、より安いキャッシュ済み入力レートも用意しています。以下のすべての数値はOpenAIが使用する課金単位である100万トークンあたりです。
RunAPI経由でGPT-5.4は入力$1.25/M、出力$7.50/M。公式レートは$2.50/$15。
フラッグシップレートの何分の一かで、RunAPI経由で50%オフのGPT-5.4-mini。
RunAPI経由でGPT-5.5は入力$2.50/M、出力$15/M。公式レートは$5/$30。
キャッシュ済み入力トークンは標準入力のほんの一部のコスト——RunAPIで50%引きで適用。
この表はOpenAIの公式料金とRunAPIの料金を比較しています。RunAPIはすべてのGPTモデルに一律50%の割引を適用します。ボリュームコミットも、サブスクリプションも不要です。
| モデル | 公式入力 /M | 公式出力 /M | RunAPI入力 /M | RunAPI出力 /M | コンテキストウィンドウ |
|---|---|---|---|---|---|
| GPT-5.5 | $5.00 | $30.00 | $2.50 | $15.00 | 400K |
| GPT-5.4 | $2.50 | $15.00 | $1.25 | $7.50 | 400K |
| GPT-5.4-mini | $0.25 | $2.00 | $0.13 | $1.00 | 400K |
| GPT-5.3-codex | $2.50 | $15.00 | $1.25 | $7.50 | 400K |
OpenAIはキャッシュされた入力トークンの料金を低く設定し、遅延ターンアラウンドを許容するバッチリクエストに大幅な割引を提供しています。どちらもコーディングエージェントや大量処理などの反復的なワークロードに重要です。
繰り返しのプロンプトプレフィックスは入力レートを低減して課金されます。RunAPIはOpenAIのキャッシュレートの50%で割引を適用します。
Batch APIに送信されたリクエストは最大24時間のターンアラウンドで標準レートの半額で実行されます。RunAPIはこれを独自の割引の上に適用します。
GPT-5モデルでは推論の労力を設定できます。労力を低くすると推論トークンが少なくなり、メータリング課金での出力コストが直接削減されます。
リクエストごとに最大出力トークンを制限して、コストを抑制し、長いエージェント的タスクでの暴走した生成を防ぎます。
トークンレートは実際のタスクに結びつけるまで抽象的に見えます。以下は一般的な開発者ワークロードと2つの使用レベルにおける月間コストの見積もりで、RunAPIレートで課金されます。
| ワークロード | モデル | ライト使用(〜50タスク/日) | ヘビー使用(〜200タスク/日) | 公式との月間節約額 |
|---|---|---|---|---|
| コーディングエージェント(Codex) | GPT-5.3-codex | $20/月 | $80/月 | $20〜$80 |
| カスタマーサポートチャットボット | GPT-5.4-mini | $6/月 | $24/月 | $6〜$24 |
| RAGナレッジアシスタント | GPT-5.4 | $18/月 | $72/月 | $18〜$72 |
| コンテンツ生成パイプライン | GPT-5.4 | $25/月 | $100/月 | $25〜$100 |
| マルチエージェントオーケストレーター | GPT-5.5 | $90/月 | $360/月 | $90〜$360 |
開発者はGPTをClaudeおよびGeminiと比較検討します。以下は主力モデルを100万トークンあたりの比較で、RunAPIレートも併記しています。
| プロバイダー | 主力モデル | 入力 /M | 出力 /M | RunAPIレート |
|---|---|---|---|---|
| OpenAI | GPT-5.4 | $2.50 | $15.00 | $1.25 / $7.50 |
| Anthropic | Claude Opus 4.7 | $10.00 | $50.00 | $5.00 / $25.00 |
| Gemini 2.5 Pro | $1.25 | $10.00 | $0.63 / $5.00 |
RunAPIは上記のすべてのプロバイダーに50%の割引を適用します。価格は2026年6月時点で確認済み。
runapi.aiでサインアップしてください。無料ティアはクレジットカード不要です。
ダッシュボード → API Keysに移動してください。キーを作成して保存します——これをOpenAI API keyとして使用します。
ベースURLをhttps://api.runapi.ai/v1に設定し、RunAPIキーを使用してください。OpenAI互換のクライアントであれば何でも動作します。
モデルパラメータにgpt-5.4、gpt-5.5、またはその他のGPTモデルIDを使用してください。RunAPIが公式レートの50%でルーティングと課金を処理します。
GPT-5.4は公式で100万入力トークンあたり$2.50、100万出力トークンあたり$15です。GPT-5.5は$5と$30です。RunAPI経由では、すべてのGPTモデルはそれらのレートの半額で課金されます——GPT-5.4は100万トークンあたり入力$1.25、出力$7.50で実行されます。
RunAPIはモデルプロバイダーとボリューム料金を交渉し、開発者にその節約分を還元しています。リクエストは同じOpenAIモデルに同一の出力、安全フィルター、動作で届くため、唯一の違いは請求書上のより低いレートです。品質のトレードオフはなく、別の課金ティアもありません——割引はすべてのGPTモデルに自動的に適用されます。
はい。OpenAIは繰り返しのプロンプトプレフィックスをキャッシュ済み入力レートで課金し、同じコンテキストを再送するエージェントのコストを削減します。RunAPIはOpenAIのキャッシュレートの50%でキャッシュ割引を適用するため、キャッシュによる節約がベース割引と重なります。
Batch APIは最大24時間のターンアラウンドと引き換えに標準レートの50%でリクエストを実行します。即時応答を必要としない大量処理ジョブに適しています。RunAPIはこの割引を適用するため、バッチ作業はすでに割引されたレートのさらに半額で課金されます。
主力の入力トークンについては、GPT-5.4の$2.50はGemini 2.5 Proの$1.25とClaude Opusの$10の間に位置します。最も安い選択肢はモデルティアとワークロードによって異なります。RunAPIは3つすべてのレートを半額にするため、相対的な順位は変わりません。
はい。RunAPIはOpenAI互換です。任意のOpenAIクライアントをhttps://api.runapi.ai/v1に向け、RunAPIキーを使用して、GPTモデルIDを渡してください。OpenAI SDKをすでに使用している既存のコードは、ベースURLとキーの変更のみで動作するため、確立されたプロジェクトの移行には約1分かかります。
はい。GPT-5.3-codexはRunAPI経由で公式レートの50%——100万トークンあたり入力$1.25、出力$7.50——で利用できます。設定でベースURLとキーをオーバーライドすることで、CodexおよびOpenAI互換のその他のコーディングツールで動作します。キャッシュ済み入力とバッチ割引も適用されるため、反復的なコーディングセッションの実効コストがさらに下がります。
はい。新規RunAPIアカウントはコミット前に任意のGPTモデルをテストするための無料クレジットを受け取ります。その後は、最低使用額なし、サブスクリプションなし、月額コミットなしの完全従量課金制です——残高をチャージし、各呼び出しでトークンコストが差し引かれます。任意の金額をチャージし、ダッシュボードでモデルごとの使用状況を確認できます。
RunAPIの無料アカウントを作成し、API keyを取得して、公式料金の50%オフで任意のOpenAI GPTモデルを呼び出してください。