Gecachter Input
Wiederholte Prompt-Präfixe werden zu einem reduzierten Input-Preis abgerechnet. RunAPI gibt den Rabatt zu 50 % von OpenAIs gecachter Rate weiter.
GPT-5.4 kostet $2,50 Input und $15 Output pro Million Tokens; GPT-5.5 kostet $5 und $30. RunAPI spiegelt jedes GPT-Modell zur Hälfte des offiziellen Preises — dieselbe API, derselbe Output, 50 % weniger auf Ihrer Rechnung.
OpenAI berechnet jeden GPT-Modell pro Million Tokens, mit separaten Input- und Output-Preisen und einem günstigeren gecachten Input-Preis. Alle Zahlen unten sind pro Million Tokens, die von OpenAI verwendete Abrechnungseinheit.
GPT-5.4 zu $1,25/M Input und $7,50/M Output über RunAPI. Offizieller Preis ist $2,50/$15.
GPT-5.4-mini zu einem Bruchteil des Flagship-Preises, zu 50 % des Preises über RunAPI abgerechnet.
GPT-5.5 zu $2,50/M Input und $15/M Output über RunAPI. Offizieller Preis ist $5/$30.
Gecachte Input-Tokens kosten einen Bruchteil des Standard-Inputs — zu 50 % auf RunAPI weitergegeben.
Die Tabelle zeigt die offiziellen OpenAI-Preise neben den RunAPI-Preisen. RunAPI gewährt einen pauschalen 50 %-Rabatt auf alle GPT-Modelle. Keine Mengenverpflichtungen, keine Abonnements.
| Modell | Offizieller Input /M | Offizieller Output /M | RunAPI Input /M | RunAPI Output /M | Kontextfenster |
|---|---|---|---|---|---|
| GPT-5.5 | $5.00 | $30.00 | $2.50 | $15.00 | 400K |
| GPT-5.4 | $2.50 | $15.00 | $1.25 | $7.50 | 400K |
| GPT-5.4-mini | $0.25 | $2.00 | $0.13 | $1.00 | 400K |
| GPT-5.3-codex | $2.50 | $15.00 | $1.25 | $7.50 | 400K |
OpenAI berechnet weniger für gecachte Input-Tokens und bietet einen tiefen Rabatt für Batch-Anfragen, die eine verzögerte Verarbeitung tolerieren. Beides ist wichtig für repetitive Workloads wie Coding-Agenten und Massenverarbeitung.
Wiederholte Prompt-Präfixe werden zu einem reduzierten Input-Preis abgerechnet. RunAPI gibt den Rabatt zu 50 % von OpenAIs gecachter Rate weiter.
Über die Batch API eingereichte Anfragen werden zur Hälfte des Standardpreises mit bis zu 24 Stunden Wartezeit verarbeitet. RunAPI gibt dies zusätzlich zu seinem eigenen Rabatt weiter.
GPT-5-Modelle ermöglichen das Einstellen des Reasoning-Aufwands. Geringerer Aufwand erzeugt weniger Reasoning-Tokens und senkt direkt die Output-Kosten bei der nutzungsabhängigen Abrechnung.
Begrenzen Sie die maximalen Output-Tokens pro Anfrage, um Kosten zu kontrollieren und unkontrollierte Generierungen bei langen agentischen Aufgaben zu vermeiden.
Token-Preise wirken abstrakt, bis man sie an reale Aufgaben knüpft. Unten finden Sie gängige Entwickler-Workloads mit geschätzten monatlichen Kosten bei zwei Nutzungsstufen, zu RunAPI-Preisen abgerechnet.
| Workload | Modell | Leichte Nutzung (~50 Aufgaben/Tag) | Starke Nutzung (~200 Aufgaben/Tag) | Monatliche Ersparnis vs. offiziell |
|---|---|---|---|---|
| Coding-Agent (Codex) | GPT-5.3-codex | $20/Monat | $80/Monat | $20–$80 |
| Kunden-Support-Chatbot | GPT-5.4-mini | $6/Monat | $24/Monat | $6–$24 |
| RAG-Wissensassistent | GPT-5.4 | $18/Monat | $72/Monat | $18–$72 |
| Content-Generierungspipeline | GPT-5.4 | $25/Monat | $100/Monat | $25–$100 |
| Multi-Agenten-Orchestrator | GPT-5.5 | $90/Monat | $360/Monat | $90–$360 |
Entwickler wägen GPT gegen Claude und Gemini ab. So vergleichen sich die Flagship-Modelle pro Million Tokens mit RunAPI-Preisen daneben.
| Anbieter | Flagship-Modell | Input /M | Output /M | RunAPI-Rate |
|---|---|---|---|---|
| OpenAI | GPT-5.4 | $2.50 | $15.00 | $1.25 / $7.50 |
| Anthropic | Claude Opus 4.7 | $10.00 | $50.00 | $5.00 / $25.00 |
| Gemini 2.5 Pro | $1.25 | $10.00 | $0.63 / $5.00 |
RunAPI gewährt 50 % Rabatt auf alle oben aufgeführten Anbieter. Preise verifiziert im Juni 2026.
Registrieren Sie sich auf runapi.ai. Für den kostenlosen Tarif ist keine Kreditkarte erforderlich.
Gehen Sie zu Dashboard → API Keys. Erstellen Sie einen Schlüssel und speichern Sie ihn — Sie verwenden ihn als Ihren OpenAI API-Schlüssel.
Setzen Sie die Basis-URL auf https://api.runapi.ai/v1 und verwenden Sie Ihren RunAPI-Schlüssel. Jeder OpenAI-kompatible Client funktioniert.
Verwenden Sie gpt-5.4, gpt-5.5 oder eine beliebige GPT-Modell-ID im model-Parameter. RunAPI übernimmt Routing und Abrechnung zu 50 % des offiziellen Preises.
GPT-5.4 kostet offiziell $2,50 pro Million Input-Tokens und $15 pro Million Output-Tokens. GPT-5.5 kostet $5 und $30. Über RunAPI wird jedes GPT-Modell zur Hälfte dieser Preise abgerechnet — GPT-5.4 kostet $1,25 Input und $7,50 Output pro Million Tokens.
RunAPI verhandelt Mengenpreise mit Modellanbietern und gibt die Einsparungen an Entwickler weiter. Anfragen erreichen dieselben OpenAI-Modelle mit identischem Output, Sicherheitsfiltern und Verhalten, sodass der einzige Unterschied der niedrigere Preis auf Ihrer Rechnung ist. Es gibt keinen Qualitätsunterschied und keine separate Abrechnungsstufe — der Rabatt gilt automatisch für jedes GPT-Modell.
Ja. OpenAI berechnet wiederholte Prompt-Präfixe zu einem reduzierten gecachten Input-Preis, was die Kosten für Agenten senkt, die denselben Kontext erneut senden. RunAPI gibt den Cache-Rabatt zu 50 % von OpenAIs gecachter Rate weiter, sodass Cache-Einsparungen mit dem Basisrabatt gestapelt werden.
Die Batch-API verarbeitet Anfragen zu 50 % des Standardpreises mit bis zu 24 Stunden Wartezeit. Sie eignet sich für Massenaufgaben, die keine sofortigen Antworten benötigen. RunAPI gibt diesen Rabatt weiter, sodass Batch-Arbeit zur Hälfte des bereits rabattierten Preises abgerechnet wird.
Bei Flagship-Input-Tokens liegt GPT-5.4 mit $2,50 zwischen Gemini 2.5 Pro bei $1,25 und Claude Opus bei $10. Die günstigste Wahl hängt von der Modellebene und dem Workload ab. RunAPI halbiert den Preis für alle drei, sodass die relative Rangordnung gleich bleibt.
Ja. RunAPI ist OpenAI-kompatibel. Richten Sie jeden OpenAI-Client auf https://api.runapi.ai/v1, verwenden Sie Ihren RunAPI-Schlüssel und geben Sie eine GPT-Modell-ID an. Bestehender Code, der bereits das OpenAI SDK verwendet, funktioniert ohne Änderungen über Basis-URL und Schlüssel hinaus, sodass die Migration eines etablierten Projekts etwa eine Minute dauert.
Ja. GPT-5.3-codex ist über RunAPI zu 50 % des offiziellen Preises verfügbar, nämlich $1,25 Input und $7,50 Output pro Million Tokens. Es funktioniert mit Codex und anderen OpenAI-kompatiblen Coding-Tools durch Überschreiben von Basis-URL und Schlüssel in deren Einstellungen. Gecachte Input- und Batch-Rabatte werden ebenfalls weitergegeben und senken die effektiven Kosten repetitiver Coding-Sessions weiter.
Ja. Neue RunAPI-Konten erhalten kostenlose Credits, um jedes GPT-Modell zu testen, bevor sie sich festlegen. Danach wird ausschließlich nutzungsabhängig ohne Mindestausgaben, kein Abonnement und keine monatliche Verpflichtung abgerechnet — Sie laden ein Guthaben auf und jeder Aufruf zieht seine Token-Kosten ab. Sie können beliebige Beträge aufladen und die Nutzung pro Modell im Dashboard beobachten.
Erstellen Sie ein kostenloses RunAPI-Konto, erhalten Sie Ihren API-Schlüssel und rufen Sie jedes OpenAI GPT-Modell zu 50 % der offiziellen Preise auf.