LLM API Pricing

OpenAI API Pricing in 2026

GPT-5.4 kostet $2,50 Input und $15 Output pro Million Tokens; GPT-5.5 kostet $5 und $30. RunAPI spiegelt jedes GPT-Modell zur Hälfte des offiziellen Preises — dieselbe API, derselbe Output, 50 % weniger auf Ihrer Rechnung.

Aktualisiert am June 18, 2026 RunAPI Editorial
Auf einen Blick

Was kostet die OpenAI API aktuell?

OpenAI berechnet jeden GPT-Modell pro Million Tokens, mit separaten Input- und Output-Preisen und einem günstigeren gecachten Input-Preis. Alle Zahlen unten sind pro Million Tokens, die von OpenAI verwendete Abrechnungseinheit.

Beliebteste Option

GPT-5.4 zu $1,25/M Input und $7,50/M Output über RunAPI. Offizieller Preis ist $2,50/$15.

Günstigste Option

GPT-5.4-mini zu einem Bruchteil des Flagship-Preises, zu 50 % des Preises über RunAPI abgerechnet.

Maximale Leistung

GPT-5.5 zu $2,50/M Input und $15/M Output über RunAPI. Offizieller Preis ist $5/$30.

Cache-Rabatt

Gecachte Input-Tokens kosten einen Bruchteil des Standard-Inputs — zu 50 % auf RunAPI weitergegeben.

Modell für Modell

Wie viel kostet jedes GPT-Modell pro Million Tokens?

Die Tabelle zeigt die offiziellen OpenAI-Preise neben den RunAPI-Preisen. RunAPI gewährt einen pauschalen 50 %-Rabatt auf alle GPT-Modelle. Keine Mengenverpflichtungen, keine Abonnements.

Modell Offizieller Input /M Offizieller Output /M RunAPI Input /M RunAPI Output /M Kontextfenster
GPT-5.5 $5.00 $30.00 $2.50 $15.00 400K
GPT-5.4 $2.50 $15.00 $1.25 $7.50 400K
GPT-5.4-mini $0.25 $2.00 $0.13 $1.00 400K
GPT-5.3-codex $2.50 $15.00 $1.25 $7.50 400K
Cache und Batch

Wie senken Cache- und Batch-Rabatte Ihre GPT-Rechnung?

OpenAI berechnet weniger für gecachte Input-Tokens und bietet einen tiefen Rabatt für Batch-Anfragen, die eine verzögerte Verarbeitung tolerieren. Beides ist wichtig für repetitive Workloads wie Coding-Agenten und Massenverarbeitung.

Gecachter Input

Wiederholte Prompt-Präfixe werden zu einem reduzierten Input-Preis abgerechnet. RunAPI gibt den Rabatt zu 50 % von OpenAIs gecachter Rate weiter.

Batch-API (50 % Rabatt)

Über die Batch API eingereichte Anfragen werden zur Hälfte des Standardpreises mit bis zu 24 Stunden Wartezeit verarbeitet. RunAPI gibt dies zusätzlich zu seinem eigenen Rabatt weiter.

Reasoning-Aufwand

GPT-5-Modelle ermöglichen das Einstellen des Reasoning-Aufwands. Geringerer Aufwand erzeugt weniger Reasoning-Tokens und senkt direkt die Output-Kosten bei der nutzungsabhängigen Abrechnung.

Output-Token-Kontrolle

Begrenzen Sie die maximalen Output-Tokens pro Anfrage, um Kosten zu kontrollieren und unkontrollierte Generierungen bei langen agentischen Aufgaben zu vermeiden.

Kosten in der Praxis

Was kostet die GPT-API wirklich bei realen Workloads?

Token-Preise wirken abstrakt, bis man sie an reale Aufgaben knüpft. Unten finden Sie gängige Entwickler-Workloads mit geschätzten monatlichen Kosten bei zwei Nutzungsstufen, zu RunAPI-Preisen abgerechnet.

Workload Modell Leichte Nutzung (~50 Aufgaben/Tag) Starke Nutzung (~200 Aufgaben/Tag) Monatliche Ersparnis vs. offiziell
Coding-Agent (Codex) GPT-5.3-codex $20/Monat $80/Monat $20–$80
Kunden-Support-Chatbot GPT-5.4-mini $6/Monat $24/Monat $6–$24
RAG-Wissensassistent GPT-5.4 $18/Monat $72/Monat $18–$72
Content-Generierungspipeline GPT-5.4 $25/Monat $100/Monat $25–$100
Multi-Agenten-Orchestrator GPT-5.5 $90/Monat $360/Monat $90–$360
Anbietervergleich

Ist die OpenAI API günstiger als Claude und Gemini?

Entwickler wägen GPT gegen Claude und Gemini ab. So vergleichen sich die Flagship-Modelle pro Million Tokens mit RunAPI-Preisen daneben.

Anbieter Flagship-Modell Input /M Output /M RunAPI-Rate
OpenAI GPT-5.4 $2.50 $15.00 $1.25 / $7.50
Anthropic Claude Opus 4.7 $10.00 $50.00 $5.00 / $25.00
Google Gemini 2.5 Pro $1.25 $10.00 $0.63 / $5.00

RunAPI gewährt 50 % Rabatt auf alle oben aufgeführten Anbieter. Preise verifiziert im Juni 2026.

Erste Schritte

So greifen Sie über RunAPI auf die GPT-API zu

1

RunAPI-Konto erstellen

Registrieren Sie sich auf runapi.ai. Für den kostenlosen Tarif ist keine Kreditkarte erforderlich.

2

Ihren API-Schlüssel kopieren

Gehen Sie zu Dashboard → API Keys. Erstellen Sie einen Schlüssel und speichern Sie ihn — Sie verwenden ihn als Ihren OpenAI API-Schlüssel.

3

Ihr SDK auf RunAPI ausrichten

Setzen Sie die Basis-URL auf https://api.runapi.ai/v1 und verwenden Sie Ihren RunAPI-Schlüssel. Jeder OpenAI-kompatible Client funktioniert.

4

Anfragen stellen

Verwenden Sie gpt-5.4, gpt-5.5 oder eine beliebige GPT-Modell-ID im model-Parameter. RunAPI übernimmt Routing und Abrechnung zu 50 % des offiziellen Preises.

Häufig gestellte Fragen

OpenAI API Pricing FAQ

Was kostet die OpenAI GPT-5 API?

GPT-5.4 kostet offiziell $2,50 pro Million Input-Tokens und $15 pro Million Output-Tokens. GPT-5.5 kostet $5 und $30. Über RunAPI wird jedes GPT-Modell zur Hälfte dieser Preise abgerechnet — GPT-5.4 kostet $1,25 Input und $7,50 Output pro Million Tokens.

Warum ist RunAPI 50 % günstiger als OpenAI?

RunAPI verhandelt Mengenpreise mit Modellanbietern und gibt die Einsparungen an Entwickler weiter. Anfragen erreichen dieselben OpenAI-Modelle mit identischem Output, Sicherheitsfiltern und Verhalten, sodass der einzige Unterschied der niedrigere Preis auf Ihrer Rechnung ist. Es gibt keinen Qualitätsunterschied und keine separate Abrechnungsstufe — der Rabatt gilt automatisch für jedes GPT-Modell.

Hat GPT-5 Cache-Preise?

Ja. OpenAI berechnet wiederholte Prompt-Präfixe zu einem reduzierten gecachten Input-Preis, was die Kosten für Agenten senkt, die denselben Kontext erneut senden. RunAPI gibt den Cache-Rabatt zu 50 % von OpenAIs gecachter Rate weiter, sodass Cache-Einsparungen mit dem Basisrabatt gestapelt werden.

Wie funktioniert der OpenAI Batch-API-Rabatt?

Die Batch-API verarbeitet Anfragen zu 50 % des Standardpreises mit bis zu 24 Stunden Wartezeit. Sie eignet sich für Massenaufgaben, die keine sofortigen Antworten benötigen. RunAPI gibt diesen Rabatt weiter, sodass Batch-Arbeit zur Hälfte des bereits rabattierten Preises abgerechnet wird.

Ist GPT günstiger als Claude oder Gemini?

Bei Flagship-Input-Tokens liegt GPT-5.4 mit $2,50 zwischen Gemini 2.5 Pro bei $1,25 und Claude Opus bei $10. Die günstigste Wahl hängt von der Modellebene und dem Workload ab. RunAPI halbiert den Preis für alle drei, sodass die relative Rangordnung gleich bleibt.

Kann ich das OpenAI SDK mit RunAPI verwenden?

Ja. RunAPI ist OpenAI-kompatibel. Richten Sie jeden OpenAI-Client auf https://api.runapi.ai/v1, verwenden Sie Ihren RunAPI-Schlüssel und geben Sie eine GPT-Modell-ID an. Bestehender Code, der bereits das OpenAI SDK verwendet, funktioniert ohne Änderungen über Basis-URL und Schlüssel hinaus, sodass die Migration eines etablierten Projekts etwa eine Minute dauert.

Unterstützt RunAPI GPT-5.3-codex für Coding?

Ja. GPT-5.3-codex ist über RunAPI zu 50 % des offiziellen Preises verfügbar, nämlich $1,25 Input und $7,50 Output pro Million Tokens. Es funktioniert mit Codex und anderen OpenAI-kompatiblen Coding-Tools durch Überschreiben von Basis-URL und Schlüssel in deren Einstellungen. Gecachte Input- und Batch-Rabatte werden ebenfalls weitergegeben und senken die effektiven Kosten repetitiver Coding-Sessions weiter.

Gibt es einen kostenlosen Tarif?

Ja. Neue RunAPI-Konten erhalten kostenlose Credits, um jedes GPT-Modell zu testen, bevor sie sich festlegen. Danach wird ausschließlich nutzungsabhängig ohne Mindestausgaben, kein Abonnement und keine monatliche Verpflichtung abgerechnet — Sie laden ein Guthaben auf und jeder Aufruf zieht seine Token-Kosten ab. Sie können beliebige Beträge aufladen und die Nutzung pro Modell im Dashboard beobachten.

GPT-5 zum halben Preis ausführen.

Erstellen Sie ein kostenloses RunAPI-Konto, erhalten Sie Ihren API-Schlüssel und rufen Sie jedes OpenAI GPT-Modell zu 50 % der offiziellen Preise auf.