LLM API Pricing

Gemini API Pricing in 2026

Google berechnet $1,25–$10 pro Million Tokens für Gemini 2.5 Pro und deutlich weniger für Flash. Gemini ist das günstigste Flagship unter den großen Drei. RunAPI spiegelt jedes Gemini-Modell zur Hälfte des offiziellen Preises.

Aktualisiert am June 18, 2026 RunAPI Editorial
Auf einen Blick

Was kostet die Gemini API aktuell?

Google veröffentlicht Token-Preise für zwei Hauptebenen: Flash für schnelle, günstige Aufgaben und Pro für maximale Leistung. Es gibt auch einen kostenlosen Tarif mit täglichen Anfragelimits. Alle Preise unten sind pro Million Tokens, die von Google verwendete Abrechnungseinheit.

Günstigste Option

Gemini 2.5 Flash zu $0,08/M Input und $0,30/M Output über RunAPI. Offizieller Preis ist $0,15/$0,60.

Maximale Leistung

Gemini 2.5 Pro zu $0,63/M Input und $5,00/M Output über RunAPI. Offizieller Preis ist $1,25/$10.

Kostenloser Tarif

Google bietet einen kostenlosen Tarif mit bis zu 500 Anfragen pro Tag bei Flash, nützlich zum Prototyping vor der Zahlung.

Günstigstes Flagship

Gemini 2.5 Pro unterbietet Claude Sonnet und GPT-5.4 beim Input-Preis und ist damit das günstigste Flagship der großen Drei.

Modell für Modell

Wie viel kostet jedes Gemini-Modell pro Million Tokens?

Die folgende Tabelle zeigt die offiziellen Google-Preise neben den RunAPI-Preisen. RunAPI gewährt einen pauschalen 50 %-Rabatt auf alle Gemini-Modelle. Keine Mengenverpflichtungen, keine Abonnements.

Modell Offizieller Input /M Offizieller Output /M RunAPI Input /M RunAPI Output /M Kontextfenster
Gemini 2.5 Pro $1.25 $10.00 $0.63 $5.00 1M
Gemini 2.5 Flash $0.15 $0.60 $0.08 $0.30 1M
Gemini 2.5 Flash-Lite $0.10 $0.40 $0.05 $0.20 1M
Kostenloser Tarif

Wie funktioniert Googles kostenloser Gemini-Tarif?

Google bietet einen kostenlosen Tarif, damit Sie vor der Zahlung prototypisieren können. Er hat tägliche Anfragelimits und niedrigere Rate-Limits als der kostenpflichtige Tarif. Er eignet sich zum Testen, nicht für Produktions-Traffic.

Tägliches Anfragelimit

Bis zu 500 Anfragen pro Tag bei Gemini 2.5 Flash über den kostenlosen Tarif. Genug zum Prototyping und für Nebenprojekte mit geringem Volumen.

Niedrigere Rate-Limits

Der kostenlose Tarif begrenzt Anfragen pro Minute deutlich unterhalb des kostenpflichtigen Tarifs. Burst- oder Produktions-Workloads werden schnell an die Grenze stoßen.

Datennutzungsbedingungen

Kostenlose Tarif-Eingaben können zur Verbesserung von Googles Produkten verwendet werden. Kostenpflichtiger Tarif und RunAPI-Traffic wird nicht für Training verwendet, was bei sensiblen Daten wichtig ist.

Wann upgraden

Wechseln Sie zu kostenpflichtig oder RunAPI, sobald Sie gleichmäßigen Durchsatz, höhere Rate-Limits oder stärkeren Datenschutz benötigen. RunAPI berechnet 50 % des offiziellen kostenpflichtigen Preises ohne tägliche Obergrenze.

Anbietervergleich

Ist Gemini günstiger als Claude und GPT?

Entwickler vergleichen Gemini häufig mit Claude Sonnet und GPT-5.4. So schneiden die Flagship-Modelle im Vergleich pro Million Tokens über RunAPI ab.

Anbieter Flagship-Modell Input /M Output /M RunAPI-Rate
Google Gemini 2.5 Pro $1.25 $10.00 $0.63 / $5.00
OpenAI GPT-5.4 $2.50 $15.00 $1.25 / $7.50
Anthropic Claude Sonnet 4.6 $6.00 $30.00 $3.00 / $15.00

RunAPI gewährt 50 % Rabatt auf alle oben aufgeführten Anbieter. Gemini 2.5 Pro ist das günstigste Flagship beim Input-Preis. Preise verifiziert im Juni 2026.

Kosten in der Praxis

Was kostet die Gemini API wirklich bei realen Workloads?

Token-Kosten wirken abstrakt, bis man sie an reale Aufgaben knüpft. Unten finden Sie fünf gängige Entwickler-Workloads mit geschätzten monatlichen Kosten bei zwei Nutzungsstufen über RunAPI.

Workload Modell Leichte Nutzung (~50 Aufgaben/Tag) Starke Nutzung (~200 Aufgaben/Tag) Monatliche Ersparnis vs. offiziell
Langkontext-Dokumentenanalyse Gemini 2.5 Pro $18/Monat $72/Monat $18–$72
Hochvolumige Klassifikation Gemini 2.5 Flash $3/Monat $12/Monat $3–$12
RAG-gestützter Docs-Chatbot Gemini 2.5 Flash $5/Monat $20/Monat $5–$20
Content-Generierungspipeline Gemini 2.5 Pro $15/Monat $60/Monat $15–$60
Multi-Agenten-Orchestrator Gemini 2.5 Pro $60/Monat $240/Monat $60–$240
Erste Schritte

So greifen Sie über RunAPI auf die Gemini API zu

1

RunAPI-Konto erstellen

Registrieren Sie sich auf runapi.ai. Für den kostenlosen Tarif ist keine Kreditkarte erforderlich.

2

Ihren API-Schlüssel kopieren

Gehen Sie zu Dashboard → API Keys. Erstellen Sie einen Schlüssel und speichern Sie ihn — Sie verwenden ihn als Ihren OpenAI API-Schlüssel.

3

Ihr SDK auf RunAPI ausrichten

Setzen Sie die Basis-URL auf https://api.runapi.ai/v1 und verwenden Sie Ihren RunAPI API-Schlüssel. Jeder OpenAI-kompatible Client funktioniert — Python, Node.js, Go, Ruby oder curl.

4

Anfragen stellen

Verwenden Sie gemini-2.5-pro, gemini-2.5-flash oder eine beliebige Gemini-Modell-ID im model-Parameter. RunAPI übernimmt Routing und Abrechnung zu 50 % des offiziellen Preises.

Häufig gestellte Fragen

Gemini API Pricing FAQ

Was kostet die Gemini API?

Die offiziellen Google-Preise für Gemini 2.5 Pro betragen $1,25/M Input und $10/M Output. Gemini 2.5 Flash kostet $0,15/M Input und $0,60/M Output. Über RunAPI ist jedes Gemini-Modell zur Hälfte dieser Preise erhältlich, ohne Abonnement oder Mengenverpflichtung. Sie zahlen nur für die Tokens, die jede Anfrage verwendet.

Ist Gemini günstiger als Claude und GPT?

Beim Input-Preis ja. Gemini 2.5 Pro bei $1,25/M Input unterbietet GPT-5.4 ($2,50) und Claude Sonnet ($6) beim offiziellen Preis und ist damit das günstigste Flagship der großen Drei. RunAPI halbiert alle drei, sodass der Abstand bestehen bleibt.

Hat Gemini einen kostenlosen Tarif?

Ja. Google bietet einen kostenlosen Tarif mit bis zu 500 Anfragen pro Tag bei Gemini 2.5 Flash und niedrigeren Rate-Limits als der kostenpflichtige Tarif. Er eignet sich zum Prototyping. Kostenlose Tarif-Eingaben können zur Verbesserung von Googles Produkten verwendet werden, vermeiden Sie daher sensible Daten.

Warum ist RunAPI 50 % günstiger als die offizielle API?

RunAPI verhandelt Mengenpreise mit Modellanbietern und gibt die Einsparungen an Entwickler weiter. Es gibt keinen Qualitätsunterschied — dieselben Modelle, dieselbe OpenAI-kompatible API, derselbe Output. Sie ändern nur die Basis-URL und den Schlüssel, und Ihr bestehender Client-Code funktioniert unverändert weiter.

Kann ich Gemini mit dem OpenAI SDK verwenden?

Ja. RunAPI ist OpenAI-kompatibel. Richten Sie jeden OpenAI-Client auf api.runapi.ai/v1 und verwenden Sie Gemini-Modell-IDs wie gemini-2.5-pro. Bestehender OpenAI SDK-Code funktioniert ohne Änderungen über Basis-URL und Schlüssel hinaus.

Warum ist Gemini gut für Langkontext-Aufgaben?

Gemini 2.5 Pro und Flash bieten beide ein 1M-Token-Kontextfenster, das größer ist als bei den meisten Claude- und GPT-Modellen. Kombiniert mit niedrigen Input-Preisen macht dies Gemini kosteneffizient für die Analyse langer Dokumente, großer Codebases oder vieler Dateien gleichzeitig.

Gibt es eine Nutzungsobergrenze bei der kostenpflichtigen API?

Die kostenpflichtige API hat kein festes Nachrichtenlimit. Sie zahlen pro Token und skalieren nach Bedarf, vorbehaltlich Rate-Limits für Anfragen pro Minute. Über RunAPI gibt es kein tägliches Anfragelimit wie beim kostenlosen Tarif, sodass Produktions-Traffic ohne Drosselung läuft.

Wie funktioniert die Abrechnung?

Nutzungsabhängig. Sie laden Ihr Konto mit einem Guthaben auf, und jeder API-Aufruf zieht die Token-Kosten zur Hälfte des offiziellen Preises ab. Keine Abonnements, keine Rechnungen, keine Verträge. Sie können den Verbrauch pro Schlüssel im RunAPI-Dashboard überwachen und Benachrichtigungen einrichten, bevor das Guthaben niedrig wird.

Beginnen Sie, Gemini zum halben Preis zu nutzen.

Erstellen Sie ein kostenloses RunAPI-Konto, erhalten Sie Ihren API-Schlüssel und rufen Sie Gemini 2.5 Pro oder Flash zu 50 % der offiziellen Google-Preise auf — das günstigste Flagship der großen Drei.