Tägliches Anfragelimit
Bis zu 500 Anfragen pro Tag bei Gemini 2.5 Flash über den kostenlosen Tarif. Genug zum Prototyping und für Nebenprojekte mit geringem Volumen.
Google berechnet $1,25–$10 pro Million Tokens für Gemini 2.5 Pro und deutlich weniger für Flash. Gemini ist das günstigste Flagship unter den großen Drei. RunAPI spiegelt jedes Gemini-Modell zur Hälfte des offiziellen Preises.
Google veröffentlicht Token-Preise für zwei Hauptebenen: Flash für schnelle, günstige Aufgaben und Pro für maximale Leistung. Es gibt auch einen kostenlosen Tarif mit täglichen Anfragelimits. Alle Preise unten sind pro Million Tokens, die von Google verwendete Abrechnungseinheit.
Gemini 2.5 Flash zu $0,08/M Input und $0,30/M Output über RunAPI. Offizieller Preis ist $0,15/$0,60.
Gemini 2.5 Pro zu $0,63/M Input und $5,00/M Output über RunAPI. Offizieller Preis ist $1,25/$10.
Google bietet einen kostenlosen Tarif mit bis zu 500 Anfragen pro Tag bei Flash, nützlich zum Prototyping vor der Zahlung.
Gemini 2.5 Pro unterbietet Claude Sonnet und GPT-5.4 beim Input-Preis und ist damit das günstigste Flagship der großen Drei.
Die folgende Tabelle zeigt die offiziellen Google-Preise neben den RunAPI-Preisen. RunAPI gewährt einen pauschalen 50 %-Rabatt auf alle Gemini-Modelle. Keine Mengenverpflichtungen, keine Abonnements.
| Modell | Offizieller Input /M | Offizieller Output /M | RunAPI Input /M | RunAPI Output /M | Kontextfenster |
|---|---|---|---|---|---|
| Gemini 2.5 Pro | $1.25 | $10.00 | $0.63 | $5.00 | 1M |
| Gemini 2.5 Flash | $0.15 | $0.60 | $0.08 | $0.30 | 1M |
| Gemini 2.5 Flash-Lite | $0.10 | $0.40 | $0.05 | $0.20 | 1M |
Google bietet einen kostenlosen Tarif, damit Sie vor der Zahlung prototypisieren können. Er hat tägliche Anfragelimits und niedrigere Rate-Limits als der kostenpflichtige Tarif. Er eignet sich zum Testen, nicht für Produktions-Traffic.
Bis zu 500 Anfragen pro Tag bei Gemini 2.5 Flash über den kostenlosen Tarif. Genug zum Prototyping und für Nebenprojekte mit geringem Volumen.
Der kostenlose Tarif begrenzt Anfragen pro Minute deutlich unterhalb des kostenpflichtigen Tarifs. Burst- oder Produktions-Workloads werden schnell an die Grenze stoßen.
Kostenlose Tarif-Eingaben können zur Verbesserung von Googles Produkten verwendet werden. Kostenpflichtiger Tarif und RunAPI-Traffic wird nicht für Training verwendet, was bei sensiblen Daten wichtig ist.
Wechseln Sie zu kostenpflichtig oder RunAPI, sobald Sie gleichmäßigen Durchsatz, höhere Rate-Limits oder stärkeren Datenschutz benötigen. RunAPI berechnet 50 % des offiziellen kostenpflichtigen Preises ohne tägliche Obergrenze.
Entwickler vergleichen Gemini häufig mit Claude Sonnet und GPT-5.4. So schneiden die Flagship-Modelle im Vergleich pro Million Tokens über RunAPI ab.
| Anbieter | Flagship-Modell | Input /M | Output /M | RunAPI-Rate |
|---|---|---|---|---|
| Gemini 2.5 Pro | $1.25 | $10.00 | $0.63 / $5.00 | |
| OpenAI | GPT-5.4 | $2.50 | $15.00 | $1.25 / $7.50 |
| Anthropic | Claude Sonnet 4.6 | $6.00 | $30.00 | $3.00 / $15.00 |
RunAPI gewährt 50 % Rabatt auf alle oben aufgeführten Anbieter. Gemini 2.5 Pro ist das günstigste Flagship beim Input-Preis. Preise verifiziert im Juni 2026.
Token-Kosten wirken abstrakt, bis man sie an reale Aufgaben knüpft. Unten finden Sie fünf gängige Entwickler-Workloads mit geschätzten monatlichen Kosten bei zwei Nutzungsstufen über RunAPI.
| Workload | Modell | Leichte Nutzung (~50 Aufgaben/Tag) | Starke Nutzung (~200 Aufgaben/Tag) | Monatliche Ersparnis vs. offiziell |
|---|---|---|---|---|
| Langkontext-Dokumentenanalyse | Gemini 2.5 Pro | $18/Monat | $72/Monat | $18–$72 |
| Hochvolumige Klassifikation | Gemini 2.5 Flash | $3/Monat | $12/Monat | $3–$12 |
| RAG-gestützter Docs-Chatbot | Gemini 2.5 Flash | $5/Monat | $20/Monat | $5–$20 |
| Content-Generierungspipeline | Gemini 2.5 Pro | $15/Monat | $60/Monat | $15–$60 |
| Multi-Agenten-Orchestrator | Gemini 2.5 Pro | $60/Monat | $240/Monat | $60–$240 |
Registrieren Sie sich auf runapi.ai. Für den kostenlosen Tarif ist keine Kreditkarte erforderlich.
Gehen Sie zu Dashboard → API Keys. Erstellen Sie einen Schlüssel und speichern Sie ihn — Sie verwenden ihn als Ihren OpenAI API-Schlüssel.
Setzen Sie die Basis-URL auf https://api.runapi.ai/v1 und verwenden Sie Ihren RunAPI API-Schlüssel. Jeder OpenAI-kompatible Client funktioniert — Python, Node.js, Go, Ruby oder curl.
Verwenden Sie gemini-2.5-pro, gemini-2.5-flash oder eine beliebige Gemini-Modell-ID im model-Parameter. RunAPI übernimmt Routing und Abrechnung zu 50 % des offiziellen Preises.
Die offiziellen Google-Preise für Gemini 2.5 Pro betragen $1,25/M Input und $10/M Output. Gemini 2.5 Flash kostet $0,15/M Input und $0,60/M Output. Über RunAPI ist jedes Gemini-Modell zur Hälfte dieser Preise erhältlich, ohne Abonnement oder Mengenverpflichtung. Sie zahlen nur für die Tokens, die jede Anfrage verwendet.
Beim Input-Preis ja. Gemini 2.5 Pro bei $1,25/M Input unterbietet GPT-5.4 ($2,50) und Claude Sonnet ($6) beim offiziellen Preis und ist damit das günstigste Flagship der großen Drei. RunAPI halbiert alle drei, sodass der Abstand bestehen bleibt.
Ja. Google bietet einen kostenlosen Tarif mit bis zu 500 Anfragen pro Tag bei Gemini 2.5 Flash und niedrigeren Rate-Limits als der kostenpflichtige Tarif. Er eignet sich zum Prototyping. Kostenlose Tarif-Eingaben können zur Verbesserung von Googles Produkten verwendet werden, vermeiden Sie daher sensible Daten.
RunAPI verhandelt Mengenpreise mit Modellanbietern und gibt die Einsparungen an Entwickler weiter. Es gibt keinen Qualitätsunterschied — dieselben Modelle, dieselbe OpenAI-kompatible API, derselbe Output. Sie ändern nur die Basis-URL und den Schlüssel, und Ihr bestehender Client-Code funktioniert unverändert weiter.
Ja. RunAPI ist OpenAI-kompatibel. Richten Sie jeden OpenAI-Client auf api.runapi.ai/v1 und verwenden Sie Gemini-Modell-IDs wie gemini-2.5-pro. Bestehender OpenAI SDK-Code funktioniert ohne Änderungen über Basis-URL und Schlüssel hinaus.
Gemini 2.5 Pro und Flash bieten beide ein 1M-Token-Kontextfenster, das größer ist als bei den meisten Claude- und GPT-Modellen. Kombiniert mit niedrigen Input-Preisen macht dies Gemini kosteneffizient für die Analyse langer Dokumente, großer Codebases oder vieler Dateien gleichzeitig.
Die kostenpflichtige API hat kein festes Nachrichtenlimit. Sie zahlen pro Token und skalieren nach Bedarf, vorbehaltlich Rate-Limits für Anfragen pro Minute. Über RunAPI gibt es kein tägliches Anfragelimit wie beim kostenlosen Tarif, sodass Produktions-Traffic ohne Drosselung läuft.
Nutzungsabhängig. Sie laden Ihr Konto mit einem Guthaben auf, und jeder API-Aufruf zieht die Token-Kosten zur Hälfte des offiziellen Preises ab. Keine Abonnements, keine Rechnungen, keine Verträge. Sie können den Verbrauch pro Schlüssel im RunAPI-Dashboard überwachen und Benachrichtigungen einrichten, bevor das Guthaben niedrig wird.
Erstellen Sie ein kostenloses RunAPI-Konto, erhalten Sie Ihren API-Schlüssel und rufen Sie Gemini 2.5 Pro oder Flash zu 50 % der offiziellen Google-Preise auf — das günstigste Flagship der großen Drei.