LLM API-prijzen

Gemini API-prijzen in 2026

Google rekent $1,25–$10 per miljoen tokens voor Gemini 2.5 Pro en veel minder voor Flash. Gemini is het goedkoopste vlaggenschip van de grote drie. RunAPI spiegelt elk Gemini-model tegen de helft van het officiële tarief.

Bijgewerkt op June 18, 2026 RunAPI Editorial
In één oogopslag

Wat kost de Gemini API momenteel?

Google publiceert per-token-prijzen voor twee hoofdlagen: Flash voor snelle, goedkope taken en Pro voor maximale capaciteit. Er is ook een gratis laag met dagelijkse verzoekslimieten. Alle onderstaande prijzen zijn per miljoen tokens, de factureringseenheid die Google gebruikt.

Goedkoopste optie

Gemini 2.5 Flash voor $0,08/M invoer en $0,30/M uitvoer via RunAPI. Officieel tarief is $0,15/$0,60.

Maximale capaciteit

Gemini 2.5 Pro voor $0,63/M invoer en $5,00/M uitvoer via RunAPI. Officieel tarief is $1,25/$10.

Gratis laag

Google biedt een gratis laag met maximaal 500 verzoeken per dag op Flash, handig voor prototyping voordat u betaalt.

Goedkoopste vlaggenschip

Gemini 2.5 Pro ondersnijdt Claude Sonnet en GPT-5.4 op invoerprijs, waardoor het het goedkoopste vlaggenschip van de grote drie is.

Model-voor-model overzicht

Hoeveel kost elk Gemini-model per miljoen tokens?

De onderstaande tabel toont de officiële Google-prijzen naast de RunAPI-prijzen. RunAPI past een vlakke korting van 50% toe op alle Gemini-modellen. Geen volumeverplichtingen, geen abonnementen.

Model Officiële invoer /M Officiële uitvoer /M RunAPI-invoer /M RunAPI-uitvoer /M Contextvenster
Gemini 2.5 Pro $1,25 $10,00 $0,63 $5,00 1M
Gemini 2.5 Flash $0,15 $0,60 $0,08 $0,30 1M
Gemini 2.5 Flash-Lite $0,10 $0,40 $0,05 $0,20 1M
Gratis laag

Hoe werkt de gratis Gemini-laag van Google?

Google biedt een gratis laag zodat u kunt prototypen voordat u betaalt. Deze heeft dagelijkse verzoekslimieten en lagere snelheidslimieten dan de betaalde laag. Het is geschikt voor testen, niet voor productieverkeer.

Dagelijks verzoekslimiet

Tot 500 verzoeken per dag op Gemini 2.5 Flash via de gratis laag. Genoeg voor prototyping en zijprojecten met laag volume.

Lagere snelheidslimieten

De gratis laag beperkt verzoeken per minuut ver onder de betaalde laag. Burstige of productiewerklasten bereiken de limiet snel.

Gegevensgebruiksvoorwaarden

Gratis-laag-invoer kan worden gebruikt om Google's producten te verbeteren. Betaald-laag- en RunAPI-verkeer wordt niet gebruikt voor training, wat relevant is voor gevoelige gegevens.

Wanneer te upgraden

Ga over op betaald of RunAPI zodra u constante doorvoer, hogere snelheidslimieten of sterkere gegevensverwerking nodig heeft. RunAPI rekent 50% van het officiële betaalde tarief zonder dagelijks limiet.

Vergelijking van aanbieders

Is Gemini goedkoper dan Claude en GPT?

Ontwikkelaars vergelijken Gemini vaak met Claude Sonnet en GPT-5.4. Hier is hoe de vlaggenschipmodellen zich verhouden op basis van per-miljoen-tokens via RunAPI.

Aanbieder Vlaggenschipmodel Invoer /M Uitvoer /M RunAPI-tarief
Google Gemini 2.5 Pro $1,25 $10,00 $0,63 / $5,00
OpenAI GPT-5.4 $2,50 $15,00 $1,25 / $7,50
Anthropic Claude Sonnet 4.6 $6,00 $30,00 $3,00 / $15,00

RunAPI past 50% korting toe op alle bovenstaande aanbieders. Gemini 2.5 Pro is het goedkoopste vlaggenschip op invoerprijs. Prijzen geverifieerd juni 2026.

Kosten in de praktijk

Wat kost de Gemini API werkelijk voor echte werklasten?

Tokenkosten lijken abstract totdat u ze aan echte taken koppelt. Hieronder vindt u vijf veelgebruikte ontwikkelaarswerklasten met geschatte maandelijkse kosten op twee gebruiksniveaus via RunAPI.

Werklast Model Licht gebruik (~50 taken/dag) Intensief gebruik (~200 taken/dag) Maandelijkse besparing vs officieel
Documentanalyse met lange context Gemini 2.5 Pro $18/mnd $72/mnd $18–$72
Classificatie op hoog volume Gemini 2.5 Flash $3/mnd $12/mnd $3–$12
RAG-aangedreven documentenchatbot Gemini 2.5 Flash $5/mnd $20/mnd $5–$20
Contentgeneratiepipeline Gemini 2.5 Pro $15/mnd $60/mnd $15–$60
Multi-agent orkestrator Gemini 2.5 Pro $60/mnd $240/mnd $60–$240
Aan de slag

Hoe u toegang krijgt tot de Gemini API via RunAPI

1

Maak een RunAPI-account aan

Meld u aan op runapi.ai. Geen creditcard vereist voor de gratis laag.

2

Kopieer uw API-sleutel

Ga naar Dashboard → API-sleutels. Maak een sleutel aan en sla deze op — u gebruikt deze als uw OpenAI API-sleutel.

3

Wijs uw SDK naar RunAPI

Stel de basis-URL in op https://api.runapi.ai/v1 en gebruik uw RunAPI API-sleutel. Elke OpenAI-compatibele client werkt — Python, Node.js, Go, Ruby of curl.

4

Begin verzoeken te doen

Gebruik gemini-2.5-pro, gemini-2.5-flash of een ander Gemini-model-ID in de modelparameter. RunAPI verzorgt de routering en facturering tegen 50% van het officiële tarief.

Veelgestelde vragen

Gemini API-prijzen FAQ

Hoeveel kost de Gemini API?

De officiële Google-prijs voor Gemini 2.5 Pro is $1,25/M invoer en $10/M uitvoer. Gemini 2.5 Flash kost $0,15/M invoer en $0,60/M uitvoer. Via RunAPI is elk Gemini-model de helft van dat tarief, zonder abonnement of volumeverplichting. U betaalt alleen voor de tokens die elk verzoek gebruikt.

Is Gemini goedkoper dan Claude en GPT?

Op invoerprijs wel. Gemini 2.5 Pro voor $1,25/M invoer ondersnijdt GPT-5.4 ($2,50) en Claude Sonnet ($6) op het officiële tarief, waardoor het het goedkoopste vlaggenschip van de grote drie is. RunAPI halveert alle drie, zodat het verschil behouden blijft.

Heeft Gemini een gratis laag?

Ja. Google biedt een gratis laag met maximaal 500 verzoeken per dag op Gemini 2.5 Flash en lagere snelheidslimieten dan de betaalde laag. Dit is geschikt voor prototyping. Gratis-laag-invoer kan worden gebruikt om Google's producten te verbeteren, dus vermijd gevoelige gegevens.

Waarom is RunAPI 50% goedkoper dan de officiële API?

RunAPI onderhandelt over volumeprijzen met modelleveranciers en geeft de besparingen door aan ontwikkelaars. Er is geen kwaliteitsverschil — dezelfde modellen, dezelfde OpenAI-compatibele API, dezelfde uitvoer. U verandert alleen de basis-URL en sleutel, en uw bestaande clientcode blijft ongewijzigd werken.

Kan ik Gemini gebruiken met de OpenAI SDK?

Ja. RunAPI is OpenAI-compatibel. Wijs elke OpenAI-client naar api.runapi.ai/v1 en gebruik Gemini-model-ID's zoals gemini-2.5-pro. Bestaande OpenAI SDK-code werkt zonder wijzigingen buiten de basis-URL en sleutel.

Waarom is Gemini goed voor taken met lange context?

Gemini 2.5 Pro en Flash bieden beide een contextvenster van 1M tokens, groter dan de meeste Claude- en GPT-modellen. In combinatie met lage invoerprijzen maakt dit Gemini kosteneffectief voor het analyseren van lange documenten, grote codebases of meerdere bestanden tegelijk.

Is er een gebruikslimiet op de betaalde API?

De betaalde API heeft geen vast berichtenlimiet. U betaalt per token en schaalt naar behoefte, onderhevig aan snelheidslimieten op verzoeken per minuut. Via RunAPI is er geen dagelijks verzoekslimiet zoals bij de gratis laag, zodat productieverkeer zonder beperking kan verlopen.

Hoe werkt de facturering?

Betalen per gebruik. U vult uw account op met een saldo en elke API-aanroep trekt de tokenkosten af tegen de helft van het officiële tarief. Geen abonnementen, geen facturen, geen contracten. U kunt de uitgaven per sleutel volgen via het RunAPI-dashboard en meldingen instellen voordat het saldo laag wordt.

Begin Gemini te gebruiken voor de helft van de prijs.

Maak een gratis RunAPI-account aan, haal uw API-sleutel op en begin Gemini 2.5 Pro of Flash aan te roepen met 50% korting op de officiële Google-prijzen — het goedkoopste vlaggenschip van de grote drie.