Ceny LLM API

Ceny Gemini API w 2026 roku

Google pobiera od $1,25 do $10 za milion tokenów dla Gemini 2.5 Pro i znacznie mniej za Flash. Gemini jest najtańszym modelem flagowym wśród wielkiej trójki. RunAPI odzwierciedla każdy model Gemini po połowie oficjalnej stawki.

Zaktualizowano June 18, 2026 RunAPI Editorial
W skrócie

Ile kosztuje teraz Gemini API?

Google publikuje ceny na token dla dwóch głównych poziomów: Flash dla szybkich, tanich zadań i Pro dla maksymalnej wydajności. Istnieje też bezpłatny poziom z dziennymi limitami żądań. Wszystkie ceny poniżej są za milion tokenów — jednostkę rozliczeniową Google.

Najtańsza opcja

Gemini 2.5 Flash po $0,08/M wejście i $0,30/M wyjście przez RunAPI. Oficjalna stawka to $0,15/$0,60.

Maksymalna wydajność

Gemini 2.5 Pro po $0,63/M wejście i $5,00/M wyjście przez RunAPI. Oficjalna stawka to $1,25/$10.

Bezpłatny poziom

Google oferuje bezpłatny poziom z do 500 żądaniami dziennie dla Flash, przydatny do prototypowania przed opłatami.

Najtańszy model flagowy

Gemini 2.5 Pro bije Claude Sonnet i GPT-5.4 ceną wejścia, co czyni go najtańszym modelem flagowym wielkiej trójki.

Podział według modelu

Ile kosztuje każdy model Gemini za milion tokenów?

Poniższa tabela pokazuje oficjalne ceny Google obok cen RunAPI. RunAPI stosuje płaski rabat 50% na wszystkie modele Gemini. Bez zobowiązań wolumenowych, bez subskrypcji.

Model Oficjalne wejście /M Oficjalne wyjście /M RunAPI wejście /M RunAPI wyjście /M Okno kontekstowe
Gemini 2.5 Pro $1.25 $10.00 $0.63 $5.00 1M
Gemini 2.5 Flash $0.15 $0.60 $0.08 $0.30 1M
Gemini 2.5 Flash-Lite $0.10 $0.40 $0.05 $0.20 1M
Bezpłatny poziom

Jak działa bezpłatny poziom Google Gemini?

Google oferuje bezpłatny poziom, żebyś mógł prototypować przed płaceniem. Ma dzienne limity żądań i niższe limity szybkości niż poziom płatny. Nadaje się do testowania, nie do ruchu produkcyjnego.

Dzienny limit żądań

Do 500 żądań dziennie dla Gemini 2.5 Flash na bezpłatnym poziomie. Wystarczy do prototypowania i projektów pobocznych o małym wolumenie.

Niższe limity szybkości

Bezpłatny poziom ogranicza żądania na minutę znacznie poniżej płatnego poziomu. Gwałtowne lub produkcyjne obciążenia szybko osiągną limit.

Warunki użycia danych

Dane wejściowe z bezpłatnego poziomu mogą być używane do ulepszania produktów Google. Ruch płatny i RunAPI nie jest używany do trenowania, co ma znaczenie przy wrażliwych danych.

Kiedy przejść na wyższy poziom

Przejdź na płatny lub RunAPI, gdy potrzebujesz stałej przepustowości, wyższych limitów szybkości lub lepszego zarządzania danymi. RunAPI pobiera 50% oficjalnej stawki płatnej bez dziennego limitu.

Porównanie dostawców

Czy Gemini jest tańszy niż Claude i GPT?

Programiści często porównują Gemini z Claude Sonnet i GPT-5.4. Oto jak modele flagowe wypada w porównaniu na podstawie miliona tokenów przez RunAPI.

Dostawca Model flagowy Wejście /M Wyjście /M Stawka RunAPI
Google Gemini 2.5 Pro $1.25 $10.00 $0.63 / $5.00
OpenAI GPT-5.4 $2.50 $15.00 $1.25 / $7.50
Anthropic Claude Sonnet 4.6 $6.00 $30.00 $3.00 / $15.00

RunAPI stosuje 50% rabatu u wszystkich wymienionych powyżej dostawców. Gemini 2.5 Pro jest najtańszym modelem flagowym pod względem ceny wejścia. Ceny zweryfikowane w czerwcu 2026.

Koszty w praktyce

Ile naprawdę kosztuje Gemini API przy rzeczywistych obciążeniach?

Koszty tokenów wydają się abstrakcyjne, dopóki nie przypisze się ich do rzeczywistych zadań. Poniżej przedstawiono pięć typowych obciążeń programistycznych z szacowanymi miesięcznymi kosztami na dwóch poziomach użycia przez RunAPI.

Obciążenie Model Lekkie użycie (~50 zadań/dzień) Intensywne użycie (~200 zadań/dzień) Miesięczna oszczędność vs oficjalne
Analiza dokumentów z długim kontekstem Gemini 2.5 Pro $18/mies. $72/mies. $18–$72
Klasyfikacja dużego wolumenu Gemini 2.5 Flash $3/mies. $12/mies. $3–$12
Chatbot dokumentacji oparty na RAG Gemini 2.5 Flash $5/mies. $20/mies. $5–$20
Potok generowania treści Gemini 2.5 Pro $15/mies. $60/mies. $15–$60
Orkiestrator wieloagentowy Gemini 2.5 Pro $60/mies. $240/mies. $60–$240
Pierwsze kroki

Jak uzyskać dostęp do Gemini API przez RunAPI

1

Utwórz konto RunAPI

Zarejestruj się na runapi.ai. Bezpłatny poziom nie wymaga karty kredytowej.

2

Skopiuj klucz API

Przejdź do Dashboard → Klucze API. Utwórz klucz i zapisz go — użyjesz go jako klucz OpenAI API.

3

Skieruj SDK na RunAPI

Ustaw bazowy URL na https://api.runapi.ai/v1 i użyj klucza RunAPI API. Działa każdy klient zgodny z OpenAI — Python, Node.js, Go, Ruby lub curl.

4

Zacznij wysyłać żądania

Użyj gemini-2.5-pro, gemini-2.5-flash lub dowolnego identyfikatora modelu Gemini w parametrze model. RunAPI obsługuje routing i rozliczenia po 50% oficjalnej stawki.

Często zadawane pytania

FAQ dotyczące cen Gemini API

Ile kosztuje Gemini API?

Oficjalna cena Google dla Gemini 2.5 Pro to $1,25/M wejście i $10/M wyjście. Gemini 2.5 Flash to $0,15/M wejście i $0,60/M wyjście. Przez RunAPI każdy model Gemini jest rozliczany po połowie tej stawki, bez subskrypcji ani zobowiązania wolumenowego. Płacisz tylko za tokeny faktycznie użyte przez każde żądanie.

Czy Gemini jest tańszy niż Claude i GPT?

Pod względem ceny wejścia tak. Gemini 2.5 Pro po $1,25/M wejście bije GPT-5.4 ($2,50) i Claude Sonnet ($6) przy oficjalnej stawce, co czyni go najtańszym modelem flagowym wielkiej trójki. RunAPI obniża wszystkie trzy o połowę, więc przewaga utrzymuje się.

Czy Gemini ma bezpłatny poziom?

Tak. Google oferuje bezpłatny poziom z do 500 żądaniami dziennie dla Gemini 2.5 Flash i niższymi limitami szybkości niż poziom płatny. Nadaje się do prototypowania. Dane wejściowe z bezpłatnego poziomu mogą być używane do ulepszania produktów Google, więc unikaj wrażliwych danych.

Dlaczego RunAPI jest o 50% tańsze niż oficjalne API?

RunAPI negocjuje ceny wolumenowe z dostawcami modeli i przekazuje oszczędności programistom. Nie ma różnicy w jakości — te same modele, to samo API zgodne z OpenAI, ten sam wynik. Zmieniasz tylko bazowy URL i klucz, a istniejący kod klienta działa bez zmian.

Czy mogę używać Gemini z SDK OpenAI?

Tak. RunAPI jest zgodne z OpenAI. Skieruj dowolnego klienta OpenAI na api.runapi.ai/v1 i użyj identyfikatorów modeli Gemini, takich jak gemini-2.5-pro. Istniejący kod SDK OpenAI działa bez zmian poza bazowym URL i kluczem.

Dlaczego Gemini jest dobre do zadań z długim kontekstem?

Gemini 2.5 Pro i Flash oferują okno kontekstowe 1M tokenów, większe niż większość modeli Claude i GPT. W połączeniu z niską ceną wejścia sprawia to, że Gemini jest opłacalne do analizy długich dokumentów, dużych baz kodu lub wielu plików jednocześnie.

Czy płatne API ma limit użycia?

Płatne API nie ma stałego limitu wiadomości. Płacisz za token i skalujesz według potrzeb, podlegając limitom szybkości żądań na minutę. Przez RunAPI nie ma dziennego limitu żądań jak na bezpłatnym poziomie, więc ruch produkcyjny działa bez ograniczania.

Jak działa rozliczanie?

Pay-as-you-go. Zasilasz konto saldem, a każde wywołanie API odejmuje koszt tokenów po połowie oficjalnej stawki. Bez subskrypcji, bez faktur, bez umów. Możesz monitorować wydatki per klucz z dashboardu RunAPI i ustawiać alerty przed wyczerpaniem salda.

Zacznij używać Gemini za połowę ceny.

Utwórz darmowe konto RunAPI, pobierz klucz API i zacznij wywoływać Gemini 2.5 Pro lub Flash ze zniżką 50% względem oficjalnych cen Google — najtańszy model flagowy wielkiej trójki.