Prezzi API LLM

Prezzi API Gemini nel 2026

Google addebita $1,25–$10 per milione di token per Gemini 2.5 Pro e molto meno per Flash. Gemini è il principale più economico tra i tre grandi. RunAPI replica ogni modello Gemini alla metà della tariffa ufficiale.

Aggiornato il June 18, 2026 RunAPI Editorial
In sintesi

Quanto costa attualmente l'API Gemini?

Google pubblica prezzi per token per due livelli principali: Flash per attività veloci ed economiche e Pro per la massima capacità. Esiste anche un livello gratuito con limiti giornalieri di richieste. Tutti i prezzi seguenti sono per milione di token, l'unità di fatturazione usata da Google.

Opzione più economica

Gemini 2.5 Flash a $0,08/M in input e $0,30/M in output tramite RunAPI. La tariffa ufficiale è $0,15/$0,60.

Capacità massima

Gemini 2.5 Pro a $0,63/M in input e $5,00/M in output tramite RunAPI. La tariffa ufficiale è $1,25/$10.

Livello gratuito

Google offre un livello gratuito con fino a 500 richieste al giorno su Flash, utile per la prototipazione prima di pagare.

Principale più economico

Gemini 2.5 Pro è più economico di Claude Sonnet e GPT-5.4 sul prezzo di input, rendendolo il principale più economico dei tre grandi.

Analisi modello per modello

Quanto costa ogni modello Gemini per milione di token?

La tabella seguente mostra i prezzi ufficiali di Google a confronto con i prezzi di RunAPI. RunAPI applica uno sconto fisso del 50% su tutti i modelli Gemini. Nessun impegno di volume, nessun abbonamento.

Modello Input ufficiale /M Output ufficiale /M Input RunAPI /M Output RunAPI /M Finestra di contesto
Gemini 2.5 Pro $1.25 $10.00 $0.63 $5.00 1M
Gemini 2.5 Flash $0.15 $0.60 $0.08 $0.30 1M
Gemini 2.5 Flash-Lite $0.10 $0.40 $0.05 $0.20 1M
Livello gratuito

Come funziona il livello gratuito di Gemini di Google?

Google offre un livello gratuito per prototipare prima di pagare. Ha limiti giornalieri di richieste e limiti di frequenza inferiori rispetto al livello a pagamento. È adatto per test, non per traffico di produzione.

Limite giornaliero di richieste

Fino a 500 richieste al giorno su Gemini 2.5 Flash tramite il livello gratuito. Abbastanza per la prototipazione e progetti secondari a basso volume.

Limiti di frequenza più bassi

Il livello gratuito limita le richieste al minuto ben al di sotto del livello a pagamento. I workload intensi o di produzione raggiungeranno rapidamente il limite.

Termini di utilizzo dei dati

Gli input del livello gratuito potrebbero essere usati per migliorare i prodotti Google. Il traffico del livello a pagamento e RunAPI non viene usato per il training, il che è importante per i dati sensibili.

Quando aggiornare

Passa al livello a pagamento o a RunAPI una volta che hai bisogno di throughput costante, limiti di frequenza più alti o gestione dei dati più solida. RunAPI addebita il 50% della tariffa ufficiale a pagamento senza limite giornaliero.

Confronto tra provider

Gemini è più economico di Claude e GPT?

Gli sviluppatori spesso confrontano Gemini con Claude Sonnet e GPT-5.4. Ecco come i modelli principali si confrontano su base per milione di token tramite RunAPI.

Provider Modello principale Input /M Output /M Tariffa RunAPI
Google Gemini 2.5 Pro $1.25 $10.00 $0.63 / $5.00
OpenAI GPT-5.4 $2.50 $15.00 $1.25 / $7.50
Anthropic Claude Sonnet 4.6 $6.00 $30.00 $3.00 / $15.00

RunAPI applica uno sconto del 50% su tutti i provider elencati sopra. Gemini 2.5 Pro è il principale più economico sul prezzo di input. Prezzi verificati a giugno 2026.

Costi nel mondo reale

Quanto costa effettivamente l'API Gemini per workload reali?

I costi per token sembrano astratti finché non li colleghi a compiti reali. Di seguito ci sono cinque workload comuni per sviluppatori con costi mensili stimati a due livelli di utilizzo tramite RunAPI.

Workload Modello Uso leggero (~50 attività/giorno) Uso intenso (~200 attività/giorno) Risparmio mensile vs ufficiale
Analisi documenti con contesto lungo Gemini 2.5 Pro $18/mese $72/mese $18–$72
Classificazione ad alto volume Gemini 2.5 Flash $3/mese $12/mese $3–$12
Chatbot docs con RAG Gemini 2.5 Flash $5/mese $20/mese $5–$20
Pipeline di generazione contenuti Gemini 2.5 Pro $15/mese $60/mese $15–$60
Orchestratore multi-agente Gemini 2.5 Pro $60/mese $240/mese $60–$240
Per iniziare

Come accedere all'API Gemini tramite RunAPI

1

Crea un account RunAPI

Registrati su runapi.ai. Nessuna carta di credito richiesta per il livello gratuito.

2

Copia la tua chiave API

Vai su Dashboard → Chiavi API. Crea una chiave e salvala — la userai come chiave API OpenAI.

3

Punta il tuo SDK su RunAPI

Imposta l'URL base su https://api.runapi.ai/v1 e usa la tua chiave API RunAPI. Qualsiasi client compatibile con OpenAI funziona — Python, Node.js, Go, Ruby o curl.

4

Inizia a fare richieste

Usa gemini-2.5-pro, gemini-2.5-flash o qualsiasi ID modello Gemini nel parametro model. RunAPI gestisce il routing e la fatturazione al 50% del prezzo ufficiale.

Domande frequenti

FAQ sui prezzi dell'API Gemini

Quanto costa l'API Gemini?

Il prezzo ufficiale di Google per Gemini 2.5 Pro è $1,25/M in input e $10/M in output. Gemini 2.5 Flash è $0,15/M in input e $0,60/M in output. Tramite RunAPI ogni modello Gemini è alla metà di quella tariffa, senza abbonamento né impegno di volume. Paghi solo per i token usati da ogni richiesta.

Gemini è più economico di Claude e GPT?

Sul prezzo di input, sì. Gemini 2.5 Pro a $1,25/M in input è più economico di GPT-5.4 ($2,50) e Claude Sonnet ($6) alla tariffa ufficiale, rendendolo il principale più economico dei tre grandi. RunAPI dimezza tutti e tre, quindi il divario rimane.

Gemini ha un livello gratuito?

Sì. Google offre un livello gratuito con fino a 500 richieste al giorno su Gemini 2.5 Flash e limiti di frequenza inferiori rispetto al livello a pagamento. È adatto per la prototipazione. Gli input del livello gratuito potrebbero essere usati per migliorare i prodotti Google, quindi evita dati sensibili.

Perché RunAPI è il 50% più economico dell'API ufficiale?

RunAPI negozia prezzi a volume con i fornitori di modelli e trasferisce i risparmi agli sviluppatori. Non c'è alcuna differenza di qualità — stessi modelli, stessa API compatibile con OpenAI, stesso output. Cambi solo l'URL base e la chiave, e il codice client esistente continua a funzionare senza modifiche.

Posso usare Gemini con OpenAI SDK?

Sì. RunAPI è compatibile con OpenAI. Punta qualsiasi client OpenAI su api.runapi.ai/v1 e usa gli ID modello Gemini come gemini-2.5-pro. Il codice esistente con OpenAI SDK funziona senza modifiche oltre all'URL base e alla chiave.

Perché Gemini è adatto per attività con contesto lungo?

Gemini 2.5 Pro e Flash offrono entrambi una finestra di contesto da 1M di token, più grande della maggior parte dei modelli Claude e GPT. Combinato con prezzi di input bassi, questo rende Gemini conveniente per analizzare documenti lunghi, codebase grandi o molti file contemporaneamente.

C'è un limite di utilizzo nell'API a pagamento?

L'API a pagamento non ha un limite fisso di messaggi. Paghi per token e scala secondo le tue esigenze, soggetto ai limiti di frequenza sulle richieste al minuto. Tramite RunAPI non c'è limite giornaliero di richieste come nel livello gratuito, quindi il traffico di produzione funziona senza rallentamenti.

Come funziona la fatturazione?

Pagamento a consumo. Finanzi il tuo account con un saldo e ogni chiamata API deduce il costo dei token alla metà della tariffa ufficiale. Nessun abbonamento, nessuna fattura, nessun contratto. Puoi monitorare la spesa per chiave dalla dashboard RunAPI e impostare avvisi prima che il saldo si esaurisca.

Inizia a usare Gemini a metà prezzo.

Crea un account RunAPI gratuito, ottieni la tua chiave API e inizia a chiamare Gemini 2.5 Pro o Flash al 50% rispetto ai prezzi ufficiali di Google — il principale più economico dei tre grandi.