Prezzi API LLM

Prezzi API OpenAI nel 2026

GPT-5.4 costa $2,50 in input e $15 in output per milione di token; GPT-5.5 costa $5 e $30. RunAPI replica ogni modello GPT a metà del prezzo ufficiale — stessa API, stesso output, 50% in meno sulla tua fattura.

Ottieni chiave API — gratuita Leggi la documentazione API

Aggiornato il June 18, 2026 RunAPI Editorial

In sintesi

Quanto costa attualmente l'API OpenAI?

OpenAI stabilisce il prezzo di ogni modello GPT per milione di token, con tariffe separate per input e output e una tariffa di input con cache più economica. Tutte le cifre seguenti sono per milione di token, l'unità di fatturazione usata da OpenAI.

Più popolare

GPT-5.4 a $1,25/M in input e $7,50/M in output tramite RunAPI. La tariffa ufficiale è $2,50/$15.

Opzione più economica

GPT-5.4-mini a una frazione della tariffa principale, fatturato al 50% di sconto tramite RunAPI.

Capacità massima

GPT-5.5 a $2,50/M in input e $15/M in output tramite RunAPI. La tariffa ufficiale è $5/$30.

Sconto cache

I token di input con cache costano una frazione dell'input standard — trasmessi al 50% su RunAPI.

Analisi modello per modello

Quanto costa ogni modello GPT per milione di token?

La tabella mostra i prezzi ufficiali di OpenAI a confronto con i prezzi di RunAPI. RunAPI applica uno sconto fisso del 50% su tutti i modelli GPT. Nessun impegno di volume, nessun abbonamento.

Modello	Input ufficiale /M	Output ufficiale /M	Input RunAPI /M	Output RunAPI /M	Finestra di contesto
GPT-5.5	$5.00	$30.00	$2.50	$15.00	400K
GPT-5.4	$2.50	$15.00	$1.25	$7.50	400K
GPT-5.4-mini	$0.25	$2.00	$0.13	$1.00	400K
GPT-5.3-codex	$2.50	$15.00	$1.25	$7.50	400K

Prezzi ufficiali OpenAI ↗ Prezzi RunAPI ↗

Cache e batch

Come gli sconti cache e batch riducono la tua fattura GPT?

OpenAI addebita meno per i token di input memorizzati nella cache e offre uno sconto significativo per le richieste batch che tollerano tempi di risposta differiti. Entrambi sono importanti per workload ripetitivi come agenti di coding ed elaborazione in blocco.

Input memorizzato nella cache

I prefissi di prompt ripetuti vengono fatturati a una tariffa di input ridotta. RunAPI trasmette lo sconto al 50% della tariffa cache di OpenAI.

Batch API (50% di sconto)

Le richieste inviate al Batch API vengono eseguite alla metà della tariffa standard con tempi di risposta fino a 24 ore. RunAPI trasmette questo sconto in aggiunta al proprio.

Intensità di ragionamento

I modelli GPT-5 permettono di impostare l'intensità del ragionamento. Un'intensità minore emette meno token di ragionamento, riducendo direttamente il costo di output nella fatturazione a consumo.

Controllo dei token di output

Limita il massimo dei token di output per richiesta per contenere i costi ed evitare generazioni incontrollate nelle attività agentiche prolungate.

Costi nel mondo reale

Quanto costa l'API GPT per workload reali?

Le tariffe per token sembrano astratte finché non le colleghi a compiti reali. Di seguito ci sono workload comuni per sviluppatori con costi mensili stimati a due livelli di utilizzo, fatturati alle tariffe RunAPI.

Workload	Modello	Uso leggero (~50 attività/giorno)	Uso intenso (~200 attività/giorno)	Risparmio mensile vs ufficiale
Agente di coding (Codex)	GPT-5.3-codex	$20/mese	$80/mese	$20–$80
Chatbot di supporto clienti	GPT-5.4-mini	$6/mese	$24/mese	$6–$24
Assistente knowledge RAG	GPT-5.4	$18/mese	$72/mese	$18–$72
Pipeline di generazione contenuti	GPT-5.4	$25/mese	$100/mese	$25–$100
Orchestratore multi-agente	GPT-5.5	$90/mese	$360/mese	$90–$360

Confronto tra provider

L'API OpenAI è più economica di Claude e Gemini?

Gli sviluppatori mettono a confronto GPT con Claude e Gemini. Ecco come i modelli principali si confrontano su base per milione di token, con le tariffe RunAPI a fianco.

Provider	Modello principale	Input /M	Output /M	Tariffa RunAPI
OpenAI	GPT-5.4	$2.50	$15.00	$1.25 / $7.50
Anthropic	Claude Opus 4.7	$10.00	$50.00	$5.00 / $25.00
Google	Gemini 2.5 Pro	$1.25	$10.00	$0.63 / $5.00

RunAPI applica uno sconto del 50% su tutti i provider elencati sopra. Prezzi verificati a giugno 2026.

Per iniziare

Come accedere all'API GPT tramite RunAPI

Crea un account RunAPI

Registrati su runapi.ai. Nessuna carta di credito richiesta per il livello gratuito.

Copia la tua chiave API

Vai su Dashboard → Chiavi API. Crea una chiave e salvala — la userai come chiave API OpenAI.

Punta il tuo SDK su RunAPI

Imposta l'URL base su https://api.runapi.ai/v1 e usa la tua chiave RunAPI. Qualsiasi client compatibile con OpenAI funziona.

Inizia a fare richieste

Usa gpt-5.4, gpt-5.5 o qualsiasi ID modello GPT nel parametro model. RunAPI gestisce il routing e la fatturazione al 50% del prezzo ufficiale.

Domande frequenti

FAQ sui prezzi dell'API OpenAI

Quanto costa l'API OpenAI GPT-5?

GPT-5.4 costa $2,50 per milione di token in input e $15 per milione di token in output ufficialmente. GPT-5.5 costa $5 e $30. Tramite RunAPI, ogni modello GPT viene fatturato alla metà di queste tariffe — GPT-5.4 è $1,25 in input e $7,50 in output per milione di token.

Perché RunAPI è il 50% più economico di OpenAI?

RunAPI negozia prezzi a volume con i fornitori di modelli e trasferisce i risparmi agli sviluppatori. Le richieste raggiungono gli stessi modelli OpenAI con output, filtri di sicurezza e comportamento identici, quindi l'unica differenza è la tariffa più bassa sulla tua fattura. Non c'è alcun compromesso sulla qualità e nessun livello di fatturazione separato — lo sconto si applica automaticamente a ogni modello GPT.

GPT-5 ha prezzi con cache?

Sì. OpenAI fattura i prefissi di prompt ripetuti a una tariffa di input con cache ridotta, il che abbassa i costi per gli agenti che inviano lo stesso contesto. RunAPI trasmette lo sconto della cache al 50% della tariffa con cache di OpenAI, in modo che i risparmi della cache si sommino allo sconto base.

Come funziona lo sconto del Batch API OpenAI?

Il Batch API esegue le richieste al 50% della tariffa standard in cambio di tempi di risposta fino a 24 ore. È adatto per lavori in blocco che non necessitano di risposte immediate. RunAPI trasmette questo sconto, quindi il lavoro batch viene fatturato alla metà della tariffa già scontata.

GPT è più economico di Claude o Gemini?

Sui token di input principali, GPT-5.4 a $2,50 si posiziona tra Gemini 2.5 Pro a $1,25 e Claude Opus a $10. La scelta più economica dipende dal livello del modello e dal workload. RunAPI dimezza la tariffa per tutti e tre, quindi la classifica relativa rimane la stessa.

Posso usare OpenAI SDK con RunAPI?

Sì. RunAPI è compatibile con OpenAI. Punta qualsiasi client OpenAI su https://api.runapi.ai/v1, usa la tua chiave RunAPI e passa un ID modello GPT. Il codice esistente che già usa OpenAI SDK funziona senza modifiche oltre all'URL base e alla chiave, quindi la migrazione di un progetto esistente richiede circa un minuto.

RunAPI supporta GPT-5.3-codex per il coding?

Sì. GPT-5.3-codex è disponibile tramite RunAPI al 50% della tariffa ufficiale, ovvero $1,25 in input e $7,50 in output per milione di token. Funziona con Codex e altri strumenti di coding compatibili con OpenAI sostituendo l'URL base e la chiave nelle impostazioni. Gli sconti per input con cache e batch vengono anch'essi trasmessi, riducendo ulteriormente il costo effettivo delle sessioni di coding ripetitive.

Esiste un livello gratuito?

Sì. I nuovi account RunAPI ricevono crediti gratuiti per testare qualsiasi modello GPT prima di impegnarsi. Successivamente, la fatturazione è strettamente a consumo senza spesa minima, nessun abbonamento e nessun impegno mensile — finanzi un saldo e ogni chiamata deduce il costo dei token. Puoi ricaricare qualsiasi importo e monitorare l'utilizzo per modello nella dashboard.

Esegui GPT-5 a metà prezzo.

Crea un account RunAPI gratuito, ottieni la tua chiave API e chiama qualsiasi modello OpenAI GPT al 50% rispetto ai prezzi ufficiali.

Ottieni chiave API gratuita Confronta i prezzi