Entrée mise en cache
Les préfixes de prompt répétés sont facturés à un tarif d'entrée réduit. RunAPI répercute la remise à 50 % du tarif mis en cache d'OpenAI.
GPT-5.4 coûte $2,50 en entrée et $15 en sortie par million de tokens ; GPT-5.5 coûte $5 et $30. RunAPI reprend chaque modèle GPT à la moitié du tarif officiel — même API, même résultat, 50 % de moins sur votre facture.
OpenAI facture chaque modèle GPT par million de tokens, avec des tarifs distincts pour l'entrée et la sortie et un tarif d'entrée mise en cache moins élevé. Tous les chiffres ci-dessous sont par million de tokens, l'unité de facturation qu'OpenAI utilise.
GPT-5.4 à $1,25/M en entrée et $7,50/M en sortie via RunAPI. Tarif officiel : $2,50/$15.
GPT-5.4-mini à une fraction du tarif phare, facturé à 50 % de remise via RunAPI.
GPT-5.5 à $2,50/M en entrée et $15/M en sortie via RunAPI. Tarif officiel : $5/$30.
Les tokens d'entrée mis en cache coûtent une fraction de l'entrée standard — répercutés à 50 % sur RunAPI.
Le tableau présente la tarification officielle d'OpenAI ainsi que la tarification RunAPI. RunAPI applique une remise forfaitaire de 50 % sur tous les modèles GPT. Sans engagement de volume, sans abonnement.
| Modèle | Entrée officielle /M | Sortie officielle /M | Entrée RunAPI /M | Sortie RunAPI /M | Fenêtre de contexte |
|---|---|---|---|---|---|
| GPT-5.5 | $5.00 | $30.00 | $2.50 | $15.00 | 400K |
| GPT-5.4 | $2.50 | $15.00 | $1.25 | $7.50 | 400K |
| GPT-5.4-mini | $0.25 | $2.00 | $0.13 | $1.00 | 400K |
| GPT-5.3-codex | $2.50 | $15.00 | $1.25 | $7.50 | 400K |
OpenAI facture moins cher les tokens d'entrée mis en cache et offre une remise importante sur les requêtes par lots qui tolèrent un délai de traitement. Les deux sont importants pour les charges de travail répétitives comme les agents de codage et le traitement en masse.
Les préfixes de prompt répétés sont facturés à un tarif d'entrée réduit. RunAPI répercute la remise à 50 % du tarif mis en cache d'OpenAI.
Les requêtes soumises à l'API Batch sont exécutées à la moitié du tarif standard avec un délai pouvant aller jusqu'à 24 heures. RunAPI répercute cette remise en plus de la sienne.
Les modèles GPT-5 permettent de définir l'effort de raisonnement. Un effort réduit émet moins de tokens de raisonnement, ce qui réduit directement le coût de sortie sur une facturation au compteur.
Limitez le nombre maximum de tokens de sortie par requête pour maîtriser les coûts et éviter les générations incontrôlées sur de longues tâches agentiques.
Les tarifs par token semblent abstraits tant qu'on ne les rattache pas à des tâches concrètes. Voici des charges de travail courantes pour les développeurs avec des coûts mensuels estimés à deux niveaux d'utilisation, facturés aux tarifs RunAPI.
| Charge de travail | Modèle | Utilisation légère (~50 tâches/jour) | Utilisation intensive (~200 tâches/jour) | Économie mensuelle vs officiel |
|---|---|---|---|---|
| Agent de codage (Codex) | GPT-5.3-codex | $20/mois | $80/mois | $20–$80 |
| Chatbot de support client | GPT-5.4-mini | $6/mois | $24/mois | $6–$24 |
| Assistant de connaissances RAG | GPT-5.4 | $18/mois | $72/mois | $18–$72 |
| Pipeline de génération de contenu | GPT-5.4 | $25/mois | $100/mois | $25–$100 |
| Orchestrateur multi-agents | GPT-5.5 | $90/mois | $360/mois | $90–$360 |
Les développeurs comparent GPT à Claude et Gemini. Voici comment les modèles phares se comparent sur la base du coût par million de tokens, avec les tarifs RunAPI en regard.
| Fournisseur | Modèle phare | Entrée /M | Sortie /M | Tarif RunAPI |
|---|---|---|---|---|
| OpenAI | GPT-5.4 | $2.50 | $15.00 | $1.25 / $7.50 |
| Anthropic | Claude Opus 4.7 | $10.00 | $50.00 | $5.00 / $25.00 |
| Gemini 2.5 Pro | $1.25 | $10.00 | $0.63 / $5.00 |
RunAPI applique une remise de 50 % sur tous les fournisseurs listés ci-dessus. Prix vérifiés en juin 2026.
Inscrivez-vous sur runapi.ai. Aucune carte de crédit requise pour le niveau gratuit.
Accédez à Tableau de bord → Clés API. Créez une clé et sauvegardez-la — vous l'utiliserez comme votre clé API OpenAI.
Définissez l'URL de base sur https://api.runapi.ai/v1 et utilisez votre clé RunAPI. Tout client compatible OpenAI fonctionne.
Utilisez gpt-5.4, gpt-5.5 ou n'importe quel identifiant de modèle GPT dans le paramètre model. RunAPI gère le routage et la facturation à 50 % du tarif officiel.
GPT-5.4 coûte officiellement $2,50 par million de tokens en entrée et $15 par million en sortie. GPT-5.5 coûte $5 et $30. Via RunAPI, chaque modèle GPT est facturé à la moitié de ces tarifs — GPT-5.4 revient à $1,25 en entrée et $7,50 en sortie par million de tokens.
RunAPI négocie des tarifs de volume avec les fournisseurs de modèles et répercute les économies sur les développeurs. Les requêtes atteignent les mêmes modèles OpenAI avec des résultats, des filtres de sécurité et un comportement identiques, de sorte que la seule différence est le tarif inférieur sur votre facture. Il n'y a aucun compromis de qualité et aucun niveau de facturation distinct — la remise s'applique automatiquement à chaque modèle GPT.
Oui. OpenAI facture les préfixes de prompt répétés à un tarif d'entrée mise en cache réduit, ce qui réduit le coût pour les agents qui renvoient le même contexte. RunAPI répercute la remise sur le cache à 50 % du tarif mis en cache d'OpenAI, de sorte que les économies de cache s'ajoutent à la remise de base.
L'API Batch exécute les requêtes à 50 % du tarif standard en échange d'un délai pouvant aller jusqu'à 24 heures. Elle convient aux travaux en masse qui n'ont pas besoin de réponses instantanées. RunAPI répercute cette remise, de sorte que le travail par lots est facturé à la moitié du tarif déjà réduit.
Sur les tokens d'entrée phares, GPT-5.4 à $2,50 se situe entre Gemini 2.5 Pro à $1,25 et Claude Opus à $10. Le choix le moins cher dépend du niveau du modèle et de la charge de travail. RunAPI réduit de moitié le tarif des trois, de sorte que le classement relatif reste le même.
Oui. RunAPI est compatible OpenAI. Pointez n'importe quel client OpenAI vers https://api.runapi.ai/v1, utilisez votre clé RunAPI et passez un identifiant de modèle GPT. Le code existant utilisant déjà le SDK OpenAI fonctionne sans aucune modification au-delà de l'URL de base et de la clé, donc la migration d'un projet établi prend environ une minute.
Oui. GPT-5.3-codex est disponible via RunAPI à 50 % du tarif officiel, soit $1,25 en entrée et $7,50 en sortie par million de tokens. Il fonctionne avec Codex et d'autres outils de codage compatibles OpenAI en remplaçant l'URL de base et la clé dans leurs paramètres. Les remises sur l'entrée mise en cache et par lots sont également répercutées, ce qui réduit davantage le coût effectif des sessions de codage répétitives.
Oui. Les nouveaux comptes RunAPI reçoivent des crédits gratuits pour tester n'importe quel modèle GPT avant de s'engager. Ensuite, la facturation est strictement à l'usage sans dépense minimale, sans abonnement et sans engagement mensuel — vous alimentez un solde et chaque appel déduit son coût en tokens. Vous pouvez recharger n'importe quel montant et surveiller l'utilisation par modèle dans le tableau de bord.
Créez un compte RunAPI gratuit, obtenez votre clé API et appelez n'importe quel modèle GPT d'OpenAI à 50 % de la tarification officielle.