Tarification API LLM

Tarification API OpenAI en 2026

GPT-5.4 coûte $2,50 en entrée et $15 en sortie par million de tokens ; GPT-5.5 coûte $5 et $30. RunAPI reprend chaque modèle GPT à la moitié du tarif officiel — même API, même résultat, 50 % de moins sur votre facture.

Mis à jour le June 18, 2026 RunAPI Editorial
En un coup d'œil

Quel est le coût actuel de l'API OpenAI ?

OpenAI facture chaque modèle GPT par million de tokens, avec des tarifs distincts pour l'entrée et la sortie et un tarif d'entrée mise en cache moins élevé. Tous les chiffres ci-dessous sont par million de tokens, l'unité de facturation qu'OpenAI utilise.

Le plus populaire

GPT-5.4 à $1,25/M en entrée et $7,50/M en sortie via RunAPI. Tarif officiel : $2,50/$15.

Option la moins chère

GPT-5.4-mini à une fraction du tarif phare, facturé à 50 % de remise via RunAPI.

Capacité maximale

GPT-5.5 à $2,50/M en entrée et $15/M en sortie via RunAPI. Tarif officiel : $5/$30.

Remise sur le cache

Les tokens d'entrée mis en cache coûtent une fraction de l'entrée standard — répercutés à 50 % sur RunAPI.

Détail modèle par modèle

Combien coûte chaque modèle GPT par million de tokens ?

Le tableau présente la tarification officielle d'OpenAI ainsi que la tarification RunAPI. RunAPI applique une remise forfaitaire de 50 % sur tous les modèles GPT. Sans engagement de volume, sans abonnement.

Modèle Entrée officielle /M Sortie officielle /M Entrée RunAPI /M Sortie RunAPI /M Fenêtre de contexte
GPT-5.5 $5.00 $30.00 $2.50 $15.00 400K
GPT-5.4 $2.50 $15.00 $1.25 $7.50 400K
GPT-5.4-mini $0.25 $2.00 $0.13 $1.00 400K
GPT-5.3-codex $2.50 $15.00 $1.25 $7.50 400K
Cache et traitement par lots

Comment les remises sur le cache et les lots réduisent-elles votre facture GPT ?

OpenAI facture moins cher les tokens d'entrée mis en cache et offre une remise importante sur les requêtes par lots qui tolèrent un délai de traitement. Les deux sont importants pour les charges de travail répétitives comme les agents de codage et le traitement en masse.

Entrée mise en cache

Les préfixes de prompt répétés sont facturés à un tarif d'entrée réduit. RunAPI répercute la remise à 50 % du tarif mis en cache d'OpenAI.

API Batch (50 % de remise)

Les requêtes soumises à l'API Batch sont exécutées à la moitié du tarif standard avec un délai pouvant aller jusqu'à 24 heures. RunAPI répercute cette remise en plus de la sienne.

Effort de raisonnement

Les modèles GPT-5 permettent de définir l'effort de raisonnement. Un effort réduit émet moins de tokens de raisonnement, ce qui réduit directement le coût de sortie sur une facturation au compteur.

Contrôle des tokens de sortie

Limitez le nombre maximum de tokens de sortie par requête pour maîtriser les coûts et éviter les générations incontrôlées sur de longues tâches agentiques.

Coûts réels

Quel est le vrai coût de l'API GPT pour des charges de travail réelles ?

Les tarifs par token semblent abstraits tant qu'on ne les rattache pas à des tâches concrètes. Voici des charges de travail courantes pour les développeurs avec des coûts mensuels estimés à deux niveaux d'utilisation, facturés aux tarifs RunAPI.

Charge de travail Modèle Utilisation légère (~50 tâches/jour) Utilisation intensive (~200 tâches/jour) Économie mensuelle vs officiel
Agent de codage (Codex) GPT-5.3-codex $20/mois $80/mois $20–$80
Chatbot de support client GPT-5.4-mini $6/mois $24/mois $6–$24
Assistant de connaissances RAG GPT-5.4 $18/mois $72/mois $18–$72
Pipeline de génération de contenu GPT-5.4 $25/mois $100/mois $25–$100
Orchestrateur multi-agents GPT-5.5 $90/mois $360/mois $90–$360
Comparaison des fournisseurs

L'API OpenAI est-elle moins chère que Claude et Gemini ?

Les développeurs comparent GPT à Claude et Gemini. Voici comment les modèles phares se comparent sur la base du coût par million de tokens, avec les tarifs RunAPI en regard.

Fournisseur Modèle phare Entrée /M Sortie /M Tarif RunAPI
OpenAI GPT-5.4 $2.50 $15.00 $1.25 / $7.50
Anthropic Claude Opus 4.7 $10.00 $50.00 $5.00 / $25.00
Google Gemini 2.5 Pro $1.25 $10.00 $0.63 / $5.00

RunAPI applique une remise de 50 % sur tous les fournisseurs listés ci-dessus. Prix vérifiés en juin 2026.

Premiers pas

Comment accéder à l'API GPT via RunAPI

1

Créer un compte RunAPI

Inscrivez-vous sur runapi.ai. Aucune carte de crédit requise pour le niveau gratuit.

2

Copier votre clé API

Accédez à Tableau de bord → Clés API. Créez une clé et sauvegardez-la — vous l'utiliserez comme votre clé API OpenAI.

3

Pointer votre SDK vers RunAPI

Définissez l'URL de base sur https://api.runapi.ai/v1 et utilisez votre clé RunAPI. Tout client compatible OpenAI fonctionne.

4

Commencer à faire des requêtes

Utilisez gpt-5.4, gpt-5.5 ou n'importe quel identifiant de modèle GPT dans le paramètre model. RunAPI gère le routage et la facturation à 50 % du tarif officiel.

Questions fréquentes

FAQ Tarification API OpenAI

Combien coûte l'API GPT-5 d'OpenAI ?

GPT-5.4 coûte officiellement $2,50 par million de tokens en entrée et $15 par million en sortie. GPT-5.5 coûte $5 et $30. Via RunAPI, chaque modèle GPT est facturé à la moitié de ces tarifs — GPT-5.4 revient à $1,25 en entrée et $7,50 en sortie par million de tokens.

Pourquoi RunAPI est-il 50 % moins cher qu'OpenAI ?

RunAPI négocie des tarifs de volume avec les fournisseurs de modèles et répercute les économies sur les développeurs. Les requêtes atteignent les mêmes modèles OpenAI avec des résultats, des filtres de sécurité et un comportement identiques, de sorte que la seule différence est le tarif inférieur sur votre facture. Il n'y a aucun compromis de qualité et aucun niveau de facturation distinct — la remise s'applique automatiquement à chaque modèle GPT.

GPT-5 a-t-il une tarification pour le cache ?

Oui. OpenAI facture les préfixes de prompt répétés à un tarif d'entrée mise en cache réduit, ce qui réduit le coût pour les agents qui renvoient le même contexte. RunAPI répercute la remise sur le cache à 50 % du tarif mis en cache d'OpenAI, de sorte que les économies de cache s'ajoutent à la remise de base.

Comment fonctionne la remise de l'API Batch d'OpenAI ?

L'API Batch exécute les requêtes à 50 % du tarif standard en échange d'un délai pouvant aller jusqu'à 24 heures. Elle convient aux travaux en masse qui n'ont pas besoin de réponses instantanées. RunAPI répercute cette remise, de sorte que le travail par lots est facturé à la moitié du tarif déjà réduit.

GPT est-il moins cher que Claude ou Gemini ?

Sur les tokens d'entrée phares, GPT-5.4 à $2,50 se situe entre Gemini 2.5 Pro à $1,25 et Claude Opus à $10. Le choix le moins cher dépend du niveau du modèle et de la charge de travail. RunAPI réduit de moitié le tarif des trois, de sorte que le classement relatif reste le même.

Puis-je utiliser le SDK OpenAI avec RunAPI ?

Oui. RunAPI est compatible OpenAI. Pointez n'importe quel client OpenAI vers https://api.runapi.ai/v1, utilisez votre clé RunAPI et passez un identifiant de modèle GPT. Le code existant utilisant déjà le SDK OpenAI fonctionne sans aucune modification au-delà de l'URL de base et de la clé, donc la migration d'un projet établi prend environ une minute.

RunAPI prend-il en charge GPT-5.3-codex pour le codage ?

Oui. GPT-5.3-codex est disponible via RunAPI à 50 % du tarif officiel, soit $1,25 en entrée et $7,50 en sortie par million de tokens. Il fonctionne avec Codex et d'autres outils de codage compatibles OpenAI en remplaçant l'URL de base et la clé dans leurs paramètres. Les remises sur l'entrée mise en cache et par lots sont également répercutées, ce qui réduit davantage le coût effectif des sessions de codage répétitives.

Y a-t-il un niveau gratuit ?

Oui. Les nouveaux comptes RunAPI reçoivent des crédits gratuits pour tester n'importe quel modèle GPT avant de s'engager. Ensuite, la facturation est strictement à l'usage sans dépense minimale, sans abonnement et sans engagement mensuel — vous alimentez un solde et chaque appel déduit son coût en tokens. Vous pouvez recharger n'importe quel montant et surveiller l'utilisation par modèle dans le tableau de bord.

Exécutez GPT-5 à moitié prix.

Créez un compte RunAPI gratuit, obtenez votre clé API et appelez n'importe quel modèle GPT d'OpenAI à 50 % de la tarification officielle.