Tarification API LLM

Tarification API Gemini en 2026

Google facture $1,25–$10 par million de tokens pour Gemini 2.5 Pro et bien moins pour Flash. Gemini est le flagship le moins cher parmi les trois grands. RunAPI reprend chaque modèle Gemini à la moitié du tarif officiel.

Mis à jour le June 18, 2026 RunAPI Editorial
En un coup d'œil

Quel est le coût actuel de l'API Gemini ?

Google publie des prix par token pour deux niveaux principaux : Flash pour les tâches rapides et bon marché, et Pro pour une capacité maximale. Il y a aussi un niveau gratuit avec des limites de requêtes quotidiennes. Tous les prix ci-dessous sont par million de tokens, l'unité de facturation que Google utilise.

Option la moins chère

Gemini 2.5 Flash à $0,08/M en entrée et $0,30/M en sortie via RunAPI. Tarif officiel : $0,15/$0,60.

Capacité maximale

Gemini 2.5 Pro à $0,63/M en entrée et $5,00/M en sortie via RunAPI. Tarif officiel : $1,25/$10.

Niveau gratuit

Google propose un niveau gratuit avec jusqu'à 500 requêtes par jour sur Flash, utile pour le prototypage avant de payer.

Flagship le moins cher

Gemini 2.5 Pro est moins cher que Claude Sonnet et GPT-5.4 sur le prix d'entrée, ce qui en fait le flagship le moins cher des trois grands.

Détail modèle par modèle

Combien coûte chaque modèle Gemini par million de tokens ?

Le tableau ci-dessous présente la tarification officielle de Google ainsi que la tarification RunAPI. RunAPI applique une remise forfaitaire de 50 % sur tous les modèles Gemini. Sans engagement de volume, sans abonnement.

Modèle Entrée officielle /M Sortie officielle /M Entrée RunAPI /M Sortie RunAPI /M Fenêtre de contexte
Gemini 2.5 Pro $1.25 $10.00 $0.63 $5.00 1M
Gemini 2.5 Flash $0.15 $0.60 $0.08 $0.30 1M
Gemini 2.5 Flash-Lite $0.10 $0.40 $0.05 $0.20 1M
Niveau gratuit

Comment fonctionne le niveau gratuit Gemini de Google ?

Google propose un niveau gratuit pour vous permettre de prototyper avant de payer. Il a des limites de requêtes quotidiennes et des limites de débit inférieures au niveau payant. Il convient aux tests, pas au trafic de production.

Limite de requêtes quotidienne

Jusqu'à 500 requêtes par jour sur Gemini 2.5 Flash via le niveau gratuit. Suffisant pour le prototypage et les projets annexes à faible volume.

Limites de débit inférieures

Le niveau gratuit limite les requêtes par minute bien en dessous du niveau payant. Les charges de travail bursty ou de production atteindront rapidement la limite.

Conditions d'utilisation des données

Les entrées du niveau gratuit peuvent être utilisées pour améliorer les produits de Google. Le trafic du niveau payant et RunAPI n'est pas utilisé pour l'entraînement, ce qui importe pour les données sensibles.

Quand passer au niveau supérieur

Passez au niveau payant ou RunAPI dès que vous avez besoin d'un débit régulier, de limites de débit plus élevées ou d'une meilleure gestion des données. RunAPI facture 50 % du tarif payant officiel sans limite quotidienne.

Comparaison des fournisseurs

Gemini est-il moins cher que Claude et GPT ?

Les développeurs comparent souvent Gemini à Claude Sonnet et GPT-5.4. Voici comment les modèles phares se comparent sur la base du coût par million de tokens via RunAPI.

Fournisseur Modèle phare Entrée /M Sortie /M Tarif RunAPI
Google Gemini 2.5 Pro $1.25 $10.00 $0.63 / $5.00
OpenAI GPT-5.4 $2.50 $15.00 $1.25 / $7.50
Anthropic Claude Sonnet 4.6 $6.00 $30.00 $3.00 / $15.00

RunAPI applique une remise de 50 % sur tous les fournisseurs listés ci-dessus. Gemini 2.5 Pro est le flagship le moins cher sur le prix d'entrée. Prix vérifiés en juin 2026.

Coûts réels

Quel est le vrai coût de l'API Gemini pour des charges de travail réelles ?

Les coûts en tokens semblent abstraits tant qu'on ne les rattache pas à des tâches concrètes. Voici cinq charges de travail courantes pour les développeurs avec des coûts mensuels estimés à deux niveaux d'utilisation via RunAPI.

Charge de travail Modèle Utilisation légère (~50 tâches/jour) Utilisation intensive (~200 tâches/jour) Économie mensuelle vs officiel
Analyse de documents à long contexte Gemini 2.5 Pro $18/mois $72/mois $18–$72
Classification à fort volume Gemini 2.5 Flash $3/mois $12/mois $3–$12
Chatbot de documentation RAG Gemini 2.5 Flash $5/mois $20/mois $5–$20
Pipeline de génération de contenu Gemini 2.5 Pro $15/mois $60/mois $15–$60
Orchestrateur multi-agents Gemini 2.5 Pro $60/mois $240/mois $60–$240
Premiers pas

Comment accéder à l'API Gemini via RunAPI

1

Créer un compte RunAPI

Inscrivez-vous sur runapi.ai. Aucune carte de crédit requise pour le niveau gratuit.

2

Copier votre clé API

Accédez à Tableau de bord → Clés API. Créez une clé et sauvegardez-la — vous l'utiliserez comme votre clé API OpenAI.

3

Pointer votre SDK vers RunAPI

Définissez l'URL de base sur https://api.runapi.ai/v1 et utilisez votre clé API RunAPI. Tout client compatible OpenAI fonctionne — Python, Node.js, Go, Ruby ou curl.

4

Commencer à faire des requêtes

Utilisez gemini-2.5-pro, gemini-2.5-flash ou n'importe quel identifiant de modèle Gemini dans le paramètre model. RunAPI gère le routage et la facturation à 50 % du tarif officiel.

Questions fréquentes

FAQ Tarification API Gemini

Combien coûte l'API Gemini ?

La tarification officielle de Google pour Gemini 2.5 Pro est de $1,25/M en entrée et $10/M en sortie. Gemini 2.5 Flash est à $0,15/M en entrée et $0,60/M en sortie. Via RunAPI, chaque modèle Gemini est à la moitié de ce tarif, sans abonnement ni engagement de volume. Vous ne payez que les tokens utilisés par chaque requête.

Gemini est-il moins cher que Claude et GPT ?

Sur le prix d'entrée, oui. Gemini 2.5 Pro à $1,25/M en entrée est moins cher que GPT-5.4 ($2,50) et Claude Sonnet ($6) au tarif officiel, ce qui en fait le flagship le moins cher des trois grands. RunAPI réduit les trois de moitié, donc l'écart se maintient.

Gemini a-t-il un niveau gratuit ?

Oui. Google propose un niveau gratuit avec jusqu'à 500 requêtes par jour sur Gemini 2.5 Flash et des limites de débit inférieures au niveau payant. Il convient au prototypage. Les entrées du niveau gratuit peuvent être utilisées pour améliorer les produits Google, donc évitez les données sensibles.

Pourquoi RunAPI est-il 50 % moins cher que l'API officielle ?

RunAPI négocie des tarifs de volume avec les fournisseurs de modèles et répercute les économies sur les développeurs. Il n'y a aucune différence de qualité — mêmes modèles, même API compatible OpenAI, même résultat. Il suffit de changer l'URL de base et la clé, et votre code client existant continue de fonctionner sans modification.

Puis-je utiliser Gemini avec le SDK OpenAI ?

Oui. RunAPI est compatible OpenAI. Pointez n'importe quel client OpenAI vers api.runapi.ai/v1 et utilisez des identifiants de modèles Gemini comme gemini-2.5-pro. Le code SDK OpenAI existant fonctionne sans modification au-delà de l'URL de base et de la clé.

Pourquoi Gemini est-il bon pour les tâches à long contexte ?

Gemini 2.5 Pro et Flash offrent tous deux une fenêtre de contexte de 1M tokens, plus grande que la plupart des modèles Claude et GPT. Combiné à un faible prix d'entrée, cela rend Gemini rentable pour analyser de longs documents, de grandes bases de code ou de nombreux fichiers à la fois.

Y a-t-il une limite d'utilisation sur l'API payante ?

L'API payante n'a pas de limite de messages fixe. Vous payez par token et évoluez selon vos besoins, dans les limites de débit par minute. Via RunAPI, il n'y a pas de limite de requêtes quotidienne comme le niveau gratuit, donc le trafic de production s'exécute sans limitation.

Comment fonctionne la facturation ?

Paiement à l'usage. Vous alimentez votre compte avec un solde, et chaque appel API déduit le coût en tokens à la moitié du tarif officiel. Sans abonnement, sans factures, sans contrats. Vous pouvez surveiller les dépenses par clé depuis le tableau de bord RunAPI et configurer des alertes avant que le solde ne soit épuisé.

Commencez à utiliser Gemini à moitié prix.

Créez un compte RunAPI gratuit, obtenez votre clé API et commencez à appeler Gemini 2.5 Pro ou Flash à 50 % de la tarification officielle de Google — le flagship le moins cher des trois grands.