Limite de requêtes quotidienne
Jusqu'à 500 requêtes par jour sur Gemini 2.5 Flash via le niveau gratuit. Suffisant pour le prototypage et les projets annexes à faible volume.
Google facture $1,25–$10 par million de tokens pour Gemini 2.5 Pro et bien moins pour Flash. Gemini est le flagship le moins cher parmi les trois grands. RunAPI reprend chaque modèle Gemini à la moitié du tarif officiel.
Google publie des prix par token pour deux niveaux principaux : Flash pour les tâches rapides et bon marché, et Pro pour une capacité maximale. Il y a aussi un niveau gratuit avec des limites de requêtes quotidiennes. Tous les prix ci-dessous sont par million de tokens, l'unité de facturation que Google utilise.
Gemini 2.5 Flash à $0,08/M en entrée et $0,30/M en sortie via RunAPI. Tarif officiel : $0,15/$0,60.
Gemini 2.5 Pro à $0,63/M en entrée et $5,00/M en sortie via RunAPI. Tarif officiel : $1,25/$10.
Google propose un niveau gratuit avec jusqu'à 500 requêtes par jour sur Flash, utile pour le prototypage avant de payer.
Gemini 2.5 Pro est moins cher que Claude Sonnet et GPT-5.4 sur le prix d'entrée, ce qui en fait le flagship le moins cher des trois grands.
Le tableau ci-dessous présente la tarification officielle de Google ainsi que la tarification RunAPI. RunAPI applique une remise forfaitaire de 50 % sur tous les modèles Gemini. Sans engagement de volume, sans abonnement.
| Modèle | Entrée officielle /M | Sortie officielle /M | Entrée RunAPI /M | Sortie RunAPI /M | Fenêtre de contexte |
|---|---|---|---|---|---|
| Gemini 2.5 Pro | $1.25 | $10.00 | $0.63 | $5.00 | 1M |
| Gemini 2.5 Flash | $0.15 | $0.60 | $0.08 | $0.30 | 1M |
| Gemini 2.5 Flash-Lite | $0.10 | $0.40 | $0.05 | $0.20 | 1M |
Google propose un niveau gratuit pour vous permettre de prototyper avant de payer. Il a des limites de requêtes quotidiennes et des limites de débit inférieures au niveau payant. Il convient aux tests, pas au trafic de production.
Jusqu'à 500 requêtes par jour sur Gemini 2.5 Flash via le niveau gratuit. Suffisant pour le prototypage et les projets annexes à faible volume.
Le niveau gratuit limite les requêtes par minute bien en dessous du niveau payant. Les charges de travail bursty ou de production atteindront rapidement la limite.
Les entrées du niveau gratuit peuvent être utilisées pour améliorer les produits de Google. Le trafic du niveau payant et RunAPI n'est pas utilisé pour l'entraînement, ce qui importe pour les données sensibles.
Passez au niveau payant ou RunAPI dès que vous avez besoin d'un débit régulier, de limites de débit plus élevées ou d'une meilleure gestion des données. RunAPI facture 50 % du tarif payant officiel sans limite quotidienne.
Les développeurs comparent souvent Gemini à Claude Sonnet et GPT-5.4. Voici comment les modèles phares se comparent sur la base du coût par million de tokens via RunAPI.
| Fournisseur | Modèle phare | Entrée /M | Sortie /M | Tarif RunAPI |
|---|---|---|---|---|
| Gemini 2.5 Pro | $1.25 | $10.00 | $0.63 / $5.00 | |
| OpenAI | GPT-5.4 | $2.50 | $15.00 | $1.25 / $7.50 |
| Anthropic | Claude Sonnet 4.6 | $6.00 | $30.00 | $3.00 / $15.00 |
RunAPI applique une remise de 50 % sur tous les fournisseurs listés ci-dessus. Gemini 2.5 Pro est le flagship le moins cher sur le prix d'entrée. Prix vérifiés en juin 2026.
Les coûts en tokens semblent abstraits tant qu'on ne les rattache pas à des tâches concrètes. Voici cinq charges de travail courantes pour les développeurs avec des coûts mensuels estimés à deux niveaux d'utilisation via RunAPI.
| Charge de travail | Modèle | Utilisation légère (~50 tâches/jour) | Utilisation intensive (~200 tâches/jour) | Économie mensuelle vs officiel |
|---|---|---|---|---|
| Analyse de documents à long contexte | Gemini 2.5 Pro | $18/mois | $72/mois | $18–$72 |
| Classification à fort volume | Gemini 2.5 Flash | $3/mois | $12/mois | $3–$12 |
| Chatbot de documentation RAG | Gemini 2.5 Flash | $5/mois | $20/mois | $5–$20 |
| Pipeline de génération de contenu | Gemini 2.5 Pro | $15/mois | $60/mois | $15–$60 |
| Orchestrateur multi-agents | Gemini 2.5 Pro | $60/mois | $240/mois | $60–$240 |
Inscrivez-vous sur runapi.ai. Aucune carte de crédit requise pour le niveau gratuit.
Accédez à Tableau de bord → Clés API. Créez une clé et sauvegardez-la — vous l'utiliserez comme votre clé API OpenAI.
Définissez l'URL de base sur https://api.runapi.ai/v1 et utilisez votre clé API RunAPI. Tout client compatible OpenAI fonctionne — Python, Node.js, Go, Ruby ou curl.
Utilisez gemini-2.5-pro, gemini-2.5-flash ou n'importe quel identifiant de modèle Gemini dans le paramètre model. RunAPI gère le routage et la facturation à 50 % du tarif officiel.
La tarification officielle de Google pour Gemini 2.5 Pro est de $1,25/M en entrée et $10/M en sortie. Gemini 2.5 Flash est à $0,15/M en entrée et $0,60/M en sortie. Via RunAPI, chaque modèle Gemini est à la moitié de ce tarif, sans abonnement ni engagement de volume. Vous ne payez que les tokens utilisés par chaque requête.
Sur le prix d'entrée, oui. Gemini 2.5 Pro à $1,25/M en entrée est moins cher que GPT-5.4 ($2,50) et Claude Sonnet ($6) au tarif officiel, ce qui en fait le flagship le moins cher des trois grands. RunAPI réduit les trois de moitié, donc l'écart se maintient.
Oui. Google propose un niveau gratuit avec jusqu'à 500 requêtes par jour sur Gemini 2.5 Flash et des limites de débit inférieures au niveau payant. Il convient au prototypage. Les entrées du niveau gratuit peuvent être utilisées pour améliorer les produits Google, donc évitez les données sensibles.
RunAPI négocie des tarifs de volume avec les fournisseurs de modèles et répercute les économies sur les développeurs. Il n'y a aucune différence de qualité — mêmes modèles, même API compatible OpenAI, même résultat. Il suffit de changer l'URL de base et la clé, et votre code client existant continue de fonctionner sans modification.
Oui. RunAPI est compatible OpenAI. Pointez n'importe quel client OpenAI vers api.runapi.ai/v1 et utilisez des identifiants de modèles Gemini comme gemini-2.5-pro. Le code SDK OpenAI existant fonctionne sans modification au-delà de l'URL de base et de la clé.
Gemini 2.5 Pro et Flash offrent tous deux une fenêtre de contexte de 1M tokens, plus grande que la plupart des modèles Claude et GPT. Combiné à un faible prix d'entrée, cela rend Gemini rentable pour analyser de longs documents, de grandes bases de code ou de nombreux fichiers à la fois.
L'API payante n'a pas de limite de messages fixe. Vous payez par token et évoluez selon vos besoins, dans les limites de débit par minute. Via RunAPI, il n'y a pas de limite de requêtes quotidienne comme le niveau gratuit, donc le trafic de production s'exécute sans limitation.
Paiement à l'usage. Vous alimentez votre compte avec un solde, et chaque appel API déduit le coût en tokens à la moitié du tarif officiel. Sans abonnement, sans factures, sans contrats. Vous pouvez surveiller les dépenses par clé depuis le tableau de bord RunAPI et configurer des alertes avant que le solde ne soit épuisé.
Créez un compte RunAPI gratuit, obtenez votre clé API et commencez à appeler Gemini 2.5 Pro ou Flash à 50 % de la tarification officielle de Google — le flagship le moins cher des trois grands.