Lecture de cache
Remise de 90 % sur les tokens d'entrée. Une lecture de cache Sonnet 4.6 coûte $0,30/M au lieu de $3,00/M via RunAPI.
Anthropic facture $3 à $15 par million de tokens selon le modèle. RunAPI reflète chaque modèle Claude à la moitié du tarif officiel — même API, même sortie, 50 % de moins sur votre facture.
Anthropic publie des tarifs par token pour trois niveaux de modèles : Haiku pour les tâches légères, Sonnet pour les charges de travail équilibrées et Opus pour une capacité maximale. Tous les prix ci-dessous sont par million de tokens, l'unité de facturation qu'Anthropic utilise.
Haiku 4.5 à $1/M d'entrée et $5/M de sortie via RunAPI. Tarif officiel : $2/$10.
Sonnet 4.6 à $3/M d'entrée et $15/M de sortie via RunAPI. Tarif officiel : $6/$30.
Opus 4.7 à $5/M d'entrée et $25/M de sortie via RunAPI. Tarif officiel : $10/$50.
Les lectures de cache coûtent 90 % de moins que les tokens d'entrée standard — $0,10/M pour Haiku via RunAPI.
Le tableau ci-dessous présente la tarification officielle d'Anthropic parallèlement à la tarification RunAPI. RunAPI applique une remise fixe de 50 % sur tous les modèles Claude. Pas d'engagements de volume, pas d'abonnements.
| Modèle | Entrée officielle /M | Sortie officielle /M | Entrée RunAPI /M | Sortie RunAPI /M | Fenêtre de contexte |
|---|---|---|---|---|---|
| Opus 4.8 | $15,00 | $75,00 | $7,50 | $37,50 | 200K |
| Opus 4.7 | $10,00 | $50,00 | $5,00 | $25,00 | 200K |
| Opus 4.6 | $10,00 | $50,00 | $5,00 | $25,00 | 200K |
| Sonnet 4.6 | $6,00 | $30,00 | $3,00 | $15,00 | 200K |
| Sonnet 4.5 | $6,00 | $30,00 | $3,00 | $15,00 | 200K |
| Haiku 4.5 | $2,00 | $10,00 | $1,00 | $5,00 | 200K |
La mise en cache des prompts d'Anthropic stocke les préfixes répétés et facture moins lorsque la version mise en cache est réutilisée. Cela est important pour les agents de codage comme Claude Code, qui envoient le même prompt système et le même contexte de fichier à chaque requête.
Remise de 90 % sur les tokens d'entrée. Une lecture de cache Sonnet 4.6 coûte $0,30/M au lieu de $3,00/M via RunAPI.
Surcharge de 25 % sur l'entrée — $3,75/M pour Sonnet 4.6 via RunAPI. Le préfixe mis en cache reste disponible pendant 5 minutes.
2x le taux d'entrée — $6,00/M pour Sonnet 4.6 via RunAPI. Utile pour les longues sessions de codage où la réutilisation du contexte est fréquente.
Anthropic offre une remise de 50 % sur tous les modèles pour les requêtes par lots qui tolèrent un délai d'exécution pouvant aller jusqu'à 24 heures. RunAPI répercute cette remise.
Les coûts en tokens semblent abstraits jusqu'à ce qu'ils soient associés à des tâches réelles. Voici cinq charges de travail courantes pour les développeurs avec des coûts mensuels estimés à deux niveaux d'utilisation.
| Charge de travail | Modèle | Utilisation légère (~50 tâches/jour) | Utilisation intensive (~200 tâches/jour) | Économie mensuelle vs officiel |
|---|---|---|---|---|
| Session de vibe coding (Claude Code) | Sonnet 4.6 | $45/mois | $180/mois | $45–$180 |
| Agent de revue de code PR | Opus 4.7 | $75/mois | $300/mois | $75–$300 |
| Chatbot de documentation RAG | Haiku 4.5 | $12/mois | $48/mois | $12–$48 |
| Pipeline de génération de contenu | Sonnet 4.6 | $30/mois | $120/mois | $30–$120 |
| Orchestrateur multi-agents | Opus 4.7 | $150/mois | $600/mois | $150–$600 |
Les développeurs comparent souvent Claude à GPT-5 et Gemini 2.5 Pro. Voici comment les modèles phares se comparent sur une base par million de tokens.
| Fournisseur | Modèle phare | Entrée /M | Sortie /M | Tarif RunAPI |
|---|---|---|---|---|
| Anthropic | Claude Opus 4.7 | $10,00 | $50,00 | $5,00 / $25,00 |
| OpenAI | GPT-5.4 | $2,50 | $15,00 | $1,25 / $7,50 |
| Gemini 2.5 Pro | $1,25 | $10,00 | $0,63 / $5,00 |
RunAPI applique une remise de 50 % sur tous les fournisseurs listés ci-dessus. Prix vérifiés en juin 2026.
Claude Max coûte $100/mois pour une utilisation illimitée de Claude Code (ou $200 pour le plan 5x). L'API facture par token. Pour les développeurs qui génèrent moins de 10 millions de tokens de sortie par mois sur Sonnet 4.6, l'option RunAPI coûte moins que l'abonnement Max — et il n'y a pas de plafond d'utilisation sur aucun niveau de modèle.
Utilisation illimitée de Sonnet et Opus limité dans Claude Code. Coût mensuel fixe. Pas d'accès API.
Paiement par token sans engagement mensuel. Sonnet 4.6 à $3/M d'entrée et $15/M de sortie. $100 achète environ 6,7 millions de tokens de sortie — suffisant pour la plupart des développeurs individuels.
Utilisateurs quotidiens intensifs qui dépassent systématiquement 10 millions de tokens de sortie par mois. Le seuil de rentabilité sur Sonnet 4.6 via RunAPI est d'environ 6,7 M de tokens de sortie.
Équipes, pipelines CI, configurations multi-modèles et développeurs qui souhaitent accéder à Opus ou Haiku en plus de Sonnet. Pas de plafond, pas de liste d'attente, pas de verrouillage d'abonnement.
Inscrivez-vous sur runapi.ai. Aucune carte de crédit requise pour le niveau gratuit.
Allez dans Tableau de bord → Clés API. Créez une clé et sauvegardez-la — vous l'utiliserez comme clé API OpenAI.
Définissez l'URL de base sur https://api.runapi.ai/v1 et utilisez votre clé API RunAPI. Tout client compatible OpenAI fonctionne — Python, Node.js, Go, Ruby ou curl.
Utilisez claude-sonnet-4-6, claude-opus-4-7 ou tout identifiant de modèle Claude dans le paramètre de modèle. RunAPI gère le routage et la facturation à 50 % du tarif officiel.
Non. RunAPI transmet les requêtes directement à l'API d'Anthropic. La sortie du modèle, les filtres de sécurité et le comportement sont identiques à un appel direct à Anthropic.
RunAPI négocie des tarifs de volume avec les fournisseurs de modèles et répercute les économies sur les développeurs. Il n'y a aucune différence de qualité — mêmes modèles, même API.
Oui. Définissez ANTHROPIC_BASE_URL sur https://api.runapi.ai et votre clé RunAPI comme clé API. Claude Code fonctionne sans modification.
RunAPI s'ajuste dans les 24 heures. La remise de 50 % est maintenue par rapport aux tarifs publiés par Anthropic.
Oui. Les nouveaux comptes reçoivent des crédits gratuits pour tester n'importe quel modèle. Ensuite, la facturation est strictement à l'utilisation sans minimum.
Oui. Les lectures de cache, les écritures de 5 minutes et les écritures d'1 heure sont toutes prises en charge à 50 % de la tarification de cache d'Anthropic.
Oui. RunAPI est compatible avec OpenAI. Dirigez n'importe quel client OpenAI vers api.runapi.ai/v1 et utilisez les identifiants de modèle Claude.
À l'utilisation. Vous approvisionnez votre compte avec un solde, et chaque appel API déduit le coût en tokens. Pas d'abonnements, pas de factures, pas de contrats.
Créez un compte RunAPI gratuit, obtenez votre clé API et commencez à appeler Claude Opus, Sonnet ou Haiku à 50 % du tarif officiel d'Anthropic.