Tarification de l'API LLM

Tarification de l'API Claude en 2026

Anthropic facture $3 à $15 par million de tokens selon le modèle. RunAPI reflète chaque modèle Claude à la moitié du tarif officiel — même API, même sortie, 50 % de moins sur votre facture.

Mis à jour le June 18, 2026 RunAPI Editorial
En un coup d'œil

Quel est le coût actuel de l'API Claude ?

Anthropic publie des tarifs par token pour trois niveaux de modèles : Haiku pour les tâches légères, Sonnet pour les charges de travail équilibrées et Opus pour une capacité maximale. Tous les prix ci-dessous sont par million de tokens, l'unité de facturation qu'Anthropic utilise.

Option la moins chère

Haiku 4.5 à $1/M d'entrée et $5/M de sortie via RunAPI. Tarif officiel : $2/$10.

Le plus populaire

Sonnet 4.6 à $3/M d'entrée et $15/M de sortie via RunAPI. Tarif officiel : $6/$30.

Capacité maximale

Opus 4.7 à $5/M d'entrée et $25/M de sortie via RunAPI. Tarif officiel : $10/$50.

Remise de cache

Les lectures de cache coûtent 90 % de moins que les tokens d'entrée standard — $0,10/M pour Haiku via RunAPI.

Détail par modèle

Combien coûte chaque modèle Claude par million de tokens ?

Le tableau ci-dessous présente la tarification officielle d'Anthropic parallèlement à la tarification RunAPI. RunAPI applique une remise fixe de 50 % sur tous les modèles Claude. Pas d'engagements de volume, pas d'abonnements.

Modèle Entrée officielle /M Sortie officielle /M Entrée RunAPI /M Sortie RunAPI /M Fenêtre de contexte
Opus 4.8 $15,00 $75,00 $7,50 $37,50 200K
Opus 4.7 $10,00 $50,00 $5,00 $25,00 200K
Opus 4.6 $10,00 $50,00 $5,00 $25,00 200K
Sonnet 4.6 $6,00 $30,00 $3,00 $15,00 200K
Sonnet 4.5 $6,00 $30,00 $3,00 $15,00 200K
Haiku 4.5 $2,00 $10,00 $1,00 $5,00 200K
Mise en cache des prompts

Comment les remises de cache réduisent-elles votre facture API Claude ?

La mise en cache des prompts d'Anthropic stocke les préfixes répétés et facture moins lorsque la version mise en cache est réutilisée. Cela est important pour les agents de codage comme Claude Code, qui envoient le même prompt système et le même contexte de fichier à chaque requête.

Lecture de cache

Remise de 90 % sur les tokens d'entrée. Une lecture de cache Sonnet 4.6 coûte $0,30/M au lieu de $3,00/M via RunAPI.

Écriture de cache (TTL 5 min)

Surcharge de 25 % sur l'entrée — $3,75/M pour Sonnet 4.6 via RunAPI. Le préfixe mis en cache reste disponible pendant 5 minutes.

Écriture de cache (TTL 1 heure)

2x le taux d'entrée — $6,00/M pour Sonnet 4.6 via RunAPI. Utile pour les longues sessions de codage où la réutilisation du contexte est fréquente.

Traitement par lots

Anthropic offre une remise de 50 % sur tous les modèles pour les requêtes par lots qui tolèrent un délai d'exécution pouvant aller jusqu'à 24 heures. RunAPI répercute cette remise.

Coûts du monde réel

Quel est le coût réel de l'API Claude pour des charges de travail réelles ?

Les coûts en tokens semblent abstraits jusqu'à ce qu'ils soient associés à des tâches réelles. Voici cinq charges de travail courantes pour les développeurs avec des coûts mensuels estimés à deux niveaux d'utilisation.

Charge de travail Modèle Utilisation légère (~50 tâches/jour) Utilisation intensive (~200 tâches/jour) Économie mensuelle vs officiel
Session de vibe coding (Claude Code) Sonnet 4.6 $45/mois $180/mois $45–$180
Agent de revue de code PR Opus 4.7 $75/mois $300/mois $75–$300
Chatbot de documentation RAG Haiku 4.5 $12/mois $48/mois $12–$48
Pipeline de génération de contenu Sonnet 4.6 $30/mois $120/mois $30–$120
Orchestrateur multi-agents Opus 4.7 $150/mois $600/mois $150–$600
Comparaison des fournisseurs

L'API Claude est-elle moins chère qu'OpenAI et Gemini ?

Les développeurs comparent souvent Claude à GPT-5 et Gemini 2.5 Pro. Voici comment les modèles phares se comparent sur une base par million de tokens.

Fournisseur Modèle phare Entrée /M Sortie /M Tarif RunAPI
Anthropic Claude Opus 4.7 $10,00 $50,00 $5,00 / $25,00
OpenAI GPT-5.4 $2,50 $15,00 $1,25 / $7,50
Google Gemini 2.5 Pro $1,25 $10,00 $0,63 / $5,00

RunAPI applique une remise de 50 % sur tous les fournisseurs listés ci-dessus. Prix vérifiés en juin 2026.

Abonnement vs API

L'API Claude est-elle moins chère qu'un abonnement Claude Max ?

Claude Max coûte $100/mois pour une utilisation illimitée de Claude Code (ou $200 pour le plan 5x). L'API facture par token. Pour les développeurs qui génèrent moins de 10 millions de tokens de sortie par mois sur Sonnet 4.6, l'option RunAPI coûte moins que l'abonnement Max — et il n'y a pas de plafond d'utilisation sur aucun niveau de modèle.

Claude Max ($100/mois)

Utilisation illimitée de Sonnet et Opus limité dans Claude Code. Coût mensuel fixe. Pas d'accès API.

API Claude via RunAPI

Paiement par token sans engagement mensuel. Sonnet 4.6 à $3/M d'entrée et $15/M de sortie. $100 achète environ 6,7 millions de tokens de sortie — suffisant pour la plupart des développeurs individuels.

Quand Max gagne

Utilisateurs quotidiens intensifs qui dépassent systématiquement 10 millions de tokens de sortie par mois. Le seuil de rentabilité sur Sonnet 4.6 via RunAPI est d'environ 6,7 M de tokens de sortie.

Quand l'API gagne

Équipes, pipelines CI, configurations multi-modèles et développeurs qui souhaitent accéder à Opus ou Haiku en plus de Sonnet. Pas de plafond, pas de liste d'attente, pas de verrouillage d'abonnement.

Premiers pas

Comment accéder à l'API Claude via RunAPI

1

Créer un compte RunAPI

Inscrivez-vous sur runapi.ai. Aucune carte de crédit requise pour le niveau gratuit.

2

Copier votre clé API

Allez dans Tableau de bord → Clés API. Créez une clé et sauvegardez-la — vous l'utiliserez comme clé API OpenAI.

3

Diriger votre SDK vers RunAPI

Définissez l'URL de base sur https://api.runapi.ai/v1 et utilisez votre clé API RunAPI. Tout client compatible OpenAI fonctionne — Python, Node.js, Go, Ruby ou curl.

4

Commencer à effectuer des requêtes

Utilisez claude-sonnet-4-6, claude-opus-4-7 ou tout identifiant de modèle Claude dans le paramètre de modèle. RunAPI gère le routage et la facturation à 50 % du tarif officiel.

Questions fréquemment posées

FAQ sur la tarification de l'API Claude

RunAPI modifie-t-il la sortie de Claude ?

Non. RunAPI transmet les requêtes directement à l'API d'Anthropic. La sortie du modèle, les filtres de sécurité et le comportement sont identiques à un appel direct à Anthropic.

Pourquoi RunAPI est-il 50 % moins cher que l'API officielle ?

RunAPI négocie des tarifs de volume avec les fournisseurs de modèles et répercute les économies sur les développeurs. Il n'y a aucune différence de qualité — mêmes modèles, même API.

Puis-je utiliser RunAPI avec Claude Code ?

Oui. Définissez ANTHROPIC_BASE_URL sur https://api.runapi.ai et votre clé RunAPI comme clé API. Claude Code fonctionne sans modification.

Que se passe-t-il si Anthropic modifie sa tarification ?

RunAPI s'ajuste dans les 24 heures. La remise de 50 % est maintenue par rapport aux tarifs publiés par Anthropic.

Existe-t-il un niveau gratuit ?

Oui. Les nouveaux comptes reçoivent des crédits gratuits pour tester n'importe quel modèle. Ensuite, la facturation est strictement à l'utilisation sans minimum.

RunAPI prend-il en charge la mise en cache des prompts ?

Oui. Les lectures de cache, les écritures de 5 minutes et les écritures d'1 heure sont toutes prises en charge à 50 % de la tarification de cache d'Anthropic.

Puis-je utiliser le SDK OpenAI pour appeler Claude via RunAPI ?

Oui. RunAPI est compatible avec OpenAI. Dirigez n'importe quel client OpenAI vers api.runapi.ai/v1 et utilisez les identifiants de modèle Claude.

Comment fonctionne la facturation ?

À l'utilisation. Vous approvisionnez votre compte avec un solde, et chaque appel API déduit le coût en tokens. Pas d'abonnements, pas de factures, pas de contrats.

Commencez à utiliser Claude à moitié prix.

Créez un compte RunAPI gratuit, obtenez votre clé API et commencez à appeler Claude Opus, Sonnet ou Haiku à 50 % du tarif officiel d'Anthropic.