Cache-Read
90 % Rabatt auf Input-Tokens. Ein Sonnet 4.6 Cache-Read kostet über RunAPI $0,30/M statt $3,00/M.
Anthropic berechnet $3–$15 pro Million Tokens je nach Modell. RunAPI spiegelt jedes Claude-Modell zur Hälfte des offiziellen Preises — dieselbe API, derselbe Output, 50 % weniger auf Ihrer Rechnung.
Anthropic veröffentlicht Token-Preise für drei Modellebenen: Haiku für leichte Aufgaben, Sonnet für ausgewogene Workloads und Opus für maximale Leistung. Alle Preise unten sind pro Million Tokens, die von Anthropic verwendete Abrechnungseinheit.
Haiku 4.5 zu $1/M Input und $5/M Output über RunAPI. Offizieller Preis ist $2/$10.
Sonnet 4.6 zu $3/M Input und $15/M Output über RunAPI. Offizieller Preis ist $6/$30.
Opus 4.7 zu $5/M Input und $25/M Output über RunAPI. Offizieller Preis ist $10/$50.
Cache-Reads kosten 90 % weniger als Standard-Input-Tokens — $0,10/M für Haiku über RunAPI.
Die folgende Tabelle zeigt die offiziellen Anthropic-Preise neben den RunAPI-Preisen. RunAPI gewährt einen pauschalen 50 %-Rabatt auf alle Claude-Modelle. Keine Mengenverpflichtungen, keine Abonnements.
| Modell | Offizieller Input /M | Offizieller Output /M | RunAPI Input /M | RunAPI Output /M | Kontextfenster |
|---|---|---|---|---|---|
| Opus 4.8 | $15.00 | $75.00 | $7.50 | $37.50 | 200K |
| Opus 4.7 | $10.00 | $50.00 | $5.00 | $25.00 | 200K |
| Opus 4.6 | $10.00 | $50.00 | $5.00 | $25.00 | 200K |
| Sonnet 4.6 | $6.00 | $30.00 | $3.00 | $15.00 | 200K |
| Sonnet 4.5 | $6.00 | $30.00 | $3.00 | $15.00 | 200K |
| Haiku 4.5 | $2.00 | $10.00 | $1.00 | $5.00 | 200K |
Anthropics Prompt-Caching speichert wiederholte Präfixe und berechnet weniger, wenn die gecachte Version wiederverwendet wird. Das ist besonders relevant für Coding-Agenten wie Claude Code, die bei jeder Anfrage denselben System-Prompt und Dateikontext senden.
90 % Rabatt auf Input-Tokens. Ein Sonnet 4.6 Cache-Read kostet über RunAPI $0,30/M statt $3,00/M.
25 % Aufschlag auf den Input — $3,75/M für Sonnet 4.6 über RunAPI. Das gecachte Präfix bleibt 5 Minuten verfügbar.
2x der Input-Rate — $6,00/M für Sonnet 4.6 über RunAPI. Nützlich für lange Coding-Sessions, in denen Kontext häufig wiederverwendet wird.
Anthropic bietet einen 50 %-Rabatt auf alle Modelle für Batch-Anfragen mit bis zu 24 Stunden Wartezeit. RunAPI gibt diesen Rabatt weiter.
Token-Kosten wirken abstrakt, bis man sie an reale Aufgaben knüpft. Unten finden Sie fünf gängige Entwickler-Workloads mit geschätzten monatlichen Kosten bei zwei Nutzungsstufen.
| Workload | Modell | Leichte Nutzung (~50 Aufgaben/Tag) | Starke Nutzung (~200 Aufgaben/Tag) | Monatliche Ersparnis vs. offiziell |
|---|---|---|---|---|
| Vibe-Coding-Session (Claude Code) | Sonnet 4.6 | $45/Monat | $180/Monat | $45–$180 |
| PR Code-Review-Agent | Opus 4.7 | $75/Monat | $300/Monat | $75–$300 |
| RAG-gestützter Docs-Chatbot | Haiku 4.5 | $12/Monat | $48/Monat | $12–$48 |
| Content-Generierungspipeline | Sonnet 4.6 | $30/Monat | $120/Monat | $30–$120 |
| Multi-Agenten-Orchestrator | Opus 4.7 | $150/Monat | $600/Monat | $150–$600 |
Entwickler vergleichen Claude häufig mit GPT-5 und Gemini 2.5 Pro. So schneiden die Flagship-Modelle im Vergleich pro Million Tokens ab.
| Anbieter | Flagship-Modell | Input /M | Output /M | RunAPI-Rate |
|---|---|---|---|---|
| Anthropic | Claude Opus 4.7 | $10.00 | $50.00 | $5.00 / $25.00 |
| OpenAI | GPT-5.4 | $2.50 | $15.00 | $1.25 / $7.50 |
| Gemini 2.5 Pro | $1.25 | $10.00 | $0.63 / $5.00 |
RunAPI gewährt 50 % Rabatt auf alle oben aufgeführten Anbieter. Preise verifiziert im Juni 2026.
Claude Max kostet $100/Monat für unbegrenzte Claude Code-Nutzung (oder $200 für den 5x-Plan). Die API berechnet pro Token. Für Entwickler, die unter 10 Millionen Output-Tokens pro Monat bei Sonnet 4.6 bleiben, ist der RunAPI-Weg günstiger als das Max-Abonnement — und es gibt keine Nutzungsobergrenze für keine Modellebene.
Unbegrenzte Nutzung von Sonnet und eingeschränkter Opus-Zugang in Claude Code. Feste monatliche Kosten. Kein API-Zugang.
Zahlung pro Token ohne monatliche Verpflichtung. Sonnet 4.6 zu $3/M Input und $15/M Output. $100 kauft etwa 6,7 Millionen Output-Tokens — genug für die meisten einzelnen Entwickler.
Starke tägliche Nutzer, die konsistent mehr als 10 Millionen Output-Tokens pro Monat verbrauchen. Der Break-even-Punkt bei Sonnet 4.6 über RunAPI liegt bei etwa 6,7 Millionen Output-Tokens.
Teams, CI-Pipelines, Multi-Modell-Setups und Entwickler, die neben Sonnet auch Opus- oder Haiku-Zugang wünschen. Keine Obergrenze, keine Warteliste, keine Abonnementbindung.
Registrieren Sie sich auf runapi.ai. Für den kostenlosen Tarif ist keine Kreditkarte erforderlich.
Gehen Sie zu Dashboard → API Keys. Erstellen Sie einen Schlüssel und speichern Sie ihn — Sie verwenden ihn als Ihren OpenAI API-Schlüssel.
Setzen Sie die Basis-URL auf https://api.runapi.ai/v1 und verwenden Sie Ihren RunAPI API-Schlüssel. Jeder OpenAI-kompatible Client funktioniert — Python, Node.js, Go, Ruby oder curl.
Verwenden Sie claude-sonnet-4-6, claude-opus-4-7 oder eine beliebige Claude-Modell-ID im model-Parameter. RunAPI übernimmt Routing und Abrechnung zu 50 % des offiziellen Preises.
Nein. RunAPI leitet Anfragen direkt an die API von Anthropic weiter. Der Modell-Output, die Sicherheitsfilter und das Verhalten sind identisch mit einem direkten Aufruf bei Anthropic.
RunAPI verhandelt Mengenpreise mit Modellanbietern und gibt die Einsparungen an Entwickler weiter. Es gibt keinen Qualitätsunterschied — dieselben Modelle, dieselbe API.
Ja. Setzen Sie ANTHROPIC_BASE_URL auf https://api.runapi.ai und Ihren RunAPI-Schlüssel als API-Key. Claude Code funktioniert ohne Änderungen.
RunAPI passt innerhalb von 24 Stunden an. Der 50 %-Rabatt wird relativ zu den veröffentlichten Preisen von Anthropic beibehalten.
Ja. Neue Konten erhalten kostenlose Credits, um jedes Modell zu testen. Danach wird ausschließlich nutzungsabhängig ohne Mindestbetrag abgerechnet.
Ja. Cache-Reads, 5-Minuten-Writes und 1-Stunden-Writes werden alle zu 50 % von Anthropics Cache-Preisen unterstützt.
Ja. RunAPI ist OpenAI-kompatibel. Richten Sie jeden OpenAI-Client auf api.runapi.ai/v1 und verwenden Sie Claude-Modell-IDs.
Nutzungsabhängig. Sie laden Ihr Konto mit einem Guthaben auf, und jeder API-Aufruf zieht die Token-Kosten ab. Keine Abonnements, keine Rechnungen, keine Verträge.
Erstellen Sie ein kostenloses RunAPI-Konto, erhalten Sie Ihren API-Schlüssel und rufen Sie Claude Opus, Sonnet oder Haiku zu 50 % des offiziellen Anthropic-Preises auf.