LLM API Pricing

Claude API Pricing in 2026

Anthropic berechnet $3–$15 pro Million Tokens je nach Modell. RunAPI spiegelt jedes Claude-Modell zur Hälfte des offiziellen Preises — dieselbe API, derselbe Output, 50 % weniger auf Ihrer Rechnung.

Aktualisiert am June 18, 2026 RunAPI Editorial
Auf einen Blick

Was kostet die Claude API aktuell?

Anthropic veröffentlicht Token-Preise für drei Modellebenen: Haiku für leichte Aufgaben, Sonnet für ausgewogene Workloads und Opus für maximale Leistung. Alle Preise unten sind pro Million Tokens, die von Anthropic verwendete Abrechnungseinheit.

Günstigste Option

Haiku 4.5 zu $1/M Input und $5/M Output über RunAPI. Offizieller Preis ist $2/$10.

Beliebteste Option

Sonnet 4.6 zu $3/M Input und $15/M Output über RunAPI. Offizieller Preis ist $6/$30.

Maximale Leistung

Opus 4.7 zu $5/M Input und $25/M Output über RunAPI. Offizieller Preis ist $10/$50.

Cache-Rabatt

Cache-Reads kosten 90 % weniger als Standard-Input-Tokens — $0,10/M für Haiku über RunAPI.

Modell für Modell

Wie viel kostet jedes Claude-Modell pro Million Tokens?

Die folgende Tabelle zeigt die offiziellen Anthropic-Preise neben den RunAPI-Preisen. RunAPI gewährt einen pauschalen 50 %-Rabatt auf alle Claude-Modelle. Keine Mengenverpflichtungen, keine Abonnements.

Modell Offizieller Input /M Offizieller Output /M RunAPI Input /M RunAPI Output /M Kontextfenster
Opus 4.8 $15.00 $75.00 $7.50 $37.50 200K
Opus 4.7 $10.00 $50.00 $5.00 $25.00 200K
Opus 4.6 $10.00 $50.00 $5.00 $25.00 200K
Sonnet 4.6 $6.00 $30.00 $3.00 $15.00 200K
Sonnet 4.5 $6.00 $30.00 $3.00 $15.00 200K
Haiku 4.5 $2.00 $10.00 $1.00 $5.00 200K
Prompt-Caching

Wie reduzieren Cache-Rabatte Ihre Claude-API-Rechnung?

Anthropics Prompt-Caching speichert wiederholte Präfixe und berechnet weniger, wenn die gecachte Version wiederverwendet wird. Das ist besonders relevant für Coding-Agenten wie Claude Code, die bei jeder Anfrage denselben System-Prompt und Dateikontext senden.

Cache-Read

90 % Rabatt auf Input-Tokens. Ein Sonnet 4.6 Cache-Read kostet über RunAPI $0,30/M statt $3,00/M.

Cache-Write (5 Min. TTL)

25 % Aufschlag auf den Input — $3,75/M für Sonnet 4.6 über RunAPI. Das gecachte Präfix bleibt 5 Minuten verfügbar.

Cache-Write (1 Stunde TTL)

2x der Input-Rate — $6,00/M für Sonnet 4.6 über RunAPI. Nützlich für lange Coding-Sessions, in denen Kontext häufig wiederverwendet wird.

Batch-Verarbeitung

Anthropic bietet einen 50 %-Rabatt auf alle Modelle für Batch-Anfragen mit bis zu 24 Stunden Wartezeit. RunAPI gibt diesen Rabatt weiter.

Kosten in der Praxis

Was kostet die Claude API wirklich bei realen Workloads?

Token-Kosten wirken abstrakt, bis man sie an reale Aufgaben knüpft. Unten finden Sie fünf gängige Entwickler-Workloads mit geschätzten monatlichen Kosten bei zwei Nutzungsstufen.

Workload Modell Leichte Nutzung (~50 Aufgaben/Tag) Starke Nutzung (~200 Aufgaben/Tag) Monatliche Ersparnis vs. offiziell
Vibe-Coding-Session (Claude Code) Sonnet 4.6 $45/Monat $180/Monat $45–$180
PR Code-Review-Agent Opus 4.7 $75/Monat $300/Monat $75–$300
RAG-gestützter Docs-Chatbot Haiku 4.5 $12/Monat $48/Monat $12–$48
Content-Generierungspipeline Sonnet 4.6 $30/Monat $120/Monat $30–$120
Multi-Agenten-Orchestrator Opus 4.7 $150/Monat $600/Monat $150–$600
Anbietervergleich

Ist die Claude API günstiger als OpenAI und Gemini?

Entwickler vergleichen Claude häufig mit GPT-5 und Gemini 2.5 Pro. So schneiden die Flagship-Modelle im Vergleich pro Million Tokens ab.

Anbieter Flagship-Modell Input /M Output /M RunAPI-Rate
Anthropic Claude Opus 4.7 $10.00 $50.00 $5.00 / $25.00
OpenAI GPT-5.4 $2.50 $15.00 $1.25 / $7.50
Google Gemini 2.5 Pro $1.25 $10.00 $0.63 / $5.00

RunAPI gewährt 50 % Rabatt auf alle oben aufgeführten Anbieter. Preise verifiziert im Juni 2026.

Abonnement vs. API

Ist die Claude API günstiger als ein Claude Max-Abonnement?

Claude Max kostet $100/Monat für unbegrenzte Claude Code-Nutzung (oder $200 für den 5x-Plan). Die API berechnet pro Token. Für Entwickler, die unter 10 Millionen Output-Tokens pro Monat bei Sonnet 4.6 bleiben, ist der RunAPI-Weg günstiger als das Max-Abonnement — und es gibt keine Nutzungsobergrenze für keine Modellebene.

Claude Max ($100/Monat)

Unbegrenzte Nutzung von Sonnet und eingeschränkter Opus-Zugang in Claude Code. Feste monatliche Kosten. Kein API-Zugang.

Claude API über RunAPI

Zahlung pro Token ohne monatliche Verpflichtung. Sonnet 4.6 zu $3/M Input und $15/M Output. $100 kauft etwa 6,7 Millionen Output-Tokens — genug für die meisten einzelnen Entwickler.

Wann Max besser ist

Starke tägliche Nutzer, die konsistent mehr als 10 Millionen Output-Tokens pro Monat verbrauchen. Der Break-even-Punkt bei Sonnet 4.6 über RunAPI liegt bei etwa 6,7 Millionen Output-Tokens.

Wann die API besser ist

Teams, CI-Pipelines, Multi-Modell-Setups und Entwickler, die neben Sonnet auch Opus- oder Haiku-Zugang wünschen. Keine Obergrenze, keine Warteliste, keine Abonnementbindung.

Erste Schritte

So greifen Sie über RunAPI auf die Claude API zu

1

RunAPI-Konto erstellen

Registrieren Sie sich auf runapi.ai. Für den kostenlosen Tarif ist keine Kreditkarte erforderlich.

2

Ihren API-Schlüssel kopieren

Gehen Sie zu Dashboard → API Keys. Erstellen Sie einen Schlüssel und speichern Sie ihn — Sie verwenden ihn als Ihren OpenAI API-Schlüssel.

3

Ihr SDK auf RunAPI ausrichten

Setzen Sie die Basis-URL auf https://api.runapi.ai/v1 und verwenden Sie Ihren RunAPI API-Schlüssel. Jeder OpenAI-kompatible Client funktioniert — Python, Node.js, Go, Ruby oder curl.

4

Anfragen stellen

Verwenden Sie claude-sonnet-4-6, claude-opus-4-7 oder eine beliebige Claude-Modell-ID im model-Parameter. RunAPI übernimmt Routing und Abrechnung zu 50 % des offiziellen Preises.

Häufig gestellte Fragen

Claude API Pricing FAQ

Verändert RunAPI den Output von Claude?

Nein. RunAPI leitet Anfragen direkt an die API von Anthropic weiter. Der Modell-Output, die Sicherheitsfilter und das Verhalten sind identisch mit einem direkten Aufruf bei Anthropic.

Warum ist RunAPI 50 % günstiger als die offizielle API?

RunAPI verhandelt Mengenpreise mit Modellanbietern und gibt die Einsparungen an Entwickler weiter. Es gibt keinen Qualitätsunterschied — dieselben Modelle, dieselbe API.

Kann ich RunAPI mit Claude Code verwenden?

Ja. Setzen Sie ANTHROPIC_BASE_URL auf https://api.runapi.ai und Ihren RunAPI-Schlüssel als API-Key. Claude Code funktioniert ohne Änderungen.

Was passiert, wenn Anthropic seine Preise ändert?

RunAPI passt innerhalb von 24 Stunden an. Der 50 %-Rabatt wird relativ zu den veröffentlichten Preisen von Anthropic beibehalten.

Gibt es einen kostenlosen Tarif?

Ja. Neue Konten erhalten kostenlose Credits, um jedes Modell zu testen. Danach wird ausschließlich nutzungsabhängig ohne Mindestbetrag abgerechnet.

Unterstützt RunAPI Prompt-Caching?

Ja. Cache-Reads, 5-Minuten-Writes und 1-Stunden-Writes werden alle zu 50 % von Anthropics Cache-Preisen unterstützt.

Kann ich das OpenAI SDK verwenden, um Claude über RunAPI aufzurufen?

Ja. RunAPI ist OpenAI-kompatibel. Richten Sie jeden OpenAI-Client auf api.runapi.ai/v1 und verwenden Sie Claude-Modell-IDs.

Wie funktioniert die Abrechnung?

Nutzungsabhängig. Sie laden Ihr Konto mit einem Guthaben auf, und jeder API-Aufruf zieht die Token-Kosten ab. Keine Abonnements, keine Rechnungen, keine Verträge.

Beginnen Sie, Claude zum halben Preis zu nutzen.

Erstellen Sie ein kostenloses RunAPI-Konto, erhalten Sie Ihren API-Schlüssel und rufen Sie Claude Opus, Sonnet oder Haiku zu 50 % des offiziellen Anthropic-Preises auf.