Preços de API LLM

Preços da Claude API em 2026

A Anthropic cobra de $3 a $15 por milhão de tokens, dependendo do modelo. O RunAPI espelha todos os modelos Claude pela metade do preço oficial — mesma API, mesma saída, 50% a menos na sua fatura.

Atualizado em June 18, 2026 RunAPI Editorial
Resumo rápido

Quanto custa a Claude API agora?

A Anthropic publica preços por token para três camadas de modelos: Haiku para tarefas leves, Sonnet para cargas de trabalho equilibradas e Opus para capacidade máxima. Todos os preços abaixo são por milhão de tokens, a unidade de cobrança usada pela Anthropic.

Opção mais barata

Haiku 4.5 a $1/M de entrada e $5/M de saída pelo RunAPI. Tarifa oficial é $2/$10.

Mais popular

Sonnet 4.6 a $3/M de entrada e $15/M de saída pelo RunAPI. Tarifa oficial é $6/$30.

Capacidade máxima

Opus 4.7 a $5/M de entrada e $25/M de saída pelo RunAPI. Tarifa oficial é $10/$50.

Desconto de cache

Leituras de cache custam 90% menos que os tokens de entrada padrão — $0,10/M para Haiku pelo RunAPI.

Detalhamento por modelo

Quanto custa cada modelo Claude por milhão de tokens?

A tabela abaixo mostra os preços oficiais da Anthropic ao lado dos preços do RunAPI. O RunAPI aplica um desconto fixo de 50% em todos os modelos Claude. Sem compromissos de volume, sem assinaturas.

Modelo Entrada oficial /M Saída oficial /M Entrada RunAPI /M Saída RunAPI /M Janela de contexto
Opus 4.8 $15,00 $75,00 $7,50 $37,50 200K
Opus 4.7 $10,00 $50,00 $5,00 $25,00 200K
Opus 4.6 $10,00 $50,00 $5,00 $25,00 200K
Sonnet 4.6 $6,00 $30,00 $3,00 $15,00 200K
Sonnet 4.5 $6,00 $30,00 $3,00 $15,00 200K
Haiku 4.5 $2,00 $10,00 $1,00 $5,00 200K
Cache de prompts

Como os descontos de cache reduzem sua fatura da Claude API?

O cache de prompts da Anthropic armazena prefixos repetidos e cobra menos quando a versão em cache é reutilizada. Isso é importante para agentes de código como Claude Code, que enviam o mesmo prompt de sistema e contexto de arquivo a cada requisição.

Leitura de cache

90% de desconto em tokens de entrada. Uma leitura de cache do Sonnet 4.6 custa $0,30/M em vez de $3,00/M pelo RunAPI.

Escrita de cache (TTL de 5 min)

Acréscimo de 25% na entrada — $3,75/M para o Sonnet 4.6 pelo RunAPI. O prefixo em cache fica disponível por 5 minutos.

Escrita de cache (TTL de 1 hora)

2x a taxa de entrada — $6,00/M para o Sonnet 4.6 pelo RunAPI. Útil para sessões longas de código onde a reutilização de contexto é frequente.

Processamento em lote

A Anthropic oferece 50% de desconto em todos os modelos para requisições em lote que toleram até 24 horas de processamento. O RunAPI repassa esse desconto.

Custos no mundo real

Quanto custa a Claude API de fato para cargas de trabalho reais?

Os custos por token parecem abstratos até você associá-los a tarefas reais. Abaixo estão cinco cargas de trabalho comuns de desenvolvedores com custos mensais estimados em dois níveis de uso.

Carga de trabalho Modelo Uso leve (~50 tarefas/dia) Uso intenso (~200 tarefas/dia) Economia mensal vs oficial
Sessão de vibe coding (Claude Code) Sonnet 4.6 $45/mês $180/mês $45–$180
Agente de revisão de código em PR Opus 4.7 $75/mês $300/mês $75–$300
Chatbot de documentação com RAG Haiku 4.5 $12/mês $48/mês $12–$48
Pipeline de geração de conteúdo Sonnet 4.6 $30/mês $120/mês $30–$120
Orquestrador de múltiplos agentes Opus 4.7 $150/mês $600/mês $150–$600
Comparação entre provedores

A Claude API é mais barata que OpenAI e Gemini?

Desenvolvedores frequentemente comparam Claude com GPT-5 e Gemini 2.5 Pro. Veja como os modelos principais se comparam em custo por milhão de tokens.

Provedor Modelo principal Entrada /M Saída /M Tarifa RunAPI
Anthropic Claude Opus 4.7 $10,00 $50,00 $5,00 / $25,00
OpenAI GPT-5.4 $2,50 $15,00 $1,25 / $7,50
Google Gemini 2.5 Pro $1,25 $10,00 $0,63 / $5,00

O RunAPI aplica 50% de desconto em todos os provedores listados acima. Preços verificados em junho de 2026.

Assinatura vs API

A Claude API é mais barata que uma assinatura Claude Max?

Claude Max custa $100/mês para uso ilimitado do Claude Code (ou $200 para o plano 5x). A API cobra por token. Para desenvolvedores que usam menos de 10 milhões de tokens de saída por mês no Sonnet 4.6, a rota pelo RunAPI custa menos que a assinatura Max — e não há limite de uso em nenhuma camada de modelo.

Claude Max ($100/mês)

Uso ilimitado de Sonnet e Opus limitado no Claude Code. Custo mensal fixo. Sem acesso à API.

Claude API via RunAPI

Pague por token sem compromisso mensal. Sonnet 4.6 a $3/M de entrada e $15/M de saída. $100 compra cerca de 6,7 milhões de tokens de saída — suficiente para a maioria dos desenvolvedores individuais.

Quando o Max vence

Usuários diários intensivos que consistentemente excedem 10 milhões de tokens de saída por mês. O ponto de equilíbrio do Sonnet 4.6 pelo RunAPI fica em torno de 6,7M tokens de saída.

Quando a API vence

Equipes, pipelines de CI, configurações com múltiplos modelos e desenvolvedores que querem acesso ao Opus ou Haiku junto com Sonnet. Sem limite, sem lista de espera, sem fidelidade de assinatura.

Primeiros passos

Como acessar a Claude API pelo RunAPI

1

Crie uma conta RunAPI

Cadastre-se em runapi.ai. Não é necessário cartão de crédito para a camada gratuita.

2

Copie sua chave de API

Vá em Dashboard → API Keys. Crie uma chave e salve-a — você usará esta como sua chave de API OpenAI.

3

Aponte seu SDK para o RunAPI

Defina a URL base como https://api.runapi.ai/v1 e use sua chave de API RunAPI. Qualquer cliente compatível com OpenAI funciona — Python, Node.js, Go, Ruby ou curl.

4

Comece a fazer requisições

Use claude-sonnet-4-6, claude-opus-4-7 ou qualquer ID de modelo Claude no parâmetro model. O RunAPI cuida do roteamento e da cobrança a 50% da tarifa oficial.

Perguntas frequentes

Perguntas Frequentes sobre Preços da Claude API

O RunAPI modifica a saída do Claude?

Não. O RunAPI encaminha as requisições diretamente para a API da Anthropic. A saída do modelo, os filtros de segurança e o comportamento são idênticos a chamar a Anthropic diretamente.

Por que o RunAPI é 50% mais barato que a API oficial?

O RunAPI negocia preços por volume com os provedores de modelos e repassa a economia para os desenvolvedores. Não há diferença de qualidade — mesmos modelos, mesma API.

Posso usar o RunAPI com Claude Code?

Sim. Defina ANTHROPIC_BASE_URL como https://api.runapi.ai e use sua chave RunAPI como a chave de API. Claude Code funciona sem modificações.

O que acontece se a Anthropic alterar os preços?

O RunAPI ajusta em até 24 horas. O desconto de 50% é mantido em relação às tarifas publicadas pela Anthropic.

Existe uma camada gratuita?

Sim. Novas contas recebem créditos gratuitos para testar qualquer modelo. Depois disso, a cobrança é estritamente por uso, sem mínimo.

O RunAPI suporta cache de prompts?

Sim. Leituras de cache, escritas de 5 minutos e escritas de 1 hora são todas suportadas com 50% dos preços de cache da Anthropic.

Posso usar o SDK da OpenAI para chamar Claude pelo RunAPI?

Sim. O RunAPI é compatível com OpenAI. Aponte qualquer cliente OpenAI para api.runapi.ai/v1 e use os IDs de modelos Claude.

Como funciona a cobrança?

Por uso. Você credita sua conta com um saldo, e cada chamada de API desconta o custo dos tokens. Sem assinaturas, sem faturas, sem contratos.

Comece a usar Claude pela metade do preço.

Crie uma conta gratuita no RunAPI, obtenha sua chave de API e comece a chamar Claude Opus, Sonnet ou Haiku com 50% de desconto nos preços oficiais da Anthropic.