Preços de API LLM

Preços da API OpenAI em 2026

O GPT-5.4 custa $2,50 de entrada e $15 de saída por milhão de tokens; o GPT-5.5 custa $5 e $30. A RunAPI espelha cada modelo GPT pela metade da taxa oficial — mesma API, mesmo resultado, 50% a menos na sua fatura.

Atualizado em June 18, 2026 RunAPI Editorial
Em resumo

Quanto custa a API OpenAI agora?

A OpenAI precifica cada modelo GPT por milhão de tokens, com taxas separadas de entrada e saída e uma taxa de entrada em cache mais barata. Todos os valores abaixo são por milhão de tokens, a unidade de cobrança que a OpenAI usa.

Mais popular

GPT-5.4 a $1,25/M de entrada e $7,50/M de saída pela RunAPI. Taxa oficial é $2,50/$15.

Opção mais barata

GPT-5.4-mini a uma fração da taxa do modelo principal, cobrado com 50% de desconto pela RunAPI.

Capacidade máxima

GPT-5.5 a $2,50/M de entrada e $15/M de saída pela RunAPI. Taxa oficial é $5/$30.

Desconto de cache

Tokens de entrada em cache custam uma fração da entrada padrão — repassados com 50% de desconto na RunAPI.

Detalhamento por modelo

Quanto custa cada modelo GPT por milhão de tokens?

A tabela mostra os preços oficiais da OpenAI ao lado dos preços da RunAPI. A RunAPI aplica um desconto fixo de 50% em todos os modelos GPT. Sem compromissos de volume, sem assinaturas.

Modelo Entrada oficial /M Saída oficial /M Entrada RunAPI /M Saída RunAPI /M Janela de contexto
GPT-5.5 $5,00 $30,00 $2,50 $15,00 400K
GPT-5.4 $2,50 $15,00 $1,25 $7,50 400K
GPT-5.4-mini $0,25 $2,00 $0,13 $1,00 400K
GPT-5.3-codex $2,50 $15,00 $1,25 $7,50 400K
Cache e lote

Como os descontos de cache e lote reduzem sua conta GPT?

A OpenAI cobra menos por tokens de entrada em cache e oferece um grande desconto em solicitações em lote que toleram atrasos na execução. Ambos são importantes para cargas de trabalho repetitivas, como agentes de codagem e processamento em massa.

Entrada em cache

Prefixos de prompt repetidos são cobrados a uma taxa de entrada reduzida. A RunAPI repassa o desconto com 50% da taxa em cache da OpenAI.

API em lote (50% de desconto)

Solicitações enviadas à API em lote são executadas com metade da taxa padrão com até 24 horas de processamento. A RunAPI repassa isso além do seu próprio desconto.

Esforço de raciocínio

Os modelos GPT-5 permitem definir o esforço de raciocínio. Menor esforço emite menos tokens de raciocínio, reduzindo diretamente o custo de saída na cobrança por uso.

Controle de tokens de saída

Limite o máximo de tokens de saída por solicitação para controlar custos e evitar gerações excessivas em tarefas agentivas longas.

Custos do mundo real

Quanto custa a API GPT para cargas de trabalho reais?

As taxas de token parecem abstratas até serem associadas a tarefas reais. Abaixo estão cargas de trabalho comuns de desenvolvedores com custos mensais estimados em dois níveis de uso, cobrados às taxas RunAPI.

Carga de trabalho Modelo Uso leve (~50 tarefas/dia) Uso intensivo (~200 tarefas/dia) Economia mensal vs oficial
Agente de codagem (Codex) GPT-5.3-codex $20/mês $80/mês $20–$80
Chatbot de suporte ao cliente GPT-5.4-mini $6/mês $24/mês $6–$24
Assistente de conhecimento RAG GPT-5.4 $18/mês $72/mês $18–$72
Pipeline de geração de conteúdo GPT-5.4 $25/mês $100/mês $25–$100
Orquestrador multi-agentes GPT-5.5 $90/mês $360/mês $90–$360
Comparação de provedores

A API OpenAI é mais barata que Claude e Gemini?

Os desenvolvedores comparam o GPT com Claude e Gemini. Veja como os modelos principais se comparam em uma base por milhão de tokens, com as taxas RunAPI ao lado.

Provedor Modelo principal Entrada /M Saída /M Taxa RunAPI
OpenAI GPT-5.4 $2,50 $15,00 $1,25 / $7,50
Anthropic Claude Opus 4.7 $10,00 $50,00 $5,00 / $25,00
Google Gemini 2.5 Pro $1,25 $10,00 $0,63 / $5,00

A RunAPI aplica 50% de desconto em todos os provedores listados acima. Preços verificados em junho de 2026.

Primeiros passos

Como acessar a API GPT através da RunAPI

1

Criar uma conta RunAPI

Cadastre-se em runapi.ai. Nenhum cartão de crédito é necessário para o nível gratuito.

2

Copiar sua chave de API

Vá para Painel → Chaves de API. Crie uma chave e salve-a — você a usará como sua chave de API OpenAI.

3

Apontar seu SDK para a RunAPI

Defina a URL base como https://api.runapi.ai/v1 e use sua chave RunAPI. Qualquer cliente compatível com OpenAI funciona.

4

Começar a fazer solicitações

Use gpt-5.4, gpt-5.5 ou qualquer ID de modelo GPT no parâmetro de modelo. A RunAPI gerencia o roteamento e a cobrança com 50% da taxa oficial.

Perguntas frequentes

FAQ sobre Preços da API OpenAI

Quanto custa a API GPT-5 da OpenAI?

O GPT-5.4 custa $2,50 por milhão de tokens de entrada e $15 por milhão de tokens de saída oficialmente. O GPT-5.5 custa $5 e $30. Através da RunAPI, cada modelo GPT é cobrado pela metade dessas taxas — o GPT-5.4 custa $1,25 de entrada e $7,50 de saída por milhão de tokens.

Por que a RunAPI é 50% mais barata que a OpenAI?

A RunAPI negocia preços de volume com os provedores de modelos e repassa as economias para os desenvolvedores. As solicitações chegam aos mesmos modelos OpenAI com saída, filtros de segurança e comportamento idênticos, então a única diferença é a taxa mais baixa na sua fatura. Não há troca de qualidade e nenhuma camada de cobrança separada — o desconto se aplica automaticamente a todos os modelos GPT.

O GPT-5 tem preços de cache?

Sim. A OpenAI cobra prefixos de prompt repetidos a uma taxa de entrada em cache reduzida, o que reduz os custos para agentes que reenviam o mesmo contexto. A RunAPI repassa o desconto de cache com 50% da taxa em cache da OpenAI, para que as economias de cache se somem ao desconto base.

Como funciona o desconto da API em lote da OpenAI?

A API em lote executa solicitações a 50% da taxa padrão em troca de até 24 horas de processamento. É adequada para trabalhos em massa que não precisam de respostas instantâneas. A RunAPI repassa esse desconto, então o trabalho em lote é cobrado pela metade da taxa já descontada.

O GPT é mais barato que Claude ou Gemini?

Nos tokens de entrada principais, o GPT-5.4 a $2,50 fica entre o Gemini 2.5 Pro a $1,25 e o Claude Opus a $10. A escolha mais barata depende do nível do modelo e da carga de trabalho. A RunAPI diminui a taxa pela metade para todos os três, então a classificação relativa permanece a mesma.

Posso usar o SDK da OpenAI com a RunAPI?

Sim. A RunAPI é compatível com OpenAI. Aponte qualquer cliente OpenAI para https://api.runapi.ai/v1, use sua chave RunAPI e passe um ID de modelo GPT. O código existente que já usa o SDK OpenAI funciona sem quaisquer alterações além da URL base e da chave, então migrar um projeto estabelecido leva cerca de um minuto.

A RunAPI suporta GPT-5.3-codex para codagem?

Sim. O GPT-5.3-codex está disponível através da RunAPI com 50% da taxa oficial, que é $1,25 de entrada e $7,50 de saída por milhão de tokens. Funciona com Codex e outras ferramentas de codagem compatíveis com OpenAI substituindo a URL base e a chave nas configurações. Os descontos de entrada em cache e em lote também são repassados, reduzindo ainda mais o custo efetivo de sessões de codagem repetitivas.

Existe um nível gratuito?

Sim. As novas contas RunAPI recebem créditos gratuitos para testar qualquer modelo GPT antes de se comprometer. Depois disso, a cobrança é estritamente por uso, sem gasto mínimo, sem assinatura e sem compromisso mensal — você financia um saldo e cada chamada deduz seu custo de token. Você pode recarregar qualquer valor e acompanhar o uso por modelo no painel.

Execute o GPT-5 pela metade do preço.

Crie uma conta RunAPI gratuita, obtenha sua chave de API e chame qualquer modelo OpenAI GPT com 50% de desconto nos preços oficiais.