Preços de API LLM

Preços da API OpenAI em 2026

O GPT-5.4 custa $2,50 de entrada e $15 de saída por milhão de tokens; o GPT-5.5 custa $5 e $30. A RunAPI espelha cada modelo GPT pela metade da taxa oficial — mesma API, mesmo resultado, 50% a menos na sua fatura.

Obter chave de API — grátis Ler documentação da API

Atualizado em June 18, 2026 RunAPI Editorial

Em resumo

Quanto custa a API OpenAI agora?

A OpenAI precifica cada modelo GPT por milhão de tokens, com taxas separadas de entrada e saída e uma taxa de entrada em cache mais barata. Todos os valores abaixo são por milhão de tokens, a unidade de cobrança que a OpenAI usa.

Mais popular

GPT-5.4 a $1,25/M de entrada e $7,50/M de saída pela RunAPI. Taxa oficial é $2,50/$15.

Opção mais barata

GPT-5.4-mini a uma fração da taxa do modelo principal, cobrado com 50% de desconto pela RunAPI.

Capacidade máxima

GPT-5.5 a $2,50/M de entrada e $15/M de saída pela RunAPI. Taxa oficial é $5/$30.

Desconto de cache

Tokens de entrada em cache custam uma fração da entrada padrão — repassados com 50% de desconto na RunAPI.

Detalhamento por modelo

Quanto custa cada modelo GPT por milhão de tokens?

A tabela mostra os preços oficiais da OpenAI ao lado dos preços da RunAPI. A RunAPI aplica um desconto fixo de 50% em todos os modelos GPT. Sem compromissos de volume, sem assinaturas.

Modelo	Entrada oficial /M	Saída oficial /M	Entrada RunAPI /M	Saída RunAPI /M	Janela de contexto
GPT-5.5	$5,00	$30,00	$2,50	$15,00	400K
GPT-5.4	$2,50	$15,00	$1,25	$7,50	400K
GPT-5.4-mini	$0,25	$2,00	$0,13	$1,00	400K
GPT-5.3-codex	$2,50	$15,00	$1,25	$7,50	400K

Preços oficiais da OpenAI ↗ Preços da RunAPI ↗

Cache e lote

Como os descontos de cache e lote reduzem sua conta GPT?

A OpenAI cobra menos por tokens de entrada em cache e oferece um grande desconto em solicitações em lote que toleram atrasos na execução. Ambos são importantes para cargas de trabalho repetitivas, como agentes de codagem e processamento em massa.

Entrada em cache

Prefixos de prompt repetidos são cobrados a uma taxa de entrada reduzida. A RunAPI repassa o desconto com 50% da taxa em cache da OpenAI.

API em lote (50% de desconto)

Solicitações enviadas à API em lote são executadas com metade da taxa padrão com até 24 horas de processamento. A RunAPI repassa isso além do seu próprio desconto.

Esforço de raciocínio

Os modelos GPT-5 permitem definir o esforço de raciocínio. Menor esforço emite menos tokens de raciocínio, reduzindo diretamente o custo de saída na cobrança por uso.

Controle de tokens de saída

Limite o máximo de tokens de saída por solicitação para controlar custos e evitar gerações excessivas em tarefas agentivas longas.

Custos do mundo real

Quanto custa a API GPT para cargas de trabalho reais?

As taxas de token parecem abstratas até serem associadas a tarefas reais. Abaixo estão cargas de trabalho comuns de desenvolvedores com custos mensais estimados em dois níveis de uso, cobrados às taxas RunAPI.

Carga de trabalho	Modelo	Uso leve (~50 tarefas/dia)	Uso intensivo (~200 tarefas/dia)	Economia mensal vs oficial
Agente de codagem (Codex)	GPT-5.3-codex	$20/mês	$80/mês	$20–$80
Chatbot de suporte ao cliente	GPT-5.4-mini	$6/mês	$24/mês	$6–$24
Assistente de conhecimento RAG	GPT-5.4	$18/mês	$72/mês	$18–$72
Pipeline de geração de conteúdo	GPT-5.4	$25/mês	$100/mês	$25–$100
Orquestrador multi-agentes	GPT-5.5	$90/mês	$360/mês	$90–$360

Comparação de provedores

A API OpenAI é mais barata que Claude e Gemini?

Os desenvolvedores comparam o GPT com Claude e Gemini. Veja como os modelos principais se comparam em uma base por milhão de tokens, com as taxas RunAPI ao lado.

Provedor	Modelo principal	Entrada /M	Saída /M	Taxa RunAPI
OpenAI	GPT-5.4	$2,50	$15,00	$1,25 / $7,50
Anthropic	Claude Opus 4.7	$10,00	$50,00	$5,00 / $25,00
Google	Gemini 2.5 Pro	$1,25	$10,00	$0,63 / $5,00

A RunAPI aplica 50% de desconto em todos os provedores listados acima. Preços verificados em junho de 2026.

Primeiros passos

Como acessar a API GPT através da RunAPI

Criar uma conta RunAPI

Cadastre-se em runapi.ai. Nenhum cartão de crédito é necessário para o nível gratuito.

Copiar sua chave de API

Vá para Painel → Chaves de API. Crie uma chave e salve-a — você a usará como sua chave de API OpenAI.

Apontar seu SDK para a RunAPI

Defina a URL base como https://api.runapi.ai/v1 e use sua chave RunAPI. Qualquer cliente compatível com OpenAI funciona.

Começar a fazer solicitações

Use gpt-5.4, gpt-5.5 ou qualquer ID de modelo GPT no parâmetro de modelo. A RunAPI gerencia o roteamento e a cobrança com 50% da taxa oficial.

Perguntas frequentes

FAQ sobre Preços da API OpenAI

Quanto custa a API GPT-5 da OpenAI?

O GPT-5.4 custa $2,50 por milhão de tokens de entrada e $15 por milhão de tokens de saída oficialmente. O GPT-5.5 custa $5 e $30. Através da RunAPI, cada modelo GPT é cobrado pela metade dessas taxas — o GPT-5.4 custa $1,25 de entrada e $7,50 de saída por milhão de tokens.

Por que a RunAPI é 50% mais barata que a OpenAI?

A RunAPI negocia preços de volume com os provedores de modelos e repassa as economias para os desenvolvedores. As solicitações chegam aos mesmos modelos OpenAI com saída, filtros de segurança e comportamento idênticos, então a única diferença é a taxa mais baixa na sua fatura. Não há troca de qualidade e nenhuma camada de cobrança separada — o desconto se aplica automaticamente a todos os modelos GPT.

O GPT-5 tem preços de cache?

Sim. A OpenAI cobra prefixos de prompt repetidos a uma taxa de entrada em cache reduzida, o que reduz os custos para agentes que reenviam o mesmo contexto. A RunAPI repassa o desconto de cache com 50% da taxa em cache da OpenAI, para que as economias de cache se somem ao desconto base.

Como funciona o desconto da API em lote da OpenAI?

A API em lote executa solicitações a 50% da taxa padrão em troca de até 24 horas de processamento. É adequada para trabalhos em massa que não precisam de respostas instantâneas. A RunAPI repassa esse desconto, então o trabalho em lote é cobrado pela metade da taxa já descontada.

O GPT é mais barato que Claude ou Gemini?

Nos tokens de entrada principais, o GPT-5.4 a $2,50 fica entre o Gemini 2.5 Pro a $1,25 e o Claude Opus a $10. A escolha mais barata depende do nível do modelo e da carga de trabalho. A RunAPI diminui a taxa pela metade para todos os três, então a classificação relativa permanece a mesma.

Posso usar o SDK da OpenAI com a RunAPI?

Sim. A RunAPI é compatível com OpenAI. Aponte qualquer cliente OpenAI para https://api.runapi.ai/v1, use sua chave RunAPI e passe um ID de modelo GPT. O código existente que já usa o SDK OpenAI funciona sem quaisquer alterações além da URL base e da chave, então migrar um projeto estabelecido leva cerca de um minuto.

A RunAPI suporta GPT-5.3-codex para codagem?

Sim. O GPT-5.3-codex está disponível através da RunAPI com 50% da taxa oficial, que é $1,25 de entrada e $7,50 de saída por milhão de tokens. Funciona com Codex e outras ferramentas de codagem compatíveis com OpenAI substituindo a URL base e a chave nas configurações. Os descontos de entrada em cache e em lote também são repassados, reduzindo ainda mais o custo efetivo de sessões de codagem repetitivas.

Existe um nível gratuito?

Sim. As novas contas RunAPI recebem créditos gratuitos para testar qualquer modelo GPT antes de se comprometer. Depois disso, a cobrança é estritamente por uso, sem gasto mínimo, sem assinatura e sem compromisso mensal — você financia um saldo e cada chamada deduz seu custo de token. Você pode recarregar qualquer valor e acompanhar o uso por modelo no painel.

Execute o GPT-5 pela metade do preço.

Crie uma conta RunAPI gratuita, obtenha sua chave de API e chame qualquer modelo OpenAI GPT com 50% de desconto nos preços oficiais.

Obter chave de API gratuita Comparar preços