Entrada em cache
Prefixos de prompt repetidos são cobrados a uma taxa de entrada reduzida. A RunAPI repassa o desconto com 50% da taxa em cache da OpenAI.
O GPT-5.4 custa $2,50 de entrada e $15 de saída por milhão de tokens; o GPT-5.5 custa $5 e $30. A RunAPI espelha cada modelo GPT pela metade da taxa oficial — mesma API, mesmo resultado, 50% a menos na sua fatura.
A OpenAI precifica cada modelo GPT por milhão de tokens, com taxas separadas de entrada e saída e uma taxa de entrada em cache mais barata. Todos os valores abaixo são por milhão de tokens, a unidade de cobrança que a OpenAI usa.
GPT-5.4 a $1,25/M de entrada e $7,50/M de saída pela RunAPI. Taxa oficial é $2,50/$15.
GPT-5.4-mini a uma fração da taxa do modelo principal, cobrado com 50% de desconto pela RunAPI.
GPT-5.5 a $2,50/M de entrada e $15/M de saída pela RunAPI. Taxa oficial é $5/$30.
Tokens de entrada em cache custam uma fração da entrada padrão — repassados com 50% de desconto na RunAPI.
A tabela mostra os preços oficiais da OpenAI ao lado dos preços da RunAPI. A RunAPI aplica um desconto fixo de 50% em todos os modelos GPT. Sem compromissos de volume, sem assinaturas.
| Modelo | Entrada oficial /M | Saída oficial /M | Entrada RunAPI /M | Saída RunAPI /M | Janela de contexto |
|---|---|---|---|---|---|
| GPT-5.5 | $5,00 | $30,00 | $2,50 | $15,00 | 400K |
| GPT-5.4 | $2,50 | $15,00 | $1,25 | $7,50 | 400K |
| GPT-5.4-mini | $0,25 | $2,00 | $0,13 | $1,00 | 400K |
| GPT-5.3-codex | $2,50 | $15,00 | $1,25 | $7,50 | 400K |
A OpenAI cobra menos por tokens de entrada em cache e oferece um grande desconto em solicitações em lote que toleram atrasos na execução. Ambos são importantes para cargas de trabalho repetitivas, como agentes de codagem e processamento em massa.
Prefixos de prompt repetidos são cobrados a uma taxa de entrada reduzida. A RunAPI repassa o desconto com 50% da taxa em cache da OpenAI.
Solicitações enviadas à API em lote são executadas com metade da taxa padrão com até 24 horas de processamento. A RunAPI repassa isso além do seu próprio desconto.
Os modelos GPT-5 permitem definir o esforço de raciocínio. Menor esforço emite menos tokens de raciocínio, reduzindo diretamente o custo de saída na cobrança por uso.
Limite o máximo de tokens de saída por solicitação para controlar custos e evitar gerações excessivas em tarefas agentivas longas.
As taxas de token parecem abstratas até serem associadas a tarefas reais. Abaixo estão cargas de trabalho comuns de desenvolvedores com custos mensais estimados em dois níveis de uso, cobrados às taxas RunAPI.
| Carga de trabalho | Modelo | Uso leve (~50 tarefas/dia) | Uso intensivo (~200 tarefas/dia) | Economia mensal vs oficial |
|---|---|---|---|---|
| Agente de codagem (Codex) | GPT-5.3-codex | $20/mês | $80/mês | $20–$80 |
| Chatbot de suporte ao cliente | GPT-5.4-mini | $6/mês | $24/mês | $6–$24 |
| Assistente de conhecimento RAG | GPT-5.4 | $18/mês | $72/mês | $18–$72 |
| Pipeline de geração de conteúdo | GPT-5.4 | $25/mês | $100/mês | $25–$100 |
| Orquestrador multi-agentes | GPT-5.5 | $90/mês | $360/mês | $90–$360 |
Os desenvolvedores comparam o GPT com Claude e Gemini. Veja como os modelos principais se comparam em uma base por milhão de tokens, com as taxas RunAPI ao lado.
| Provedor | Modelo principal | Entrada /M | Saída /M | Taxa RunAPI |
|---|---|---|---|---|
| OpenAI | GPT-5.4 | $2,50 | $15,00 | $1,25 / $7,50 |
| Anthropic | Claude Opus 4.7 | $10,00 | $50,00 | $5,00 / $25,00 |
| Gemini 2.5 Pro | $1,25 | $10,00 | $0,63 / $5,00 |
A RunAPI aplica 50% de desconto em todos os provedores listados acima. Preços verificados em junho de 2026.
Cadastre-se em runapi.ai. Nenhum cartão de crédito é necessário para o nível gratuito.
Vá para Painel → Chaves de API. Crie uma chave e salve-a — você a usará como sua chave de API OpenAI.
Defina a URL base como https://api.runapi.ai/v1 e use sua chave RunAPI. Qualquer cliente compatível com OpenAI funciona.
Use gpt-5.4, gpt-5.5 ou qualquer ID de modelo GPT no parâmetro de modelo. A RunAPI gerencia o roteamento e a cobrança com 50% da taxa oficial.
O GPT-5.4 custa $2,50 por milhão de tokens de entrada e $15 por milhão de tokens de saída oficialmente. O GPT-5.5 custa $5 e $30. Através da RunAPI, cada modelo GPT é cobrado pela metade dessas taxas — o GPT-5.4 custa $1,25 de entrada e $7,50 de saída por milhão de tokens.
A RunAPI negocia preços de volume com os provedores de modelos e repassa as economias para os desenvolvedores. As solicitações chegam aos mesmos modelos OpenAI com saída, filtros de segurança e comportamento idênticos, então a única diferença é a taxa mais baixa na sua fatura. Não há troca de qualidade e nenhuma camada de cobrança separada — o desconto se aplica automaticamente a todos os modelos GPT.
Sim. A OpenAI cobra prefixos de prompt repetidos a uma taxa de entrada em cache reduzida, o que reduz os custos para agentes que reenviam o mesmo contexto. A RunAPI repassa o desconto de cache com 50% da taxa em cache da OpenAI, para que as economias de cache se somem ao desconto base.
A API em lote executa solicitações a 50% da taxa padrão em troca de até 24 horas de processamento. É adequada para trabalhos em massa que não precisam de respostas instantâneas. A RunAPI repassa esse desconto, então o trabalho em lote é cobrado pela metade da taxa já descontada.
Nos tokens de entrada principais, o GPT-5.4 a $2,50 fica entre o Gemini 2.5 Pro a $1,25 e o Claude Opus a $10. A escolha mais barata depende do nível do modelo e da carga de trabalho. A RunAPI diminui a taxa pela metade para todos os três, então a classificação relativa permanece a mesma.
Sim. A RunAPI é compatível com OpenAI. Aponte qualquer cliente OpenAI para https://api.runapi.ai/v1, use sua chave RunAPI e passe um ID de modelo GPT. O código existente que já usa o SDK OpenAI funciona sem quaisquer alterações além da URL base e da chave, então migrar um projeto estabelecido leva cerca de um minuto.
Sim. O GPT-5.3-codex está disponível através da RunAPI com 50% da taxa oficial, que é $1,25 de entrada e $7,50 de saída por milhão de tokens. Funciona com Codex e outras ferramentas de codagem compatíveis com OpenAI substituindo a URL base e a chave nas configurações. Os descontos de entrada em cache e em lote também são repassados, reduzindo ainda mais o custo efetivo de sessões de codagem repetitivas.
Sim. As novas contas RunAPI recebem créditos gratuitos para testar qualquer modelo GPT antes de se comprometer. Depois disso, a cobrança é estritamente por uso, sem gasto mínimo, sem assinatura e sem compromisso mensal — você financia um saldo e cada chamada deduz seu custo de token. Você pode recarregar qualquer valor e acompanhar o uso por modelo no painel.
Crie uma conta RunAPI gratuita, obtenha sua chave de API e chame qualquer modelo OpenAI GPT com 50% de desconto nos preços oficiais.