Limite diário de solicitações
Até 500 solicitações por dia no Gemini 2.5 Flash pelo nível gratuito. Suficiente para prototipagem e projetos paralelos de baixo volume.
O Google cobra $1,25–$10 por milhão de tokens para o Gemini 2.5 Pro e muito menos para o Flash. O Gemini é o modelo principal mais barato entre os três grandes. A RunAPI espelha cada modelo Gemini pela metade da taxa oficial.
O Google publica preços por token para dois níveis principais: Flash para tarefas rápidas e baratas e Pro para capacidade máxima. Há também um nível gratuito com limites diários de solicitações. Todos os preços abaixo são por milhão de tokens, a unidade de cobrança que o Google usa.
Gemini 2.5 Flash a $0,08/M de entrada e $0,30/M de saída pela RunAPI. Taxa oficial é $0,15/$0,60.
Gemini 2.5 Pro a $0,63/M de entrada e $5,00/M de saída pela RunAPI. Taxa oficial é $1,25/$10.
O Google oferece um nível gratuito com até 500 solicitações por dia no Flash, útil para prototipagem antes de pagar.
O Gemini 2.5 Pro é mais barato que Claude Sonnet e GPT-5.4 no preço de entrada, tornando-o o modelo principal mais barato dos três grandes.
A tabela abaixo mostra os preços oficiais do Google ao lado dos preços da RunAPI. A RunAPI aplica um desconto fixo de 50% em todos os modelos Gemini. Sem compromissos de volume, sem assinaturas.
| Modelo | Entrada oficial /M | Saída oficial /M | Entrada RunAPI /M | Saída RunAPI /M | Janela de contexto |
|---|---|---|---|---|---|
| Gemini 2.5 Pro | $1,25 | $10,00 | $0,63 | $5,00 | 1M |
| Gemini 2.5 Flash | $0,15 | $0,60 | $0,08 | $0,30 | 1M |
| Gemini 2.5 Flash-Lite | $0,10 | $0,40 | $0,05 | $0,20 | 1M |
O Google oferece um nível gratuito para que você possa prototipar antes de pagar. Ele tem limites diários de solicitações e limites de taxa mais baixos do que o nível pago. É adequado para testes, não para tráfego de produção.
Até 500 solicitações por dia no Gemini 2.5 Flash pelo nível gratuito. Suficiente para prototipagem e projetos paralelos de baixo volume.
O nível gratuito limita as solicitações por minuto bem abaixo do nível pago. Cargas de trabalho impulsivas ou de produção atingirão o limite rapidamente.
As entradas do nível gratuito podem ser usadas para melhorar os produtos do Google. O tráfego do nível pago e da RunAPI não é usado para treinamento, o que importa para dados sensíveis.
Mude para o pago ou RunAPI quando precisar de throughput constante, limites de taxa mais altos ou melhor tratamento de dados. A RunAPI cobra 50% da taxa paga oficial sem limite diário.
Os desenvolvedores frequentemente comparam o Gemini com o Claude Sonnet e o GPT-5.4. Veja como os modelos principais se comparam em uma base por milhão de tokens pela RunAPI.
| Provedor | Modelo principal | Entrada /M | Saída /M | Taxa RunAPI |
|---|---|---|---|---|
| Gemini 2.5 Pro | $1,25 | $10,00 | $0,63 / $5,00 | |
| OpenAI | GPT-5.4 | $2,50 | $15,00 | $1,25 / $7,50 |
| Anthropic | Claude Sonnet 4.6 | $6,00 | $30,00 | $3,00 / $15,00 |
A RunAPI aplica 50% de desconto em todos os provedores listados acima. O Gemini 2.5 Pro é o modelo principal mais barato em preço de entrada. Preços verificados em junho de 2026.
Os custos de token parecem abstratos até você associá-los a tarefas reais. Abaixo estão cinco cargas de trabalho comuns de desenvolvedores com custos mensais estimados em dois níveis de uso pela RunAPI.
| Carga de trabalho | Modelo | Uso leve (~50 tarefas/dia) | Uso intensivo (~200 tarefas/dia) | Economia mensal vs oficial |
|---|---|---|---|---|
| Análise de documentos de longo contexto | Gemini 2.5 Pro | $18/mês | $72/mês | $18–$72 |
| Classificação de alto volume | Gemini 2.5 Flash | $3/mês | $12/mês | $3–$12 |
| Chatbot de documentação RAG | Gemini 2.5 Flash | $5/mês | $20/mês | $5–$20 |
| Pipeline de geração de conteúdo | Gemini 2.5 Pro | $15/mês | $60/mês | $15–$60 |
| Orquestrador multi-agentes | Gemini 2.5 Pro | $60/mês | $240/mês | $60–$240 |
Cadastre-se em runapi.ai. Nenhum cartão de crédito é necessário para o nível gratuito.
Vá para Painel → Chaves de API. Crie uma chave e salve-a — você a usará como sua chave de API OpenAI.
Defina a URL base como https://api.runapi.ai/v1 e use sua chave de API RunAPI. Qualquer cliente compatível com OpenAI funciona — Python, Node.js, Go, Ruby ou curl.
Use gemini-2.5-pro, gemini-2.5-flash ou qualquer ID de modelo Gemini no parâmetro de modelo. A RunAPI gerencia o roteamento e a cobrança com 50% da taxa oficial.
Os preços oficiais do Google para o Gemini 2.5 Pro são $1,25/M de entrada e $10/M de saída. O Gemini 2.5 Flash custa $0,15/M de entrada e $0,60/M de saída. Pela RunAPI, cada modelo Gemini tem a metade dessa taxa, sem assinatura ou compromisso de volume. Você paga apenas pelos tokens que cada solicitação usa.
No preço de entrada, sim. O Gemini 2.5 Pro a $1,25/M de entrada é mais barato que o GPT-5.4 ($2,50) e o Claude Sonnet ($6) na taxa oficial, tornando-o o modelo principal mais barato dos três grandes. A RunAPI diminui todos os três pela metade, então a diferença se mantém.
Sim. O Google oferece um nível gratuito com até 500 solicitações por dia no Gemini 2.5 Flash e limites de taxa mais baixos do que o nível pago. É adequado para prototipagem. As entradas do nível gratuito podem ser usadas para melhorar os produtos do Google, então evite dados sensíveis.
A RunAPI negocia preços de volume com os provedores de modelos e repassa as economias para os desenvolvedores. Não há diferença de qualidade — mesmos modelos, mesma API compatível com OpenAI, mesmo resultado. Você só muda a URL base e a chave, e o código do cliente existente continua funcionando sem alterações.
Sim. A RunAPI é compatível com OpenAI. Aponte qualquer cliente OpenAI para api.runapi.ai/v1 e use IDs de modelo Gemini como gemini-2.5-pro. O código SDK OpenAI existente funciona sem alterações além da URL base e da chave.
O Gemini 2.5 Pro e Flash oferecem uma janela de contexto de 1M tokens, maior do que a maioria dos modelos Claude e GPT. Combinado com o baixo preço de entrada, isso torna o Gemini econômico para analisar documentos longos, grandes bases de código ou muitos arquivos de uma vez.
A API paga não tem limite fixo de mensagens. Você paga por token e escala conforme necessário, sujeito a limites de taxa de solicitações por minuto. Pela RunAPI, não há limite diário de solicitações como no nível gratuito, então o tráfego de produção funciona sem throttling.
Pagamento por uso. Você financia sua conta com um saldo, e cada chamada de API deduz o custo do token pela metade da taxa oficial. Sem assinaturas, sem faturas, sem contratos. Você pode monitorar os gastos por chave no painel RunAPI e configurar alertas antes que o saldo fique baixo.
Crie uma conta RunAPI gratuita, obtenha sua chave de API e comece a chamar o Gemini 2.5 Pro ou Flash com 50% de desconto nos preços oficiais do Google — o modelo principal mais barato dos três grandes.