Preços de API LLM

Preços da API Gemini em 2026

O Google cobra $1,25–$10 por milhão de tokens para o Gemini 2.5 Pro e muito menos para o Flash. O Gemini é o modelo principal mais barato entre os três grandes. A RunAPI espelha cada modelo Gemini pela metade da taxa oficial.

Atualizado em June 18, 2026 RunAPI Editorial
Em resumo

Quanto custa a API Gemini agora?

O Google publica preços por token para dois níveis principais: Flash para tarefas rápidas e baratas e Pro para capacidade máxima. Há também um nível gratuito com limites diários de solicitações. Todos os preços abaixo são por milhão de tokens, a unidade de cobrança que o Google usa.

Opção mais barata

Gemini 2.5 Flash a $0,08/M de entrada e $0,30/M de saída pela RunAPI. Taxa oficial é $0,15/$0,60.

Capacidade máxima

Gemini 2.5 Pro a $0,63/M de entrada e $5,00/M de saída pela RunAPI. Taxa oficial é $1,25/$10.

Nível gratuito

O Google oferece um nível gratuito com até 500 solicitações por dia no Flash, útil para prototipagem antes de pagar.

Modelo principal mais barato

O Gemini 2.5 Pro é mais barato que Claude Sonnet e GPT-5.4 no preço de entrada, tornando-o o modelo principal mais barato dos três grandes.

Detalhamento por modelo

Quanto custa cada modelo Gemini por milhão de tokens?

A tabela abaixo mostra os preços oficiais do Google ao lado dos preços da RunAPI. A RunAPI aplica um desconto fixo de 50% em todos os modelos Gemini. Sem compromissos de volume, sem assinaturas.

Modelo Entrada oficial /M Saída oficial /M Entrada RunAPI /M Saída RunAPI /M Janela de contexto
Gemini 2.5 Pro $1,25 $10,00 $0,63 $5,00 1M
Gemini 2.5 Flash $0,15 $0,60 $0,08 $0,30 1M
Gemini 2.5 Flash-Lite $0,10 $0,40 $0,05 $0,20 1M
Nível gratuito

Como funciona o nível gratuito do Gemini do Google?

O Google oferece um nível gratuito para que você possa prototipar antes de pagar. Ele tem limites diários de solicitações e limites de taxa mais baixos do que o nível pago. É adequado para testes, não para tráfego de produção.

Limite diário de solicitações

Até 500 solicitações por dia no Gemini 2.5 Flash pelo nível gratuito. Suficiente para prototipagem e projetos paralelos de baixo volume.

Limites de taxa mais baixos

O nível gratuito limita as solicitações por minuto bem abaixo do nível pago. Cargas de trabalho impulsivas ou de produção atingirão o limite rapidamente.

Termos de uso de dados

As entradas do nível gratuito podem ser usadas para melhorar os produtos do Google. O tráfego do nível pago e da RunAPI não é usado para treinamento, o que importa para dados sensíveis.

Quando fazer upgrade

Mude para o pago ou RunAPI quando precisar de throughput constante, limites de taxa mais altos ou melhor tratamento de dados. A RunAPI cobra 50% da taxa paga oficial sem limite diário.

Comparação de provedores

O Gemini é mais barato que Claude e GPT?

Os desenvolvedores frequentemente comparam o Gemini com o Claude Sonnet e o GPT-5.4. Veja como os modelos principais se comparam em uma base por milhão de tokens pela RunAPI.

Provedor Modelo principal Entrada /M Saída /M Taxa RunAPI
Google Gemini 2.5 Pro $1,25 $10,00 $0,63 / $5,00
OpenAI GPT-5.4 $2,50 $15,00 $1,25 / $7,50
Anthropic Claude Sonnet 4.6 $6,00 $30,00 $3,00 / $15,00

A RunAPI aplica 50% de desconto em todos os provedores listados acima. O Gemini 2.5 Pro é o modelo principal mais barato em preço de entrada. Preços verificados em junho de 2026.

Custos do mundo real

Quanto custa realmente a API Gemini para cargas de trabalho reais?

Os custos de token parecem abstratos até você associá-los a tarefas reais. Abaixo estão cinco cargas de trabalho comuns de desenvolvedores com custos mensais estimados em dois níveis de uso pela RunAPI.

Carga de trabalho Modelo Uso leve (~50 tarefas/dia) Uso intensivo (~200 tarefas/dia) Economia mensal vs oficial
Análise de documentos de longo contexto Gemini 2.5 Pro $18/mês $72/mês $18–$72
Classificação de alto volume Gemini 2.5 Flash $3/mês $12/mês $3–$12
Chatbot de documentação RAG Gemini 2.5 Flash $5/mês $20/mês $5–$20
Pipeline de geração de conteúdo Gemini 2.5 Pro $15/mês $60/mês $15–$60
Orquestrador multi-agentes Gemini 2.5 Pro $60/mês $240/mês $60–$240
Primeiros passos

Como acessar a API Gemini através da RunAPI

1

Criar uma conta RunAPI

Cadastre-se em runapi.ai. Nenhum cartão de crédito é necessário para o nível gratuito.

2

Copiar sua chave de API

Vá para Painel → Chaves de API. Crie uma chave e salve-a — você a usará como sua chave de API OpenAI.

3

Apontar seu SDK para a RunAPI

Defina a URL base como https://api.runapi.ai/v1 e use sua chave de API RunAPI. Qualquer cliente compatível com OpenAI funciona — Python, Node.js, Go, Ruby ou curl.

4

Começar a fazer solicitações

Use gemini-2.5-pro, gemini-2.5-flash ou qualquer ID de modelo Gemini no parâmetro de modelo. A RunAPI gerencia o roteamento e a cobrança com 50% da taxa oficial.

Perguntas frequentes

FAQ sobre Preços da API Gemini

Quanto custa a API Gemini?

Os preços oficiais do Google para o Gemini 2.5 Pro são $1,25/M de entrada e $10/M de saída. O Gemini 2.5 Flash custa $0,15/M de entrada e $0,60/M de saída. Pela RunAPI, cada modelo Gemini tem a metade dessa taxa, sem assinatura ou compromisso de volume. Você paga apenas pelos tokens que cada solicitação usa.

O Gemini é mais barato que Claude e GPT?

No preço de entrada, sim. O Gemini 2.5 Pro a $1,25/M de entrada é mais barato que o GPT-5.4 ($2,50) e o Claude Sonnet ($6) na taxa oficial, tornando-o o modelo principal mais barato dos três grandes. A RunAPI diminui todos os três pela metade, então a diferença se mantém.

O Gemini tem um nível gratuito?

Sim. O Google oferece um nível gratuito com até 500 solicitações por dia no Gemini 2.5 Flash e limites de taxa mais baixos do que o nível pago. É adequado para prototipagem. As entradas do nível gratuito podem ser usadas para melhorar os produtos do Google, então evite dados sensíveis.

Por que a RunAPI é 50% mais barata que a API oficial?

A RunAPI negocia preços de volume com os provedores de modelos e repassa as economias para os desenvolvedores. Não há diferença de qualidade — mesmos modelos, mesma API compatível com OpenAI, mesmo resultado. Você só muda a URL base e a chave, e o código do cliente existente continua funcionando sem alterações.

Posso usar o Gemini com o SDK OpenAI?

Sim. A RunAPI é compatível com OpenAI. Aponte qualquer cliente OpenAI para api.runapi.ai/v1 e use IDs de modelo Gemini como gemini-2.5-pro. O código SDK OpenAI existente funciona sem alterações além da URL base e da chave.

Por que o Gemini é bom para tarefas de longo contexto?

O Gemini 2.5 Pro e Flash oferecem uma janela de contexto de 1M tokens, maior do que a maioria dos modelos Claude e GPT. Combinado com o baixo preço de entrada, isso torna o Gemini econômico para analisar documentos longos, grandes bases de código ou muitos arquivos de uma vez.

Existe um limite de uso na API paga?

A API paga não tem limite fixo de mensagens. Você paga por token e escala conforme necessário, sujeito a limites de taxa de solicitações por minuto. Pela RunAPI, não há limite diário de solicitações como no nível gratuito, então o tráfego de produção funciona sem throttling.

Como funciona a cobrança?

Pagamento por uso. Você financia sua conta com um saldo, e cada chamada de API deduz o custo do token pela metade da taxa oficial. Sem assinaturas, sem faturas, sem contratos. Você pode monitorar os gastos por chave no painel RunAPI e configurar alertas antes que o saldo fique baixo.

Comece a usar o Gemini pela metade do preço.

Crie uma conta RunAPI gratuita, obtenha sua chave de API e comece a chamar o Gemini 2.5 Pro ou Flash com 50% de desconto nos preços oficiais do Google — o modelo principal mais barato dos três grandes.