Preços de API LLM

Preços da API Gemini em 2026

O Google cobra $1,25–$10 por milhão de tokens para o Gemini 2.5 Pro e muito menos para o Flash. O Gemini é o modelo principal mais barato entre os três grandes. A RunAPI espelha cada modelo Gemini pela metade da taxa oficial.

Obter chave de API — grátis Ler documentação da API

Atualizado em June 18, 2026 RunAPI Editorial

Em resumo

Quanto custa a API Gemini agora?

O Google publica preços por token para dois níveis principais: Flash para tarefas rápidas e baratas e Pro para capacidade máxima. Há também um nível gratuito com limites diários de solicitações. Todos os preços abaixo são por milhão de tokens, a unidade de cobrança que o Google usa.

Opção mais barata

Gemini 2.5 Flash a $0,08/M de entrada e $0,30/M de saída pela RunAPI. Taxa oficial é $0,15/$0,60.

Capacidade máxima

Gemini 2.5 Pro a $0,63/M de entrada e $5,00/M de saída pela RunAPI. Taxa oficial é $1,25/$10.

Nível gratuito

O Google oferece um nível gratuito com até 500 solicitações por dia no Flash, útil para prototipagem antes de pagar.

Modelo principal mais barato

O Gemini 2.5 Pro é mais barato que Claude Sonnet e GPT-5.4 no preço de entrada, tornando-o o modelo principal mais barato dos três grandes.

Detalhamento por modelo

Quanto custa cada modelo Gemini por milhão de tokens?

A tabela abaixo mostra os preços oficiais do Google ao lado dos preços da RunAPI. A RunAPI aplica um desconto fixo de 50% em todos os modelos Gemini. Sem compromissos de volume, sem assinaturas.

Modelo	Entrada oficial /M	Saída oficial /M	Entrada RunAPI /M	Saída RunAPI /M	Janela de contexto
Gemini 2.5 Pro	$1,25	$10,00	$0,63	$5,00	1M
Gemini 2.5 Flash	$0,15	$0,60	$0,08	$0,30	1M
Gemini 2.5 Flash-Lite	$0,10	$0,40	$0,05	$0,20	1M

Preços oficiais do Google ↗ Preços da RunAPI ↗

Nível gratuito

Como funciona o nível gratuito do Gemini do Google?

O Google oferece um nível gratuito para que você possa prototipar antes de pagar. Ele tem limites diários de solicitações e limites de taxa mais baixos do que o nível pago. É adequado para testes, não para tráfego de produção.

Limite diário de solicitações

Até 500 solicitações por dia no Gemini 2.5 Flash pelo nível gratuito. Suficiente para prototipagem e projetos paralelos de baixo volume.

Limites de taxa mais baixos

O nível gratuito limita as solicitações por minuto bem abaixo do nível pago. Cargas de trabalho impulsivas ou de produção atingirão o limite rapidamente.

Termos de uso de dados

As entradas do nível gratuito podem ser usadas para melhorar os produtos do Google. O tráfego do nível pago e da RunAPI não é usado para treinamento, o que importa para dados sensíveis.

Quando fazer upgrade

Mude para o pago ou RunAPI quando precisar de throughput constante, limites de taxa mais altos ou melhor tratamento de dados. A RunAPI cobra 50% da taxa paga oficial sem limite diário.

Comparação de provedores

O Gemini é mais barato que Claude e GPT?

Os desenvolvedores frequentemente comparam o Gemini com o Claude Sonnet e o GPT-5.4. Veja como os modelos principais se comparam em uma base por milhão de tokens pela RunAPI.

Provedor	Modelo principal	Entrada /M	Saída /M	Taxa RunAPI
Google	Gemini 2.5 Pro	$1,25	$10,00	$0,63 / $5,00
OpenAI	GPT-5.4	$2,50	$15,00	$1,25 / $7,50
Anthropic	Claude Sonnet 4.6	$6,00	$30,00	$3,00 / $15,00

A RunAPI aplica 50% de desconto em todos os provedores listados acima. O Gemini 2.5 Pro é o modelo principal mais barato em preço de entrada. Preços verificados em junho de 2026.

Custos do mundo real

Quanto custa realmente a API Gemini para cargas de trabalho reais?

Os custos de token parecem abstratos até você associá-los a tarefas reais. Abaixo estão cinco cargas de trabalho comuns de desenvolvedores com custos mensais estimados em dois níveis de uso pela RunAPI.

Carga de trabalho	Modelo	Uso leve (~50 tarefas/dia)	Uso intensivo (~200 tarefas/dia)	Economia mensal vs oficial
Análise de documentos de longo contexto	Gemini 2.5 Pro	$18/mês	$72/mês	$18–$72
Classificação de alto volume	Gemini 2.5 Flash	$3/mês	$12/mês	$3–$12
Chatbot de documentação RAG	Gemini 2.5 Flash	$5/mês	$20/mês	$5–$20
Pipeline de geração de conteúdo	Gemini 2.5 Pro	$15/mês	$60/mês	$15–$60
Orquestrador multi-agentes	Gemini 2.5 Pro	$60/mês	$240/mês	$60–$240

Primeiros passos

Como acessar a API Gemini através da RunAPI

Criar uma conta RunAPI

Cadastre-se em runapi.ai. Nenhum cartão de crédito é necessário para o nível gratuito.

Copiar sua chave de API

Vá para Painel → Chaves de API. Crie uma chave e salve-a — você a usará como sua chave de API OpenAI.

Apontar seu SDK para a RunAPI

Defina a URL base como https://api.runapi.ai/v1 e use sua chave de API RunAPI. Qualquer cliente compatível com OpenAI funciona — Python, Node.js, Go, Ruby ou curl.

Começar a fazer solicitações

Use gemini-2.5-pro, gemini-2.5-flash ou qualquer ID de modelo Gemini no parâmetro de modelo. A RunAPI gerencia o roteamento e a cobrança com 50% da taxa oficial.

Perguntas frequentes

FAQ sobre Preços da API Gemini

Quanto custa a API Gemini?

Os preços oficiais do Google para o Gemini 2.5 Pro são $1,25/M de entrada e $10/M de saída. O Gemini 2.5 Flash custa $0,15/M de entrada e $0,60/M de saída. Pela RunAPI, cada modelo Gemini tem a metade dessa taxa, sem assinatura ou compromisso de volume. Você paga apenas pelos tokens que cada solicitação usa.

O Gemini é mais barato que Claude e GPT?

No preço de entrada, sim. O Gemini 2.5 Pro a $1,25/M de entrada é mais barato que o GPT-5.4 ($2,50) e o Claude Sonnet ($6) na taxa oficial, tornando-o o modelo principal mais barato dos três grandes. A RunAPI diminui todos os três pela metade, então a diferença se mantém.

O Gemini tem um nível gratuito?

Sim. O Google oferece um nível gratuito com até 500 solicitações por dia no Gemini 2.5 Flash e limites de taxa mais baixos do que o nível pago. É adequado para prototipagem. As entradas do nível gratuito podem ser usadas para melhorar os produtos do Google, então evite dados sensíveis.

Por que a RunAPI é 50% mais barata que a API oficial?

A RunAPI negocia preços de volume com os provedores de modelos e repassa as economias para os desenvolvedores. Não há diferença de qualidade — mesmos modelos, mesma API compatível com OpenAI, mesmo resultado. Você só muda a URL base e a chave, e o código do cliente existente continua funcionando sem alterações.

Posso usar o Gemini com o SDK OpenAI?

Sim. A RunAPI é compatível com OpenAI. Aponte qualquer cliente OpenAI para api.runapi.ai/v1 e use IDs de modelo Gemini como gemini-2.5-pro. O código SDK OpenAI existente funciona sem alterações além da URL base e da chave.

Por que o Gemini é bom para tarefas de longo contexto?

O Gemini 2.5 Pro e Flash oferecem uma janela de contexto de 1M tokens, maior do que a maioria dos modelos Claude e GPT. Combinado com o baixo preço de entrada, isso torna o Gemini econômico para analisar documentos longos, grandes bases de código ou muitos arquivos de uma vez.

Existe um limite de uso na API paga?

A API paga não tem limite fixo de mensagens. Você paga por token e escala conforme necessário, sujeito a limites de taxa de solicitações por minuto. Pela RunAPI, não há limite diário de solicitações como no nível gratuito, então o tráfego de produção funciona sem throttling.

Como funciona a cobrança?

Pagamento por uso. Você financia sua conta com um saldo, e cada chamada de API deduz o custo do token pela metade da taxa oficial. Sem assinaturas, sem faturas, sem contratos. Você pode monitorar os gastos por chave no painel RunAPI e configurar alertas antes que o saldo fique baixo.

Comece a usar o Gemini pela metade do preço.

Crie uma conta RunAPI gratuita, obtenha sua chave de API e comece a chamar o Gemini 2.5 Pro ou Flash com 50% de desconto nos preços oficiais do Google — o modelo principal mais barato dos três grandes.

Obter chave de API gratuita Comparar preços de todos os modelos