Precios de API LLM

Precios de la API de Gemini en 2026

Google cobra entre $1.25 y $10 por millón de tokens para Gemini 2.5 Pro y mucho menos para Flash. Gemini es el insignia más barato de los tres grandes. RunAPI replica cada modelo Gemini a la mitad de la tarifa oficial.

Actualizado el June 18, 2026 RunAPI Editorial
De un vistazo

¿Cuánto cuesta la API de Gemini ahora mismo?

Google publica precios por token para dos niveles principales: Flash para tareas rápidas y baratas y Pro para máxima capacidad. También hay un nivel gratuito con límites diarios de solicitudes. Todos los precios a continuación son por millón de tokens, la unidad de facturación que usa Google.

Opción más barata

Gemini 2.5 Flash a $0.08/M de entrada y $0.30/M de salida a través de RunAPI. La tarifa oficial es $0.15/$0.60.

Máxima capacidad

Gemini 2.5 Pro a $0.63/M de entrada y $5.00/M de salida a través de RunAPI. La tarifa oficial es $1.25/$10.

Nivel gratuito

Google ofrece un nivel gratuito con hasta 500 solicitudes por día en Flash, útil para prototipos antes de pagar.

Insignia más barato

Gemini 2.5 Pro supera a Claude Sonnet y GPT-5.4 en precio de entrada, convirtiéndolo en el insignia más barato de los tres grandes.

Desglose modelo por modelo

¿Cuánto cuesta cada modelo Gemini por millón de tokens?

La siguiente tabla muestra los precios oficiales de Google junto con los precios de RunAPI. RunAPI aplica un descuento fijo del 50% en todos los modelos Gemini. Sin compromisos de volumen ni suscripciones.

Modelo Entrada oficial /M Salida oficial /M Entrada RunAPI /M Salida RunAPI /M Ventana de contexto
Gemini 2.5 Pro $1.25 $10.00 $0.63 $5.00 1M
Gemini 2.5 Flash $0.15 $0.60 $0.08 $0.30 1M
Gemini 2.5 Flash-Lite $0.10 $0.40 $0.05 $0.20 1M
Nivel gratuito

¿Cómo funciona el nivel gratuito de Gemini de Google?

Google ofrece un nivel gratuito para que puedas hacer prototipos antes de pagar. Tiene límites diarios de solicitudes y límites de velocidad más bajos que el nivel de pago. Es adecuado para pruebas, no para tráfico de producción.

Límite diario de solicitudes

Hasta 500 solicitudes por día en Gemini 2.5 Flash a través del nivel gratuito. Suficiente para prototipos y proyectos secundarios de bajo volumen.

Límites de velocidad más bajos

El nivel gratuito limita las solicitudes por minuto muy por debajo del nivel de pago. Las cargas de trabajo en ráfagas o de producción alcanzarán el límite rápidamente.

Términos de uso de datos

Las entradas del nivel gratuito pueden usarse para mejorar los productos de Google. El tráfico del nivel de pago y de RunAPI no se usa para entrenamiento, lo que importa para datos sensibles.

Cuándo actualizar

Pasa a pago o RunAPI cuando necesites un rendimiento constante, límites de velocidad más altos o una gestión de datos más sólida. RunAPI cobra el 50% de la tarifa oficial de pago sin límite diario.

Comparación de proveedores

¿Es Gemini más barato que Claude y GPT?

Los desarrolladores a menudo comparan Gemini con Claude Sonnet y GPT-5.4. Así es como se comparan los modelos insignia en base al millón de tokens a través de RunAPI.

Proveedor Modelo insignia Entrada /M Salida /M Tarifa RunAPI
Google Gemini 2.5 Pro $1.25 $10.00 $0.63 / $5.00
OpenAI GPT-5.4 $2.50 $15.00 $1.25 / $7.50
Anthropic Claude Sonnet 4.6 $6.00 $30.00 $3.00 / $15.00

RunAPI aplica un 50% de descuento en todos los proveedores listados. Gemini 2.5 Pro es el insignia más barato en precio de entrada. Precios verificados en junio de 2026.

Costos del mundo real

¿Cuánto cuesta realmente la API de Gemini para cargas de trabajo reales?

Los costos por token parecen abstractos hasta que los vinculas a tareas reales. A continuación se muestran cinco cargas de trabajo comunes de desarrolladores con costos mensuales estimados en dos niveles de uso a través de RunAPI.

Carga de trabajo Modelo Uso ligero (~50 tareas/día) Uso intensivo (~200 tareas/día) Ahorro mensual vs oficial
Análisis de documentos de contexto largo Gemini 2.5 Pro $18/mes $72/mes $18–$72
Clasificación de alto volumen Gemini 2.5 Flash $3/mes $12/mes $3–$12
Chatbot de documentación con RAG Gemini 2.5 Flash $5/mes $20/mes $5–$20
Pipeline de generación de contenido Gemini 2.5 Pro $15/mes $60/mes $15–$60
Orquestador multi-agente Gemini 2.5 Pro $60/mes $240/mes $60–$240
Primeros pasos

Cómo acceder a la API de Gemini a través de RunAPI

1

Crea una cuenta de RunAPI

Regístrate en runapi.ai. No se requiere tarjeta de crédito para el nivel gratuito.

2

Copia tu API key

Ve a Panel de control → API Keys. Crea una clave y guárdala — la usarás como tu API key de OpenAI.

3

Apunta tu SDK a RunAPI

Establece la URL base en https://api.runapi.ai/v1 y usa tu API key de RunAPI. Funciona cualquier cliente compatible con OpenAI — Python, Node.js, Go, Ruby o curl.

4

Empieza a hacer solicitudes

Usa gemini-2.5-pro, gemini-2.5-flash o cualquier ID de modelo Gemini en el parámetro model. RunAPI gestiona el enrutamiento y la facturación al 50% de la tarifa oficial.

Preguntas frecuentes

Preguntas frecuentes sobre precios de la API de Gemini

¿Cuánto cuesta la API de Gemini?

El precio oficial de Google para Gemini 2.5 Pro es $1.25/M de entrada y $10/M de salida. Gemini 2.5 Flash es $0.15/M de entrada y $0.60/M de salida. A través de RunAPI, cada modelo Gemini tiene la mitad de esa tarifa, sin suscripción ni compromiso de volumen. Solo pagas por los tokens que usa cada solicitud.

¿Es Gemini más barato que Claude y GPT?

En precio de entrada, sí. Gemini 2.5 Pro a $1.25/M de entrada supera a GPT-5.4 ($2.50) y Claude Sonnet ($6) en la tarifa oficial, convirtiéndolo en el insignia más barato de los tres grandes. RunAPI reduce a la mitad los tres, por lo que la diferencia se mantiene.

¿Gemini tiene un nivel gratuito?

Sí. Google ofrece un nivel gratuito con hasta 500 solicitudes por día en Gemini 2.5 Flash y límites de velocidad más bajos que el nivel de pago. Es adecuado para prototipos. Las entradas del nivel gratuito pueden usarse para mejorar los productos de Google, así que evita datos sensibles.

¿Por qué RunAPI es un 50% más barato que la API oficial?

RunAPI negocia precios por volumen con los proveedores de modelos y traslada los ahorros a los desarrolladores. No hay diferencia de calidad — los mismos modelos, la misma API compatible con OpenAI, la misma salida. Solo cambias la URL base y la clave, y tu código de cliente existente sigue funcionando sin cambios.

¿Puedo usar Gemini con el SDK de OpenAI?

Sí. RunAPI es compatible con OpenAI. Apunta cualquier cliente de OpenAI a api.runapi.ai/v1 y usa IDs de modelo Gemini como gemini-2.5-pro. El código del SDK de OpenAI existente funciona sin cambios más allá de la URL base y la clave.

¿Por qué Gemini es bueno para tareas de contexto largo?

Gemini 2.5 Pro y Flash ofrecen ambos una ventana de contexto de 1M de tokens, mayor que la mayoría de los modelos Claude y GPT. Combinado con precios de entrada bajos, esto hace que Gemini sea rentable para analizar documentos largos, bases de código grandes o muchos archivos a la vez.

¿Hay un límite de uso en la API de pago?

La API de pago no tiene límite fijo de mensajes. Pagas por token y escalas según sea necesario, sujeto a límites de velocidad en solicitudes por minuto. A través de RunAPI no hay límite diario de solicitudes como en el nivel gratuito, por lo que el tráfico de producción se ejecuta sin throttling.

¿Cómo funciona la facturación?

Pago por uso. Fondeas tu cuenta con un saldo, y cada llamada a la API deduce el costo del token a la mitad de la tarifa oficial. Sin suscripciones, sin facturas, sin contratos. Puedes monitorear el gasto por clave desde el panel de control de RunAPI y configurar alertas antes de que el saldo se agote.

Empieza a usar Gemini a mitad de precio.

Crea una cuenta gratuita de RunAPI, obtén tu API key y empieza a llamar a Gemini 2.5 Pro o Flash con un 50% de descuento sobre los precios oficiales de Google — el insignia más barato de los tres grandes.