Precios de API LLM

Precios de la API de OpenAI en 2026

GPT-5.4 cuesta $2.50 de entrada y $15 de salida por millón de tokens; GPT-5.5 cuesta $5 y $30. RunAPI replica cada modelo GPT a la mitad de la tarifa oficial — la misma API, la misma salida, un 50% menos en tu factura.

Obtener API key — gratis Leer documentación de la API

Actualizado el June 18, 2026 RunAPI Editorial

De un vistazo

¿Cuánto cuesta la API de OpenAI ahora mismo?

OpenAI cobra cada modelo GPT por millón de tokens, con tarifas separadas de entrada y salida y una tarifa de entrada en caché más económica. Todas las cifras a continuación son por millón de tokens, la unidad de facturación que usa OpenAI.

El más popular

GPT-5.4 a $1.25/M de entrada y $7.50/M de salida a través de RunAPI. La tarifa oficial es $2.50/$15.

Opción más barata

GPT-5.4-mini a una fracción de la tarifa insignia, facturado con un 50% de descuento a través de RunAPI.

Máxima capacidad

GPT-5.5 a $2.50/M de entrada y $15/M de salida a través de RunAPI. La tarifa oficial es $5/$30.

Descuento por caché

Los tokens de entrada en caché cuestan una fracción de la entrada estándar — trasladados al 50% en RunAPI.

Desglose modelo por modelo

¿Cuánto cuesta cada modelo GPT por millón de tokens?

La tabla muestra los precios oficiales de OpenAI junto con los precios de RunAPI. RunAPI aplica un descuento fijo del 50% en todos los modelos GPT. Sin compromisos de volumen ni suscripciones.

Modelo	Entrada oficial /M	Salida oficial /M	Entrada RunAPI /M	Salida RunAPI /M	Ventana de contexto
GPT-5.5	$5.00	$30.00	$2.50	$15.00	400K
GPT-5.4	$2.50	$15.00	$1.25	$7.50	400K
GPT-5.4-mini	$0.25	$2.00	$0.13	$1.00	400K
GPT-5.3-codex	$2.50	$15.00	$1.25	$7.50	400K

Precios oficiales de OpenAI ↗ Precios de RunAPI ↗

Caché y lotes

¿Cómo reducen tu factura de GPT los descuentos por caché y lotes?

OpenAI cobra menos por tokens de entrada en caché y ofrece un descuento importante en solicitudes por lotes que toleran demoras en la entrega. Ambos son relevantes para cargas de trabajo repetitivas como agentes de programación y procesamiento masivo.

Entrada en caché

Los prefijos de prompt repetidos se facturan a una tarifa de entrada reducida. RunAPI traslada el descuento al 50% de la tarifa de caché de OpenAI.

API por lotes (50% de descuento)

Las solicitudes enviadas a la API por lotes se ejecutan a la mitad de la tarifa estándar con hasta 24 horas de espera. RunAPI traslada esto además de su propio descuento.

Esfuerzo de razonamiento

Los modelos GPT-5 te permiten configurar el esfuerzo de razonamiento. Un esfuerzo menor emite menos tokens de razonamiento, reduciendo directamente el costo de salida en la facturación medida.

Control de tokens de salida

Limita los tokens de salida máximos por solicitud para acotar el costo y evitar generaciones desbordadas en tareas agénticas largas.

Costos del mundo real

¿Cuánto cuesta la API de GPT para cargas de trabajo reales?

Las tarifas por token parecen abstractas hasta que se vinculan a tareas reales. A continuación se muestran cargas de trabajo comunes de desarrolladores con costos mensuales estimados en dos niveles de uso, facturados a tarifas de RunAPI.

Carga de trabajo	Modelo	Uso ligero (~50 tareas/día)	Uso intensivo (~200 tareas/día)	Ahorro mensual vs oficial
Agente de programación (Codex)	GPT-5.3-codex	$20/mes	$80/mes	$20–$80
Chatbot de atención al cliente	GPT-5.4-mini	$6/mes	$24/mes	$6–$24
Asistente de conocimiento RAG	GPT-5.4	$18/mes	$72/mes	$18–$72
Pipeline de generación de contenido	GPT-5.4	$25/mes	$100/mes	$25–$100
Orquestador multi-agente	GPT-5.5	$90/mes	$360/mes	$90–$360

Comparación de proveedores

¿Es la API de OpenAI más barata que Claude y Gemini?

Los desarrolladores comparan GPT con Claude y Gemini. Así es como se comparan los modelos insignia en base al millón de tokens, con las tarifas de RunAPI junto a ellos.

Proveedor	Modelo insignia	Entrada /M	Salida /M	Tarifa RunAPI
OpenAI	GPT-5.4	$2.50	$15.00	$1.25 / $7.50
Anthropic	Claude Opus 4.7	$10.00	$50.00	$5.00 / $25.00
Google	Gemini 2.5 Pro	$1.25	$10.00	$0.63 / $5.00

RunAPI aplica un 50% de descuento en todos los proveedores listados. Precios verificados en junio de 2026.

Primeros pasos

Cómo acceder a la API de GPT a través de RunAPI

Crea una cuenta de RunAPI

Regístrate en runapi.ai. No se requiere tarjeta de crédito para el nivel gratuito.

Copia tu API key

Ve a Panel de control → API Keys. Crea una clave y guárdala — la usarás como tu API key de OpenAI.

Apunta tu SDK a RunAPI

Establece la URL base en https://api.runapi.ai/v1 y usa tu clave de RunAPI. Funciona cualquier cliente compatible con OpenAI.

Empieza a hacer solicitudes

Usa gpt-5.4, gpt-5.5 o cualquier ID de modelo GPT en el parámetro model. RunAPI gestiona el enrutamiento y la facturación al 50% de la tarifa oficial.

Preguntas frecuentes

Preguntas frecuentes sobre precios de la API de OpenAI

¿Cuánto cuesta la API de OpenAI GPT-5?

GPT-5.4 cuesta $2.50 por millón de tokens de entrada y $15 por millón de tokens de salida oficialmente. GPT-5.5 cuesta $5 y $30. A través de RunAPI, cada modelo GPT se factura a la mitad de esas tarifas — GPT-5.4 cuesta $1.25 de entrada y $7.50 de salida por millón de tokens.

¿Por qué RunAPI es un 50% más barato que OpenAI?

RunAPI negocia precios por volumen con los proveedores de modelos y traslada los ahorros a los desarrolladores. Las solicitudes llegan a los mismos modelos de OpenAI con salida, filtros de seguridad y comportamiento idénticos, por lo que la única diferencia es la tarifa más baja en tu factura. No hay concesión de calidad ni nivel de facturación separado — el descuento se aplica automáticamente a cada modelo GPT.

¿GPT-5 tiene precios de caché?

Sí. OpenAI factura los prefijos de prompt repetidos a una tarifa de entrada en caché reducida, lo que reduce el costo para los agentes que reenvían el mismo contexto. RunAPI traslada el descuento de caché al 50% de la tarifa en caché de OpenAI, por lo que los ahorros de caché se suman al descuento base.

¿Cómo funciona el descuento de la API por lotes de OpenAI?

La API por lotes ejecuta solicitudes al 50% de la tarifa estándar a cambio de hasta 24 horas de espera. Es adecuada para trabajos masivos que no necesitan respuestas instantáneas. RunAPI traslada este descuento, por lo que el trabajo por lotes se factura a la mitad de la tarifa ya descontada.

¿Es GPT más barato que Claude o Gemini?

En tokens de entrada insignia, GPT-5.4 a $2.50 se sitúa entre Gemini 2.5 Pro a $1.25 y Claude Opus a $10. La opción más barata depende del nivel del modelo y la carga de trabajo. RunAPI reduce a la mitad la tarifa de los tres, por lo que el ranking relativo se mantiene.

¿Puedo usar el SDK de OpenAI con RunAPI?

Sí. RunAPI es compatible con OpenAI. Apunta cualquier cliente de OpenAI a https://api.runapi.ai/v1, usa tu clave de RunAPI y pasa un ID de modelo GPT. El código existente que ya usa el SDK de OpenAI funciona sin ningún cambio más allá de la URL base y la clave, por lo que migrar un proyecto establecido tarda aproximadamente un minuto.

¿RunAPI admite GPT-5.3-codex para programación?

Sí. GPT-5.3-codex está disponible a través de RunAPI al 50% de la tarifa oficial, que es $1.25 de entrada y $7.50 de salida por millón de tokens. Funciona con Codex y otras herramientas de programación compatibles con OpenAI anulando la URL base y la clave en su configuración. Los descuentos de entrada en caché y por lotes también se trasladan, reduciendo aún más el costo efectivo de las sesiones de programación repetitivas.

¿Hay un nivel gratuito?

Sí. Las nuevas cuentas de RunAPI reciben créditos gratuitos para probar cualquier modelo GPT antes de comprometerse. Después, la facturación es estrictamente de pago por uso sin gasto mínimo, sin suscripción y sin compromiso mensual — fondeas un saldo y cada llamada deduce su costo de tokens. Puedes recargar cualquier cantidad y ver el uso por modelo en el panel de control.

Ejecuta GPT-5 a mitad de precio.

Crea una cuenta gratuita de RunAPI, obtén tu API key y llama a cualquier modelo GPT de OpenAI con un 50% de descuento sobre los precios oficiales.

Obtener API key gratis Comparar precios