Entrada en caché
Los prefijos de prompt repetidos se facturan a una tarifa de entrada reducida. RunAPI traslada el descuento al 50% de la tarifa de caché de OpenAI.
GPT-5.4 cuesta $2.50 de entrada y $15 de salida por millón de tokens; GPT-5.5 cuesta $5 y $30. RunAPI replica cada modelo GPT a la mitad de la tarifa oficial — la misma API, la misma salida, un 50% menos en tu factura.
OpenAI cobra cada modelo GPT por millón de tokens, con tarifas separadas de entrada y salida y una tarifa de entrada en caché más económica. Todas las cifras a continuación son por millón de tokens, la unidad de facturación que usa OpenAI.
GPT-5.4 a $1.25/M de entrada y $7.50/M de salida a través de RunAPI. La tarifa oficial es $2.50/$15.
GPT-5.4-mini a una fracción de la tarifa insignia, facturado con un 50% de descuento a través de RunAPI.
GPT-5.5 a $2.50/M de entrada y $15/M de salida a través de RunAPI. La tarifa oficial es $5/$30.
Los tokens de entrada en caché cuestan una fracción de la entrada estándar — trasladados al 50% en RunAPI.
La tabla muestra los precios oficiales de OpenAI junto con los precios de RunAPI. RunAPI aplica un descuento fijo del 50% en todos los modelos GPT. Sin compromisos de volumen ni suscripciones.
| Modelo | Entrada oficial /M | Salida oficial /M | Entrada RunAPI /M | Salida RunAPI /M | Ventana de contexto |
|---|---|---|---|---|---|
| GPT-5.5 | $5.00 | $30.00 | $2.50 | $15.00 | 400K |
| GPT-5.4 | $2.50 | $15.00 | $1.25 | $7.50 | 400K |
| GPT-5.4-mini | $0.25 | $2.00 | $0.13 | $1.00 | 400K |
| GPT-5.3-codex | $2.50 | $15.00 | $1.25 | $7.50 | 400K |
OpenAI cobra menos por tokens de entrada en caché y ofrece un descuento importante en solicitudes por lotes que toleran demoras en la entrega. Ambos son relevantes para cargas de trabajo repetitivas como agentes de programación y procesamiento masivo.
Los prefijos de prompt repetidos se facturan a una tarifa de entrada reducida. RunAPI traslada el descuento al 50% de la tarifa de caché de OpenAI.
Las solicitudes enviadas a la API por lotes se ejecutan a la mitad de la tarifa estándar con hasta 24 horas de espera. RunAPI traslada esto además de su propio descuento.
Los modelos GPT-5 te permiten configurar el esfuerzo de razonamiento. Un esfuerzo menor emite menos tokens de razonamiento, reduciendo directamente el costo de salida en la facturación medida.
Limita los tokens de salida máximos por solicitud para acotar el costo y evitar generaciones desbordadas en tareas agénticas largas.
Las tarifas por token parecen abstractas hasta que se vinculan a tareas reales. A continuación se muestran cargas de trabajo comunes de desarrolladores con costos mensuales estimados en dos niveles de uso, facturados a tarifas de RunAPI.
| Carga de trabajo | Modelo | Uso ligero (~50 tareas/día) | Uso intensivo (~200 tareas/día) | Ahorro mensual vs oficial |
|---|---|---|---|---|
| Agente de programación (Codex) | GPT-5.3-codex | $20/mes | $80/mes | $20–$80 |
| Chatbot de atención al cliente | GPT-5.4-mini | $6/mes | $24/mes | $6–$24 |
| Asistente de conocimiento RAG | GPT-5.4 | $18/mes | $72/mes | $18–$72 |
| Pipeline de generación de contenido | GPT-5.4 | $25/mes | $100/mes | $25–$100 |
| Orquestador multi-agente | GPT-5.5 | $90/mes | $360/mes | $90–$360 |
Los desarrolladores comparan GPT con Claude y Gemini. Así es como se comparan los modelos insignia en base al millón de tokens, con las tarifas de RunAPI junto a ellos.
| Proveedor | Modelo insignia | Entrada /M | Salida /M | Tarifa RunAPI |
|---|---|---|---|---|
| OpenAI | GPT-5.4 | $2.50 | $15.00 | $1.25 / $7.50 |
| Anthropic | Claude Opus 4.7 | $10.00 | $50.00 | $5.00 / $25.00 |
| Gemini 2.5 Pro | $1.25 | $10.00 | $0.63 / $5.00 |
RunAPI aplica un 50% de descuento en todos los proveedores listados. Precios verificados en junio de 2026.
Regístrate en runapi.ai. No se requiere tarjeta de crédito para el nivel gratuito.
Ve a Panel de control → API Keys. Crea una clave y guárdala — la usarás como tu API key de OpenAI.
Establece la URL base en https://api.runapi.ai/v1 y usa tu clave de RunAPI. Funciona cualquier cliente compatible con OpenAI.
Usa gpt-5.4, gpt-5.5 o cualquier ID de modelo GPT en el parámetro model. RunAPI gestiona el enrutamiento y la facturación al 50% de la tarifa oficial.
GPT-5.4 cuesta $2.50 por millón de tokens de entrada y $15 por millón de tokens de salida oficialmente. GPT-5.5 cuesta $5 y $30. A través de RunAPI, cada modelo GPT se factura a la mitad de esas tarifas — GPT-5.4 cuesta $1.25 de entrada y $7.50 de salida por millón de tokens.
RunAPI negocia precios por volumen con los proveedores de modelos y traslada los ahorros a los desarrolladores. Las solicitudes llegan a los mismos modelos de OpenAI con salida, filtros de seguridad y comportamiento idénticos, por lo que la única diferencia es la tarifa más baja en tu factura. No hay concesión de calidad ni nivel de facturación separado — el descuento se aplica automáticamente a cada modelo GPT.
Sí. OpenAI factura los prefijos de prompt repetidos a una tarifa de entrada en caché reducida, lo que reduce el costo para los agentes que reenvían el mismo contexto. RunAPI traslada el descuento de caché al 50% de la tarifa en caché de OpenAI, por lo que los ahorros de caché se suman al descuento base.
La API por lotes ejecuta solicitudes al 50% de la tarifa estándar a cambio de hasta 24 horas de espera. Es adecuada para trabajos masivos que no necesitan respuestas instantáneas. RunAPI traslada este descuento, por lo que el trabajo por lotes se factura a la mitad de la tarifa ya descontada.
En tokens de entrada insignia, GPT-5.4 a $2.50 se sitúa entre Gemini 2.5 Pro a $1.25 y Claude Opus a $10. La opción más barata depende del nivel del modelo y la carga de trabajo. RunAPI reduce a la mitad la tarifa de los tres, por lo que el ranking relativo se mantiene.
Sí. RunAPI es compatible con OpenAI. Apunta cualquier cliente de OpenAI a https://api.runapi.ai/v1, usa tu clave de RunAPI y pasa un ID de modelo GPT. El código existente que ya usa el SDK de OpenAI funciona sin ningún cambio más allá de la URL base y la clave, por lo que migrar un proyecto establecido tarda aproximadamente un minuto.
Sí. GPT-5.3-codex está disponible a través de RunAPI al 50% de la tarifa oficial, que es $1.25 de entrada y $7.50 de salida por millón de tokens. Funciona con Codex y otras herramientas de programación compatibles con OpenAI anulando la URL base y la clave en su configuración. Los descuentos de entrada en caché y por lotes también se trasladan, reduciendo aún más el costo efectivo de las sesiones de programación repetitivas.
Sí. Las nuevas cuentas de RunAPI reciben créditos gratuitos para probar cualquier modelo GPT antes de comprometerse. Después, la facturación es estrictamente de pago por uso sin gasto mínimo, sin suscripción y sin compromiso mensual — fondeas un saldo y cada llamada deduce su costo de tokens. Puedes recargar cualquier cantidad y ver el uso por modelo en el panel de control.
Crea una cuenta gratuita de RunAPI, obtén tu API key y llama a cualquier modelo GPT de OpenAI con un 50% de descuento sobre los precios oficiales.