Precios de LLM API

Precios de Claude API en 2026

Anthropic cobra entre $3 y $15 por millón de tokens según el modelo. RunAPI replica todos los modelos de Claude a la mitad de la tarifa oficial — misma API, misma salida, 50% menos en tu factura.

Actualizado el June 18, 2026 RunAPI Editorial
De un vistazo

¿Cuánto cuesta Claude API ahora mismo?

Anthropic publica precios por token para tres niveles de modelos: Haiku para tareas ligeras, Sonnet para cargas de trabajo equilibradas y Opus para máxima capacidad. Todos los precios a continuación son por millón de tokens, la unidad de facturación que usa Anthropic.

Opción más económica

Haiku 4.5 a $1/M de entrada y $5/M de salida a través de RunAPI. Tarifa oficial es $2/$10.

El más popular

Sonnet 4.6 a $3/M de entrada y $15/M de salida a través de RunAPI. Tarifa oficial es $6/$30.

Máxima capacidad

Opus 4.7 a $5/M de entrada y $25/M de salida a través de RunAPI. Tarifa oficial es $10/$50.

Descuento de caché

Las lecturas de caché cuestan un 90% menos que los tokens de entrada estándar — $0.10/M para Haiku a través de RunAPI.

Desglose modelo por modelo

¿Cuánto cuesta cada modelo de Claude por millón de tokens?

La tabla muestra los precios oficiales de Anthropic junto a los precios de RunAPI. RunAPI aplica un descuento fijo del 50% en todos los modelos de Claude. Sin compromisos de volumen, sin suscripciones.

Modelo Entrada oficial /M Salida oficial /M Entrada RunAPI /M Salida RunAPI /M Ventana de contexto
Opus 4.8 $15.00 $75.00 $7.50 $37.50 200K
Opus 4.7 $10.00 $50.00 $5.00 $25.00 200K
Opus 4.6 $10.00 $50.00 $5.00 $25.00 200K
Sonnet 4.6 $6.00 $30.00 $3.00 $15.00 200K
Sonnet 4.5 $6.00 $30.00 $3.00 $15.00 200K
Haiku 4.5 $2.00 $10.00 $1.00 $5.00 200K
Caché de prompts

¿Cómo reducen los descuentos de caché tu factura de Claude API?

El almacenamiento en caché de prompts de Anthropic guarda prefijos repetidos y cobra menos cuando se reutiliza la versión en caché. Esto es relevante para agentes de programación como Claude Code, que envían el mismo prompt de sistema y contexto de archivos en cada solicitud.

Lectura de caché

90% de descuento en tokens de entrada. Una lectura de caché de Sonnet 4.6 cuesta $0.30/M en lugar de $3.00/M a través de RunAPI.

Escritura de caché (TTL 5 min)

Recargo del 25% sobre la entrada — $3.75/M para Sonnet 4.6 a través de RunAPI. El prefijo en caché permanece disponible durante 5 minutos.

Escritura de caché (TTL 1 hora)

El doble de la tarifa de entrada — $6.00/M para Sonnet 4.6 a través de RunAPI. Útil para sesiones largas de programación donde la reutilización del contexto es frecuente.

Procesamiento por lotes

Anthropic ofrece un 50% de descuento en todos los modelos para solicitudes por lotes que toleran hasta 24 horas de espera. RunAPI traslada este descuento al usuario.

Costos en el mundo real

¿Cuánto cuesta realmente Claude API para cargas de trabajo reales?

Los costos por token parecen abstractos hasta que los vinculas a tareas reales. A continuación se presentan cinco cargas de trabajo habituales de desarrolladores con costos mensuales estimados en dos niveles de uso.

Carga de trabajo Modelo Uso ligero (~50 tareas/día) Uso intensivo (~200 tareas/día) Ahorro mensual vs oficial
Sesión de programación con Claude Code Sonnet 4.6 $45/mes $180/mes $45–$180
Agente de revisión de código en PR Opus 4.7 $75/mes $300/mes $75–$300
Chatbot de documentos con RAG Haiku 4.5 $12/mes $48/mes $12–$48
Pipeline de generación de contenido Sonnet 4.6 $30/mes $120/mes $30–$120
Orquestador multiagente Opus 4.7 $150/mes $600/mes $150–$600
Comparación de proveedores

¿Es Claude API más barato que OpenAI y Gemini?

Los desarrolladores suelen comparar Claude con GPT-5 y Gemini 2.5 Pro. Así es como se comparan los modelos insignia en términos de costo por millón de tokens.

Proveedor Modelo insignia Entrada /M Salida /M Tarifa RunAPI
Anthropic Claude Opus 4.7 $10.00 $50.00 $5.00 / $25.00
OpenAI GPT-5.4 $2.50 $15.00 $1.25 / $7.50
Google Gemini 2.5 Pro $1.25 $10.00 $0.63 / $5.00

RunAPI aplica un 50% de descuento en todos los proveedores listados. Precios verificados en junio de 2026.

Suscripción vs API

¿Es Claude API más barato que una suscripción Claude Max?

Claude Max cuesta $100/mes para uso ilimitado de Claude Code (o $200 para el plan 5x). La API cobra por token. Para desarrolladores que generan menos de 10 millones de tokens de salida al mes con Sonnet 4.6, la opción RunAPI cuesta menos que la suscripción Max — y no hay límite de uso en ningún nivel de modelo.

Claude Max ($100/mes)

Uso ilimitado de Sonnet y Opus limitado en Claude Code. Costo mensual fijo. Sin acceso a la API.

Claude API vía RunAPI

Pago por token sin compromiso mensual. Sonnet 4.6 a $3/M de entrada y $15/M de salida. $100 compra aproximadamente 6.7 millones de tokens de salida — suficiente para la mayoría de desarrolladores individuales.

Cuándo gana Max

Usuarios intensivos diarios que superan constantemente los 10 millones de tokens de salida al mes. El punto de equilibrio con Sonnet 4.6 a través de RunAPI ronda los 6.7M tokens de salida.

Cuándo gana la API

Equipos, pipelines de CI, configuraciones multimodelo y desarrolladores que quieren acceso a Opus o Haiku junto con Sonnet. Sin límites, sin lista de espera, sin bloqueo por suscripción.

Primeros pasos

Cómo acceder a Claude API a través de RunAPI

1

Crear una cuenta en RunAPI

Regístrate en runapi.ai. No se requiere tarjeta de crédito para el nivel gratuito.

2

Copia tu clave de API

Ve a Panel → Claves de API. Crea una clave y guárdala — la usarás como tu clave de API de OpenAI.

3

Apunta tu SDK a RunAPI

Establece la URL base en https://api.runapi.ai/v1 y usa tu clave de API de RunAPI. Cualquier cliente compatible con OpenAI funciona — Python, Node.js, Go, Ruby o curl.

4

Empieza a hacer solicitudes

Usa claude-sonnet-4-6, claude-opus-4-7 o cualquier ID de modelo de Claude en el parámetro model. RunAPI gestiona el enrutamiento y la facturación al 50% de la tarifa oficial.

Preguntas frecuentes

Preguntas frecuentes sobre precios de Claude API

¿RunAPI modifica la salida de Claude?

No. RunAPI envía las solicitudes directamente a la API de Anthropic. La salida del modelo, los filtros de seguridad y el comportamiento son idénticos a llamar directamente a Anthropic.

¿Por qué RunAPI es 50% más barato que la API oficial?

RunAPI negocia precios por volumen con los proveedores de modelos y traslada el ahorro a los desarrolladores. No hay diferencia de calidad — los mismos modelos, la misma API.

¿Puedo usar RunAPI con Claude Code?

Sí. Establece ANTHROPIC_BASE_URL en https://api.runapi.ai y tu clave de RunAPI como clave de API. Claude Code funciona sin modificaciones.

¿Qué ocurre si Anthropic cambia sus precios?

RunAPI ajusta los precios en un plazo de 24 horas. El descuento del 50% se mantiene en relación con las tarifas publicadas por Anthropic.

¿Hay un nivel gratuito?

Sí. Las cuentas nuevas reciben créditos gratuitos para probar cualquier modelo. Después, la facturación es estrictamente por uso, sin mínimo.

¿RunAPI admite caché de prompts?

Sí. Las lecturas de caché, escrituras de 5 minutos y escrituras de 1 hora están disponibles al 50% del precio de caché de Anthropic.

¿Puedo usar el SDK de OpenAI para llamar a Claude a través de RunAPI?

Sí. RunAPI es compatible con OpenAI. Apunta cualquier cliente de OpenAI a api.runapi.ai/v1 y usa los IDs de modelos de Claude.

¿Cómo funciona la facturación?

Por uso. Depositas saldo en tu cuenta y cada llamada a la API descuenta el costo en tokens. Sin suscripciones, sin facturas, sin contratos.

Empieza a usar Claude a mitad de precio.

Crea una cuenta gratuita en RunAPI, obtén tu clave de API y empieza a llamar a Claude Opus, Sonnet o Haiku con un 50% de descuento sobre los precios oficiales de Anthropic.