---
title: "Kimi API — varianti, prezzi e model skill | RunAPI"
url: "https://runapi.ai/it/models/kimi.md"
canonical: "https://runapi.ai/it/models/kimi.md"
locale: "it"
model: "Kimi"
provider: "Moonshot AI"
modality: "text"
variant_count: 2
price_from_cents: 2
---

# Kimi API

Moonshot AI Kimi API access via RunAPI — 1T-parameter MoE with 256K context, 58.6% SWE-bench Pro.

**Provider:** Moonshot AI
**Modality:** Text
**Catalog:** 2 variants

Kimi is Moonshot AI&#39;s K2 family of Mixture-of-Experts language models — 1 trillion total parameters with 32B active per token, 384 experts per layer. kimi-k2.5 (256K context) added native multimodal input and strong coding benchmarks. kimi-k2.6 refines post-training for long-horizon agent stability, reaching 58.6% on SWE-bench Pro and scaling Agent Swarm orchestration to 300 sub-agents. Both are available through RunAPI with one key and per-token billing.

## Variants

| Version | Variant | Pricing | Billing | URL |
|---|---|---|---|---|
| kimi-k2.5 | `k2.5` | $0.020 | 1K tokens | https://runapi.ai/it/models/kimi/k2.5.md |
| kimi-k2.6 | `k2.6` | $0.020 | 1K tokens | https://runapi.ai/it/models/kimi/k2.6.md |


## API endpoints

Base URL: `https://runapi.ai`

- `POST /v1/chat/completions`

Use the OpenAI or Anthropic SDK with your RunAPI API key. No extra SDK required.

## Context

Kimi K2 models from Moonshot AI are 1T-parameter MoE LLMs with 256K context, optimized for autonomous coding and multi-agent orchestration. kimi-k2.6 scores 58.6% on SWE-bench Pro. Through RunAPI they share a single API key with pay-as-you-go token billing, callable from the OpenAI Chat Completions, OpenAI Responses, and Anthropic Messages surfaces.

## FAQ

### Da quale variante dovrei iniziare?

Scegli la variante più economica che soddisfa il tuo livello di qualità. La maggior parte dei team inizia con la variante veloce e passa alla pro per la produzione.

### C’è un piano gratuito?

I nuovi account ricevono le prime chiamate gratuite su ogni modello. Dopo, paghi per chiamata.

### Trasmettete i risultati in streaming?

Dove lo streaming è disponibile, RunAPI trasmette end-to-end.

### Come vengono addebitati i fallimenti?

Le generazioni non riuscite non vengono addebitate.

### Gli output vengono memorizzati nella cache?

Gli output generati vengono salvati e recuperabili tramite ID del task. Gli input non vengono memorizzati nella cache.

### Posso usarlo a fini commerciali?

Sì — l’uso commerciale è incluso per ogni variante, salvo che una licenza del modello lo limiti esplicitamente; in tal caso è indicato nella pagina della variante.

### E i limiti di rate limit?

I rate limit per chiave scalano in base al tier di utilizzo. Vedi la pagina prezzi per i limiti aggiornati.

### Dove posso segnalare problemi?

Apri un issue nel repo GitHub pubblico oppure scrivi al supporto.

