---
title: "Kimi API — varianten, prijzen en modelskill | RunAPI"
url: "https://runapi.ai/nl/models/kimi.md"
canonical: "https://runapi.ai/nl/models/kimi.md"
locale: "nl"
model: "Kimi"
provider: "Moonshot AI"
modality: "text"
variant_count: 2
price_from_cents: 2
---

# Kimi API

Moonshot AI Kimi API access via RunAPI — 1T-parameter MoE with 256K context, 58.6% SWE-bench Pro.

**Provider:** Moonshot AI
**Modality:** Text
**Catalog:** 2 variants

Kimi is Moonshot AI&#39;s K2 family of Mixture-of-Experts language models — 1 trillion total parameters with 32B active per token, 384 experts per layer. kimi-k2.5 (256K context) added native multimodal input and strong coding benchmarks. kimi-k2.6 refines post-training for long-horizon agent stability, reaching 58.6% on SWE-bench Pro and scaling Agent Swarm orchestration to 300 sub-agents. Both are available through RunAPI with one key and per-token billing.

## Variants

| Version | Variant | Pricing | Billing | URL |
|---|---|---|---|---|
| kimi-k2.5 | `k2.5` | $0.020 | 1K tokens | https://runapi.ai/nl/models/kimi/k2.5.md |
| kimi-k2.6 | `k2.6` | $0.020 | 1K tokens | https://runapi.ai/nl/models/kimi/k2.6.md |


## API endpoints

Base URL: `https://runapi.ai`

- `POST /v1/chat/completions`

Use the OpenAI or Anthropic SDK with your RunAPI API key. No extra SDK required.

## Context

Kimi K2 models from Moonshot AI are 1T-parameter MoE LLMs with 256K context, optimized for autonomous coding and multi-agent orchestration. kimi-k2.6 scores 58.6% on SWE-bench Pro. Through RunAPI they share a single API key with pay-as-you-go token billing, callable from the OpenAI Chat Completions, OpenAI Responses, and Anthropic Messages surfaces.

## FAQ

### Met welke variant moet ik beginnen?

Kies de goedkoopste variant die aan je kwaliteitsnorm voldoet. De meeste teams beginnen met de snelle variant en stappen over op pro voor productie.

### Is er een gratis tier?

Nieuwe accounts krijgen de eerste calls gratis op elk model. Daarna betaal je per call.

### Streamen jullie resultaten?

Waar streaming beschikbaar is, streamt RunAPI end-to-end.

### Hoe worden mislukkingen gefactureerd?

Mislukte generations worden niet in rekening gebracht.

### Worden outputs gecachet?

Gegenereerde outputs worden opgeslagen en zijn op te vragen via task-ID. Inputs worden niet gecachet.

### Mag ik het commercieel gebruiken?

Ja — commercieel gebruik is inbegrepen voor elke variant, tenzij een modellicentie het expliciet beperkt. Dat staat aangegeven op de variantpagina.

### Hoe zit het met rate limits?

Rate limits per key schalen mee met je usage tier. Zie de prijzenpagina voor de actuele limieten.

### Waar kan ik problemen melden?

Open een issue in de publieke GitHub-repo of mail support.