---
title: "Kimi API — warianty, cennik i model skill | RunAPI"
url: "https://runapi.ai/pl/models/kimi.md"
canonical: "https://runapi.ai/pl/models/kimi.md"
locale: "pl"
model: "Kimi"
provider: "Moonshot AI"
modality: "text"
variant_count: 2
price_from_cents: 2
---

# Kimi API

Moonshot AI Kimi API access via RunAPI — 1T-parameter MoE with 256K context, 58.6% SWE-bench Pro.

**Provider:** Moonshot AI
**Modality:** Text
**Catalog:** 2 variants

Kimi is Moonshot AI&#39;s K2 family of Mixture-of-Experts language models — 1 trillion total parameters with 32B active per token, 384 experts per layer. kimi-k2.5 (256K context) added native multimodal input and strong coding benchmarks. kimi-k2.6 refines post-training for long-horizon agent stability, reaching 58.6% on SWE-bench Pro and scaling Agent Swarm orchestration to 300 sub-agents. Both are available through RunAPI with one key and per-token billing.

## Variants

| Version | Variant | Pricing | Billing | URL |
|---|---|---|---|---|
| kimi-k2.5 | `k2.5` | $0.020 | 1K tokens | https://runapi.ai/pl/models/kimi/k2.5.md |
| kimi-k2.6 | `k2.6` | $0.020 | 1K tokens | https://runapi.ai/pl/models/kimi/k2.6.md |


## API endpoints

Base URL: `https://runapi.ai`

- `POST /v1/chat/completions`

Use the OpenAI or Anthropic SDK with your RunAPI API key. No extra SDK required.

## Context

Kimi K2 models from Moonshot AI are 1T-parameter MoE LLMs with 256K context, optimized for autonomous coding and multi-agent orchestration. kimi-k2.6 scores 58.6% on SWE-bench Pro. Through RunAPI they share a single API key with pay-as-you-go token billing, callable from the OpenAI Chat Completions, OpenAI Responses, and Anthropic Messages surfaces.

## FAQ

### Od jakiego wariantu powinienem zacząć?

Wybierz najtańszy wariant, który spełnia Twoje wymagania jakościowe. Większość zespołów zaczyna od szybkiego wariantu, a do produkcji przechodzi na pro.

### Czy jest darmowy plan?

Nowe konta otrzymują darmowe pierwsze wywołania dla każdego modelu. Później płacisz za każde wywołanie.

### Czy streamujecie wyniki?

Tam, gdzie streaming jest dostępny, RunAPI streamuje end-to-end.

### Jak są rozliczane nieudane próby?

Nieudane generacje nie są obciążane opłatą.

### Czy wyniki są buforowane?

Wygenerowane wyniki są zapisywane i można je pobrać po ID zadania. Dane wejściowe nie są buforowane.

### Czy mogę używać komercyjnie?

Tak — użycie komercyjne jest dostępne dla każdego wariantu, chyba że licencja modelu wyraźnie to ogranicza; informacja taka jest podana na stronie wariantu.

### A co z limitami zapytań?

Limity na klucz rosną wraz z poziomem wykorzystania. Aktualne limity znajdziesz na stronie cennika.

### Gdzie mogę zgłosić problem?

Otwórz zgłoszenie w publicznym repozytorium GitHub albo napisz do supportu.