Kimi API
Moonshot AI Kimi API 调用 —— 万亿参数 MoE,256K 上下文,SWE-bench Pro 58.6%。
# Base URL
https://runapi.ai
# Endpoints
POST /v1/chat/completions
curl https://runapi.ai/v1/chat/completions \
-H "Authorization: Bearer $RUNAPI_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "kimi-k2.6",
"messages": [
{
"role": "user",
"content": "规划并实现一个小型 CLI 工具:搭建项目、编写命令、补充测试,并运行到全部通过。"
}
]
}'
from openai import OpenAI
client = OpenAI(
base_url="https://runapi.ai/v1",
api_key="your-runapi-key"
)
response = client.chat.completions.create(
model="kimi-k2.6",
messages=[{"role": "user", "content": "规划并实现一个小型 CLI 工具:搭建项目、编写命令、补充测试,并运行到全部通过。"}]
)
import OpenAI from "openai";
const client = new OpenAI({
baseURL: "https://runapi.ai/v1",
apiKey: "your-runapi-key"
});
const response = await client.chat.completions.create({
model: "kimi-k2.6",
messages: [{ role: "user", content: "规划并实现一个小型 CLI 工具:搭建项目、编写命令、补充测试,并运行到全部通过。" }]
});
Kimi 是 Moonshot AI 的 K2 系列 MoE 语言模型——总参数 1 万亿、每 token 激活 32B、每层 384 专家。kimi-k2.5(256K 上下文)新增原生多模态输入与强编码基准。kimi-k2.6 通过后训练优化长链路智能体稳定性,SWE-bench Pro 达到 58.6%,Agent Swarm 编排能力扩展到 300 子智能体。两者均可通过 RunAPI 用一个密钥按 token 计费调用。
- 多变体覆盖不同速度/质量层级
- Model skill 包含文档、schema 和接入说明
- 适合面向应用的编码工作流
- 失败的生成不计费
对比全部 API 变体
Kimi API 端点
使用 OpenAI 或 Anthropic SDK 配合 RunAPI key 调用,无需额外 SDK。
| Endpoint | Protocol |
|---|---|
| /v1/chat/completions | OpenAI compatible |
四步从 model skill 到首次结果
选择模型
根据输出类型、质量要求和延迟目标选择模型与变体。
配置
设置 RunAPI key,并在代码工作区安装对应 model skill。
调用
按 skill 里的说明,把模型能力接入到你的应用里。
接收
按 task ID 轮询、在支持时使用流式,或处理 webhook 回调。
Kimi API 是什么?
Moonshot AI 的 Kimi K2 模型是万亿参数 MoE 大语言模型,256K 上下文,针对自主编码与多智能体编排优化。kimi-k2.6 SWE-bench Pro 达 58.6%。通过 RunAPI 共用一个 API key、按量计费,可用 OpenAI Chat Completions、OpenAI Responses 与 Anthropic Messages 接口调用。
为什么用 RunAPI 调用 Kimi API
一把认证,覆盖所有提供方
一把 RunAPI key 解锁整个模型目录。无需为每家提供方单独建账户。
统一的定价与账单
USD 按次定价,按月结算。失败的生成不计费。
Schema 优先的 SDK
Typed schema 和接入说明已打包进 model skill,让实现从正确契约开始。
常见问题
应该从哪个变体开始?
选满足质量要求的最便宜变体。多数团队从 fast 起步,生产时升级到 pro。
有免费额度吗?
新账户每个模型都有免费调用额度,之后按次计费。
支持流式吗?
模型支持流式时,RunAPI 端到端流式。
失败怎么计费?
失败的生成不计费。
输出会缓存吗?
输出按任务 ID 存储在 R2 供回取。输入不缓存。
可以商用吗?
可以——所有变体默认含商用许可,除非模型许可明确限制;有例外会在变体页面注明。
速率限制?
Key 级限流随使用层级伸缩。当前限制见定价页。
在哪里报问题?
在公共 GitHub 仓库提 issue 或邮件联系 support。