Text · MiniMax

MiniMax API

MiniMax 文本 API 调用 —— 230B MoE 模型,200K–1M 上下文,最高 SWE-bench Verified 80.5%。

运行中 · 7 variants · 起价 $0.010
runapi.ai
# Base URL
https://runapi.ai

# Endpoints
POST /v1/chat/completions
curl https://runapi.ai/v1/chat/completions \
  -H "Authorization: Bearer $RUNAPI_KEY" \
  -H "Content-Type: application/json" \
  -d '{
  "model": "MiniMax-M3",
  "messages": [
    {
      "role": "user",
      "content": "根据这份 API 规范生成一个带类型的客户端,针对 mock server 编写集成测试,并迭代到全部通过。"
    }
  ]
}'
from openai import OpenAI

client = OpenAI(
    base_url="https://runapi.ai/v1",
    api_key="your-runapi-key"
)

response = client.chat.completions.create(
    model="MiniMax-M3",
    messages=[{"role": "user", "content": "根据这份 API 规范生成一个带类型的客户端,针对 mock server 编写集成测试,并迭代到全部通过。"}]
)
import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://runapi.ai/v1",
  apiKey: "your-runapi-key"
});

const response = await client.chat.completions.create({
  model: "MiniMax-M3",
  messages: [{ role: "user", content: "根据这份 API 规范生成一个带类型的客户端,针对 mock server 编写集成测试,并迭代到全部通过。" }]
});
https://runapi.ai /v1/chat/completions
概览

MiniMax M 系列是稀疏 MoE 文本模型(230B 总参 / ~10B 激活,256 专家),面向高性价比编码。M2 至 M2.7 提供 200K 上下文,智能体能力逐代增强——M2.7 SWE-bench Pro 达 56.2%。MiniMax-M3 采用全新 Sparse Attention 架构恢复 1M 上下文,SWE-bench Verified 80.5%、SWE-bench Pro 59.0%。Highspeed 版本使用相同权重,以 ~100 tokens/sec 服务低延迟场景。全部可通过 RunAPI 用一个密钥按 token 计费调用。

  • 多变体覆盖不同速度/质量层级
  • Model skill 包含文档、schema 和接入说明
  • 适合面向应用的编码工作流
  • 失败的生成不计费
变体

对比全部 API 变体

Variant Billing From
MiniMax-M2 1K tokens $0.010 查看 →
MiniMax-M2.1 1K tokens $0.010 查看 →
MiniMax-M2.5 1K tokens $0.010 查看 →
MiniMax-M2.5-highspeed 1K tokens $0.020 查看 →
MiniMax-M2.7 1K tokens $0.010 查看 →
MiniMax-M2.7-highspeed 1K tokens $0.020 查看 →
MiniMax-M3 1K tokens $0.010 查看 →
API

MiniMax API 端点

使用 OpenAI 或 Anthropic SDK 配合 RunAPI key 调用,无需额外 SDK。

Endpoint Protocol
/v1/chat/completions OpenAI compatible
工作流程

四步从 model skill 到首次结果

01

选择模型

根据输出类型、质量要求和延迟目标选择模型与变体。

02

配置

设置 RunAPI key,并在代码工作区安装对应 model skill。

03

调用

按 skill 里的说明,把模型能力接入到你的应用里。

04

接收

按 task ID 轮询、在支持时使用流式,或处理 webhook 回调。

背景

MiniMax API 是什么?

MiniMax M 系列文本模型是 230B MoE 大语言模型,200K–1M 上下文,以远低于稠密模型的成本交付前沿编码水准。通过 RunAPI 共用一个 API key、按量计费,可用 OpenAI Chat Completions、OpenAI Responses 与 Anthropic Messages 接口调用。这些是 MiniMax 的文本模型,与 MiniMax Hailuo 视频生成不同。

Provider
MiniMax
Modality
Text
为何选择 RunAPI

为什么用 RunAPI 调用 MiniMax API

一把认证,覆盖所有提供方

一把 RunAPI key 解锁整个模型目录。无需为每家提供方单独建账户。

统一的定价与账单

USD 按次定价,按月结算。失败的生成不计费。

Schema 优先的 SDK

Typed schema 和接入说明已打包进 model skill,让实现从正确契约开始。

常见问题

常见问题

应该从哪个变体开始?

选满足质量要求的最便宜变体。多数团队从 fast 起步,生产时升级到 pro。

有免费额度吗?

新账户每个模型都有免费调用额度,之后按次计费。

支持流式吗?

模型支持流式时,RunAPI 端到端流式。

失败怎么计费?

失败的生成不计费。

输出会缓存吗?

输出按任务 ID 存储在 R2 供回取。输入不缓存。

可以商用吗?

可以——所有变体默认含商用许可,除非模型许可明确限制;有例外会在变体页面注明。

速率限制?

Key 级限流随使用层级伸缩。当前限制见定价页。

在哪里报问题?

在公共 GitHub 仓库提 issue 或邮件联系 support。

立即开始

立即体验 MiniMax API。