Text · MiniMax

MiniMax API

MiniMax 文本 API 调用 —— 230B MoE 模型，200K–1M 上下文，最高 SWE-bench Verified 80.5%。

运行中 · 7 variants · 起价 $0.010

runapi.ai

# Base URL
https://runapi.ai

# Endpoints
POST /v1/chat/completions

curl https://runapi.ai/v1/chat/completions \
  -H "Authorization: Bearer $RUNAPI_KEY" \
  -H "Content-Type: application/json" \
  -d '{
  "model": "MiniMax-M3",
  "messages": [
    {
      "role": "user",
      "content": "根据这份 API 规范生成一个带类型的客户端，针对 mock server 编写集成测试，并迭代到全部通过。"
    }
  ]
}'

from openai import OpenAI

client = OpenAI(
    base_url="https://runapi.ai/v1",
    api_key="your-runapi-key"
)

response = client.chat.completions.create(
    model="MiniMax-M3",
    messages=[{"role": "user", "content": "根据这份 API 规范生成一个带类型的客户端，针对 mock server 编写集成测试，并迭代到全部通过。"}]
)

import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://runapi.ai/v1",
  apiKey: "your-runapi-key"
});

const response = await client.chat.completions.create({
  model: "MiniMax-M3",
  messages: [{ role: "user", content: "根据这份 API 规范生成一个带类型的客户端，针对 mock server 编写集成测试，并迭代到全部通过。" }]
});

https://runapi.ai /v1/chat/completions

概览

MiniMax M 系列是稀疏 MoE 文本模型（230B 总参 / ~10B 激活，256 专家），面向高性价比编码。M2 至 M2.7 提供 200K 上下文，智能体能力逐代增强——M2.7 SWE-bench Pro 达 56.2%。MiniMax-M3 采用全新 Sparse Attention 架构恢复 1M 上下文，SWE-bench Verified 80.5%、SWE-bench Pro 59.0%。Highspeed 版本使用相同权重，以 ~100 tokens/sec 服务低延迟场景。全部可通过 RunAPI 用一个密钥按 token 计费调用。

多变体覆盖不同速度/质量层级
Model skill 包含文档、schema 和接入说明
适合面向应用的编码工作流
失败的生成不计费

变体

对比全部 API 变体

Variant	Billing	From
MiniMax-M2	1K tokens	$0.010	查看 →
MiniMax-M2.1	1K tokens	$0.010	查看 →
MiniMax-M2.5	1K tokens	$0.010	查看 →
MiniMax-M2.5-highspeed	1K tokens	$0.020	查看 →
MiniMax-M2.7	1K tokens	$0.010	查看 →
MiniMax-M2.7-highspeed	1K tokens	$0.020	查看 →
MiniMax-M3	1K tokens	$0.010	查看 →

API

MiniMax API 端点

使用 OpenAI 或 Anthropic SDK 配合 RunAPI key 调用，无需额外 SDK。

Endpoint	Protocol
/v1/chat/completions	OpenAI compatible

工作流程

四步从 model skill 到首次结果

选择模型

根据输出类型、质量要求和延迟目标选择模型与变体。

配置

设置 RunAPI key，并在代码工作区安装对应 model skill。

调用

按 skill 里的说明，把模型能力接入到你的应用里。

接收

按 task ID 轮询、在支持时使用流式，或处理 webhook 回调。

背景

MiniMax API 是什么？

MiniMax M 系列文本模型是 230B MoE 大语言模型，200K–1M 上下文，以远低于稠密模型的成本交付前沿编码水准。通过 RunAPI 共用一个 API key、按量计费，可用 OpenAI Chat Completions、OpenAI Responses 与 Anthropic Messages 接口调用。这些是 MiniMax 的文本模型，与 MiniMax Hailuo 视频生成不同。

Provider

MiniMax

Modality

Text

为何选择 RunAPI