MiniMax-M2.5-highspeed API
MiniMax / MiniMax
RunAPI로 MiniMax 패밀리의 MiniMax-M2.5-highspeed를 사용하세요. 호출당 요금, 구독 없음, 실패한 생성은 과금되지 않습니다.
운영 중
·
text
·
상업적 사용 지원
# Base URL
https://runapi.ai
# Endpoints
POST /v1/chat/completions
curl https://runapi.ai/v1/chat/completions \
-H "Authorization: Bearer $RUNAPI_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "MiniMax-M2.5-highspeed",
"messages": [
{
"role": "user",
"content": "Given this API spec, generate a typed client, write integration tests against a mock server, and iterate until they pass."
}
]
}'
from openai import OpenAI
client = OpenAI(
base_url="https://runapi.ai/v1",
api_key="your-runapi-key"
)
response = client.chat.completions.create(
model="MiniMax-M2.5-highspeed",
messages=[{"role": "user", "content": "Given this API spec, generate a typed client, write integration tests against a mock server, and iterate until they pass."}]
)
import OpenAI from "openai";
const client = new OpenAI({
baseURL: "https://runapi.ai/v1",
apiKey: "your-runapi-key"
});
const response = await client.chat.completions.create({
model: "MiniMax-M2.5-highspeed",
messages: [{ role: "user", content: "Given this API spec, generate a typed client, write integration tests against a mock server, and iterate until they pass." }]
});
변형 전환
개요
MiniMax MiniMax-M2.5-highspeed는 같은 RunAPI 인증, model skill 워크플로, 사용량 기반 가격으로 사용할 수 있습니다.
- 통합 API key
- Model skill 설정
- 모델 ID 참조
- 실패한 생성은 과금되지 않습니다
요금
요금
실패한 생성은 과금되지 않습니다
Chat completion
Input
$0.30
/ 1M tokens
Output
$1.20
/ 1M tokens
Cache read
$0.03
Cache write 5m
$0.19
스펙
스펙
| 모델 ID | MiniMax-M2.5-highspeed |
| 제공사 | MiniMax |
| 모달리티 | text |
| 작업 유형 | synchronous |
| 과금 | 1K tokens |
| Endpoint | /v1/chat/completions |
| 상업적 사용 | 예 |
| 상태 | 운영 중 |
MODELS
모델 스킬 — MiniMax-M2.5-highspeed
스킬을 한 번 설치한 후, 이 페이지의 변형 ID를 사용해 개발을 시작하세요.
| Endpoint | Protocol |
|---|---|
| /v1/chat/completions | OpenAI compatible |
작동 방식
MiniMax-M2.5-highspeed 사용 방법
01
모델 선택
앱 워크플로에 맞는 모델과 변형을 고릅니다.
02
모델 ID 전달
요청 본문에 이 변형 ID를 사용합니다.
03
작업 실행
요청을 보내고 반환된 task ID를 저장합니다.
04
출력 수집
작업이 끝나면 조회하거나 callback으로 결과를 받습니다.
차이
MiniMax-M2.5-highspeed 비교
VS MINIMAX-M2
M2.5 at ~100 tokens/sec; same weights, higher throughput
230B / 10B active; 200K context; baseline M-series coding model
VS MINIMAX-M2.1
M2.5 at ~100 tokens/sec; same weights, higher throughput
200K context; polyglot programming; 74% SWE-bench Verified
VS MINIMAX-M2.5
M2.5 at ~100 tokens/sec; same weights, higher throughput
200K context; stronger agentic tool calling and search
사용 사례
이 변형을 쓰는 곳
Chat
LLM을 채팅과 추론에 사용합니다.
코드
구현 작업을 생성하고 리뷰합니다.
자동화
모델을 backend 작업에 연결합니다.
FAQ
MiniMax-M2.5-highspeed 자주 묻는 질문
MiniMax-M2.5-highspeed는 어떻게 선택하나요?
quickstart에 표시된 모델 ID를 전달하세요.
가격은 사용량 기반인가요?
네. 호출 또는 단위 기준으로 측정됩니다.
지금 시작