Qwen API
阿里巴巴 Qwen API 调用 —— Apache-2.0 超稀疏 MoE,262K 上下文,80B 总参 / 3.9B 激活。
# Base URL
https://runapi.ai
# Endpoints
POST /v1/chat/completions
curl https://runapi.ai/v1/chat/completions \
-H "Authorization: Bearer $RUNAPI_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "qwen3-next-80b-a3b-instruct",
"messages": [
{
"role": "user",
"content": "分析这个大型代码库,找出处理请求超时的位置,并在各服务间补充一致的重试逻辑。"
}
]
}'
from openai import OpenAI
client = OpenAI(
base_url="https://runapi.ai/v1",
api_key="your-runapi-key"
)
response = client.chat.completions.create(
model="qwen3-next-80b-a3b-instruct",
messages=[{"role": "user", "content": "分析这个大型代码库,找出处理请求超时的位置,并在各服务间补充一致的重试逻辑。"}]
)
import OpenAI from "openai";
const client = new OpenAI({
baseURL: "https://runapi.ai/v1",
apiKey: "your-runapi-key"
});
const response = await client.chat.completions.create({
model: "qwen3-next-80b-a3b-instruct",
messages: [{ role: "user", content: "分析这个大型代码库,找出处理请求超时的位置,并在各服务间补充一致的重试逻辑。" }]
});
Qwen 是阿里巴巴的 Apache-2.0 语言模型系列。qwen3-next-80b-a3b-instruct 采用混合注意力架构(DeltaNet 线性 + GQA),搭配超稀疏 MoE——80B 总参、每 token 仅 ~3.9B 激活、512 专家。原生 262K 上下文(可扩展至 1M),编码与对话基准匹配 Qwen3-235B-A22B,激活参数仅为后者 1/7、推理吞吐量提升 10 倍。可通过 RunAPI 用一个密钥按 token 计费调用。
- 多变体覆盖不同速度/质量层级
- Model skill 包含文档、schema 和接入说明
- 适合面向应用的编码工作流
- 失败的生成不计费
定价
技术细节
| 模型 ID | qwen3-next-80b-a3b-instruct |
| 提供方 | Alibaba |
| 模态 | text |
| 任务类型 | synchronous |
| 计费单位 | 1K tokens |
| API 端点 | /v1/chat/completions |
| 商用许可 | 允许商用 |
| 状态 | 运行中 |
Qwen API 端点
使用 OpenAI 或 Anthropic SDK 配合 RunAPI key 调用,无需额外 SDK。
| Endpoint | Protocol |
|---|---|
| /v1/chat/completions | OpenAI compatible |
四步从 model skill 到首次结果
选择模型
根据输出类型、质量要求和延迟目标选择模型与变体。
配置
设置 RunAPI key,并在代码工作区安装对应 model skill。
调用
按 skill 里的说明,把模型能力接入到你的应用里。
接收
按 task ID 轮询、在支持时使用流式,或处理 webhook 回调。
Qwen API 是什么?
阿里巴巴的 Qwen 模型是 Apache-2.0 超稀疏 MoE 大语言模型,原生 262K 上下文。qwen3-next-80b-a3b-instruct 在 LiveCodeBench 上匹配激活参数 7 倍于自身的模型,推理吞吐量提升 10 倍。通过 RunAPI 共用一个 API key、按量计费,可用 OpenAI Chat Completions、OpenAI Responses 与 Anthropic Messages 接口调用。这些是 Qwen 文本模型,与 Qwen 2 图像系列不同。
为什么用 RunAPI 调用 Qwen API
一把认证,覆盖所有提供方
一把 RunAPI key 解锁整个模型目录。无需为每家提供方单独建账户。
统一的定价与账单
USD 按次定价,按月结算。失败的生成不计费。
Schema 优先的 SDK
Typed schema 和接入说明已打包进 model skill,让实现从正确契约开始。
常见问题
应该从哪个变体开始?
选满足质量要求的最便宜变体。多数团队从 fast 起步,生产时升级到 pro。
有免费额度吗?
新账户每个模型都有免费调用额度,之后按次计费。
支持流式吗?
模型支持流式时,RunAPI 端到端流式。
失败怎么计费?
失败的生成不计费。
输出会缓存吗?
输出按任务 ID 存储在 R2 供回取。输入不缓存。
可以商用吗?
可以——所有变体默认含商用许可,除非模型许可明确限制;有例外会在变体页面注明。
速率限制?
Key 级限流随使用层级伸缩。当前限制见定价页。
在哪里报问题?
在公共 GitHub 仓库提 issue 或邮件联系 support。