---
title: "Qwen API — 全部变体、定价与 Model Skill | RunAPI"
url: "https://runapi.ai/zh-CN/models/qwen.md"
canonical: "https://runapi.ai/zh-CN/models/qwen.md"
locale: "zh-CN"
model: "Qwen"
provider: "Alibaba"
modality: "text"
variant_count: 1
price_from_cents: 1
---

# Qwen API

阿里巴巴 Qwen API 调用 —— Apache-2.0 超稀疏 MoE，262K 上下文，80B 总参 / 3.9B 激活。

**Provider:** Alibaba
**Modality:** Text
**Catalog:** 1 endpoints

Qwen 是阿里巴巴的 Apache-2.0 语言模型系列。qwen3-next-80b-a3b-instruct 采用混合注意力架构（DeltaNet 线性 + GQA），搭配超稀疏 MoE——80B 总参、每 token 仅 ~3.9B 激活、512 专家。原生 262K 上下文（可扩展至 1M），编码与对话基准匹配 Qwen3-235B-A22B，激活参数仅为后者 1/7、推理吞吐量提升 10 倍。可通过 RunAPI 用一个密钥按 token 计费调用。

## Variants

Single-SKU line. The SDK model ID is `qwen3-next-80b-a3b-instruct` and all usage details are documented here.

## Pricing

| Endpoint | Pricing | Billing |
|---|---|---|
| `chat_completion` | $0.010 | 1K tokens |

## Spec sheet

| Field | Value |
|---|---|
| Model ID | `qwen3-next-80b-a3b-instruct` |
| Provider | Alibaba |
| Modality | text |
| Task type | synchronous |
| Billing unit | 1K tokens |
| API endpoint | `/v1/chat/completions` |


## API endpoints

Base URL: `https://runapi.ai`

- `POST /v1/chat/completions`

Use the OpenAI or Anthropic SDK with your RunAPI API key. No extra SDK required.

## Context

阿里巴巴的 Qwen 模型是 Apache-2.0 超稀疏 MoE 大语言模型，原生 262K 上下文。qwen3-next-80b-a3b-instruct 在 LiveCodeBench 上匹配激活参数 7 倍于自身的模型，推理吞吐量提升 10 倍。通过 RunAPI 共用一个 API key、按量计费，可用 OpenAI Chat Completions、OpenAI Responses 与 Anthropic Messages 接口调用。这些是 Qwen 文本模型，与 Qwen 2 图像系列不同。

## FAQ

### 应该从哪个变体开始？

选满足质量要求的最便宜变体。多数团队从 fast 起步，生产时升级到 pro。

### 有免费额度吗？

新账户每个模型都有免费调用额度，之后按次计费。

### 支持流式吗？

模型支持流式时，RunAPI 端到端流式。

### 失败怎么计费？

失败的生成不计费。

### 输出会缓存吗？

输出按任务 ID 存储在 R2 供回取。输入不缓存。

### 可以商用吗？

可以——所有变体默认含商用许可，除非模型许可明确限制；有例外会在变体页面注明。

### 速率限制？

Key 级限流随使用层级伸缩。当前限制见定价页。

### 在哪里报问题？

在公共 GitHub 仓库提 issue 或邮件联系 support。