Text · Alibaba

Qwen API

阿里巴巴 Qwen API 调用 —— Apache-2.0 超稀疏 MoE，262K 上下文，80B 总参 / 3.9B 激活。

运行中 · 1 endpoints · 起价 $0.010

runapi.ai

# Base URL
https://runapi.ai

# Endpoints
POST /v1/chat/completions

curl https://runapi.ai/v1/chat/completions \
  -H "Authorization: Bearer $RUNAPI_KEY" \
  -H "Content-Type: application/json" \
  -d '{
  "model": "qwen3-next-80b-a3b-instruct",
  "messages": [
    {
      "role": "user",
      "content": "分析这个大型代码库，找出处理请求超时的位置，并在各服务间补充一致的重试逻辑。"
    }
  ]
}'

from openai import OpenAI

client = OpenAI(
    base_url="https://runapi.ai/v1",
    api_key="your-runapi-key"
)

response = client.chat.completions.create(
    model="qwen3-next-80b-a3b-instruct",
    messages=[{"role": "user", "content": "分析这个大型代码库，找出处理请求超时的位置，并在各服务间补充一致的重试逻辑。"}]
)

import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://runapi.ai/v1",
  apiKey: "your-runapi-key"
});

const response = await client.chat.completions.create({
  model: "qwen3-next-80b-a3b-instruct",
  messages: [{ role: "user", content: "分析这个大型代码库，找出处理请求超时的位置，并在各服务间补充一致的重试逻辑。" }]
});

https://runapi.ai /v1/chat/completions

概览

Qwen 是阿里巴巴的 Apache-2.0 语言模型系列。qwen3-next-80b-a3b-instruct 采用混合注意力架构（DeltaNet 线性 + GQA），搭配超稀疏 MoE——80B 总参、每 token 仅 ~3.9B 激活、512 专家。原生 262K 上下文（可扩展至 1M），编码与对话基准匹配 Qwen3-235B-A22B，激活参数仅为后者 1/7、推理吞吐量提升 10 倍。可通过 RunAPI 用一个密钥按 token 计费调用。

多变体覆盖不同速度/质量层级
Model skill 包含文档、schema 和接入说明
适合面向应用的编码工作流
失败的生成不计费

定价

失败的生成不计费

Chat completion

Input $0.25 / 1M tokens

Output $1.00 / 1M tokens

规格

技术细节

模型 ID	qwen3-next-80b-a3b-instruct
提供方	Alibaba
模态	text
任务类型	synchronous
计费单位	1K tokens
API 端点	/v1/chat/completions
商用许可	允许商用
状态	运行中

API

Qwen API 端点

使用 OpenAI 或 Anthropic SDK 配合 RunAPI key 调用，无需额外 SDK。

Endpoint	Protocol
/v1/chat/completions	OpenAI compatible

工作流程

四步从 model skill 到首次结果

选择模型

根据输出类型、质量要求和延迟目标选择模型与变体。

配置

设置 RunAPI key，并在代码工作区安装对应 model skill。

调用

按 skill 里的说明，把模型能力接入到你的应用里。

接收

按 task ID 轮询、在支持时使用流式，或处理 webhook 回调。

背景

Qwen API 是什么？

阿里巴巴的 Qwen 模型是 Apache-2.0 超稀疏 MoE 大语言模型，原生 262K 上下文。qwen3-next-80b-a3b-instruct 在 LiveCodeBench 上匹配激活参数 7 倍于自身的模型，推理吞吐量提升 10 倍。通过 RunAPI 共用一个 API key、按量计费，可用 OpenAI Chat Completions、OpenAI Responses 与 Anthropic Messages 接口调用。这些是 Qwen 文本模型，与 Qwen 2 图像系列不同。

Provider

Alibaba

Modality

Text

为何选择 RunAPI