Qwen API
Alibaba Qwen API access via RunAPI — Apache-2.0 ultra-sparse MoE with 262K context, 80B total / 3.9B active.
# Base URL
https://runapi.ai
# Endpoints
POST /v1/chat/completions
curl https://runapi.ai/v1/chat/completions \
-H "Authorization: Bearer $RUNAPI_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "qwen3-next-80b-a3b-instruct",
"messages": [
{
"role": "user",
"content": "Analyze this large codebase, identify where request timeouts are handled, and add consistent retry logic across the services."
}
]
}'
from openai import OpenAI
client = OpenAI(
base_url="https://runapi.ai/v1",
api_key="your-runapi-key"
)
response = client.chat.completions.create(
model="qwen3-next-80b-a3b-instruct",
messages=[{"role": "user", "content": "Analyze this large codebase, identify where request timeouts are handled, and add consistent retry logic across the services."}]
)
import OpenAI from "openai";
const client = new OpenAI({
baseURL: "https://runapi.ai/v1",
apiKey: "your-runapi-key"
});
const response = await client.chat.completions.create({
model: "qwen3-next-80b-a3b-instruct",
messages: [{ role: "user", content: "Analyze this large codebase, identify where request timeouts are handled, and add consistent retry logic across the services." }]
});
Qwen is Alibaba's Apache-2.0 family of language models. qwen3-next-80b-a3b-instruct uses a hybrid attention architecture (DeltaNet linear + GQA) with an ultra-sparse MoE — 80B total parameters, only ~3.9B active per token across 512 experts. It delivers 262K native context (extendable to 1M) and matches Qwen3-235B-A22B on coding and conversational benchmarks while using 7× fewer active parameters and 10× higher throughput. Available through RunAPI with one key and per-token billing.
- 品質とレイテンシ目標に合わせたモデルバリアント
- 統合 API key
- Model skill に docs、schema、セットアップメモを同梱
- 失敗した生成は課金されません
料金
仕様
| モデル ID | qwen3-next-80b-a3b-instruct |
| プロバイダー | Alibaba |
| モダリティ | text |
| タスク種別 | synchronous |
| 課金 | 1K tokens |
| Endpoint | /v1/chat/completions |
| 商用利用 | はい |
| ステータス | 稼働中 |
Qwen API エンドポイント
OpenAI または Anthropic SDK を RunAPI キーで利用できます。追加 SDK は不要です。
| Endpoint | Protocol |
|---|---|
| /v1/chat/completions | OpenAI compatible |
この model skill で構築する方法
モデルを選ぶ
出力タイプ、品質基準、レイテンシ目標に合うモデルとバリアントを選びます。
一度だけ認証
対応するすべてのモデルに RunAPI key を使います。
skill をインストール
機能実装の前に model skill をコード作業環境へ追加します。
出力を受け取る
task ID でポーリングするか、生成完了時の callback を処理します。
Qwen の位置づけ
Qwen models from Alibaba are Apache-2.0 ultra-sparse MoE LLMs with 262K native context. qwen3-next-80b-a3b-instruct matches models with 7× more active parameters on LiveCodeBench while running at 10× throughput. Through RunAPI they share a single API key with pay-as-you-go token billing, callable from the OpenAI Chat Completions, OpenAI Responses, and Anthropic Messages surfaces. These are Qwen text models, distinct from the Qwen 2 image line.
RunAPI 経由で Qwen を使う理由
1つの API key
モデルやプロバイダーをまたいで同じ認証情報を使えます。
Skill-ready
model skill に schema、セットアップメモ、料金コンテキスト、モデル ID が含まれます。
予測しやすい請求
呼び出し前に従量料金を確認できます。
よくある質問
このモデルはどう呼び出しますか?
model skill をインストールし、RunAPI key とセットアップメモに従ってください。
失敗した生成は課金されますか?
失敗した生成は課金されません
アプリケーションから呼び出せますか?
はい。コード作業環境に model skill をインストールし、モデル機能を追加するときに利用してください。
Qwen に近いモデル
Qwen で構築を開始。
- chat_completion