Qwen API
Alibaba Qwen API access via RunAPI — Apache-2.0 ultra-sparse MoE with 262K context, 80B total / 3.9B active.
# Base URL
https://runapi.ai
# Endpoints
POST /v1/chat/completions
curl https://runapi.ai/v1/chat/completions \
-H "Authorization: Bearer $RUNAPI_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "qwen3-next-80b-a3b-instruct",
"messages": [
{
"role": "user",
"content": "Analyze this large codebase, identify where request timeouts are handled, and add consistent retry logic across the services."
}
]
}'
from openai import OpenAI
client = OpenAI(
base_url="https://runapi.ai/v1",
api_key="your-runapi-key"
)
response = client.chat.completions.create(
model="qwen3-next-80b-a3b-instruct",
messages=[{"role": "user", "content": "Analyze this large codebase, identify where request timeouts are handled, and add consistent retry logic across the services."}]
)
import OpenAI from "openai";
const client = new OpenAI({
baseURL: "https://runapi.ai/v1",
apiKey: "your-runapi-key"
});
const response = await client.chat.completions.create({
model: "qwen3-next-80b-a3b-instruct",
messages: [{ role: "user", content: "Analyze this large codebase, identify where request timeouts are handled, and add consistent retry logic across the services." }]
});
Qwen is Alibaba's Apache-2.0 family of language models. qwen3-next-80b-a3b-instruct uses a hybrid attention architecture (DeltaNet linear + GQA) with an ultra-sparse MoE — 80B total parameters, only ~3.9B active per token across 512 experts. It delivers 262K native context (extendable to 1M) and matches Qwen3-235B-A22B on coding and conversational benchmarks while using 7× fewer active parameters and 10× higher throughput. Available through RunAPI with one key and per-token billing.
- 품질과 지연 시간 목표에 맞춘 모델 변형
- 통합 API key
- Model skill에 docs, schema, 설정 메모 포함
- 실패한 생성은 과금되지 않습니다
요금
스펙
| 모델 ID | qwen3-next-80b-a3b-instruct |
| 제공사 | Alibaba |
| 모달리티 | text |
| 작업 유형 | synchronous |
| 과금 | 1K tokens |
| Endpoint | /v1/chat/completions |
| 상업적 사용 | 예 |
| 상태 | 운영 중 |
Qwen API 엔드포인트
RunAPI 키로 OpenAI 또는 Anthropic SDK를 사용하세요. 추가 SDK가 필요 없습니다.
| Endpoint | Protocol |
|---|---|
| /v1/chat/completions | OpenAI compatible |
이 model skill로 구현하는 방법
모델 선택
출력 유형, 품질 기준, 지연 시간 목표에 맞는 모델과 변형을 고릅니다.
한 번 인증
모든 지원 모델에 RunAPI key를 사용합니다.
skill 설치
기능을 구현하기 전에 코딩 워크스페이스에 model skill을 추가합니다.
결과 받기
task ID로 조회하거나 생성 완료 시 callback을 처리합니다.
Qwen의 위치
Qwen models from Alibaba are Apache-2.0 ultra-sparse MoE LLMs with 262K native context. qwen3-next-80b-a3b-instruct matches models with 7× more active parameters on LiveCodeBench while running at 10× throughput. Through RunAPI they share a single API key with pay-as-you-go token billing, callable from the OpenAI Chat Completions, OpenAI Responses, and Anthropic Messages surfaces. These are Qwen text models, distinct from the Qwen 2 image line.
RunAPI로 Qwen을 쓰는 이유
하나의 API key
모델과 제공사를 넘나들며 같은 인증 정보를 사용합니다.
Skill-ready
model skill에 schema, 설정 메모, 가격 컨텍스트, 모델 ID가 포함됩니다.
예측 가능한 과금
호출 전에 사용량 기반 가격을 확인할 수 있습니다.
자주 묻는 질문
이 모델은 어떻게 호출하나요?
model skill을 설치하고 RunAPI key와 함께 설정 메모를 따르세요.
실패한 생성도 비용이 드나요?
실패한 생성은 과금되지 않습니다
애플리케이션에서 호출할 수 있나요?
네. 코딩 워크스페이스에 model skill을 설치하고 모델 기능을 추가할 때 사용하세요.