---
title: "Qwen API — varianten, prijzen en modelskill | RunAPI"
url: "https://runapi.ai/nl/models/qwen.md"
canonical: "https://runapi.ai/nl/models/qwen.md"
locale: "nl"
model: "Qwen"
provider: "Alibaba"
modality: "text"
variant_count: 1
price_from_cents: 1
---

# Qwen API

Alibaba Qwen API access via RunAPI — Apache-2.0 ultra-sparse MoE with 262K context, 80B total / 3.9B active.

**Provider:** Alibaba
**Modality:** Text
**Catalog:** 1 endpoints

Qwen is Alibaba&#39;s Apache-2.0 family of language models. qwen3-next-80b-a3b-instruct uses a hybrid attention architecture (DeltaNet linear + GQA) with an ultra-sparse MoE — 80B total parameters, only ~3.9B active per token across 512 experts. It delivers 262K native context (extendable to 1M) and matches Qwen3-235B-A22B on coding and conversational benchmarks while using 7× fewer active parameters and 10× higher throughput. Available through RunAPI with one key and per-token billing.

## Variants

Single-SKU line. The SDK model ID is `qwen3-next-80b-a3b-instruct` and all usage details are documented here.

## Pricing

| Endpoint | Pricing | Billing |
|---|---|---|
| `chat_completion` | $0.010 | 1K tokens |

## Spec sheet

| Field | Value |
|---|---|
| Model ID | `qwen3-next-80b-a3b-instruct` |
| Provider | Alibaba |
| Modality | text |
| Task type | synchronous |
| Billing unit | 1K tokens |
| API endpoint | `/v1/chat/completions` |


## API endpoints

Base URL: `https://runapi.ai`

- `POST /v1/chat/completions`

Use the OpenAI or Anthropic SDK with your RunAPI API key. No extra SDK required.

## Context

Qwen models from Alibaba are Apache-2.0 ultra-sparse MoE LLMs with 262K native context. qwen3-next-80b-a3b-instruct matches models with 7× more active parameters on LiveCodeBench while running at 10× throughput. Through RunAPI they share a single API key with pay-as-you-go token billing, callable from the OpenAI Chat Completions, OpenAI Responses, and Anthropic Messages surfaces. These are Qwen text models, distinct from the Qwen 2 image line.

## FAQ

### Met welke variant moet ik beginnen?

Kies de goedkoopste variant die aan je kwaliteitsnorm voldoet. De meeste teams beginnen met de snelle variant en stappen over op pro voor productie.

### Is er een gratis tier?

Nieuwe accounts krijgen de eerste calls gratis op elk model. Daarna betaal je per call.

### Streamen jullie resultaten?

Waar streaming beschikbaar is, streamt RunAPI end-to-end.

### Hoe worden mislukkingen gefactureerd?

Mislukte generations worden niet in rekening gebracht.

### Worden outputs gecachet?

Gegenereerde outputs worden opgeslagen en zijn op te vragen via task-ID. Inputs worden niet gecachet.

### Mag ik het commercieel gebruiken?

Ja — commercieel gebruik is inbegrepen voor elke variant, tenzij een modellicentie het expliciet beperkt. Dat staat aangegeven op de variantpagina.

### Hoe zit het met rate limits?

Rate limits per key schalen mee met je usage tier. Zie de prijzenpagina voor de actuele limieten.

### Waar kan ik problemen melden?

Open een issue in de publieke GitHub-repo of mail support.

