---
title: "Qwen API — warianty, cennik i model skill | RunAPI"
url: "https://runapi.ai/pl/models/qwen.md"
canonical: "https://runapi.ai/pl/models/qwen.md"
locale: "pl"
model: "Qwen"
provider: "Alibaba"
modality: "text"
variant_count: 1
price_from_cents: 1
---

# Qwen API

Alibaba Qwen API access via RunAPI — Apache-2.0 ultra-sparse MoE with 262K context, 80B total / 3.9B active.

**Provider:** Alibaba
**Modality:** Text
**Catalog:** 1 endpoints

Qwen is Alibaba&#39;s Apache-2.0 family of language models. qwen3-next-80b-a3b-instruct uses a hybrid attention architecture (DeltaNet linear + GQA) with an ultra-sparse MoE — 80B total parameters, only ~3.9B active per token across 512 experts. It delivers 262K native context (extendable to 1M) and matches Qwen3-235B-A22B on coding and conversational benchmarks while using 7× fewer active parameters and 10× higher throughput. Available through RunAPI with one key and per-token billing.

## Variants

Single-SKU line. The SDK model ID is `qwen3-next-80b-a3b-instruct` and all usage details are documented here.

## Pricing

| Endpoint | Pricing | Billing |
|---|---|---|
| `chat_completion` | $0.010 | 1K tokens |

## Spec sheet

| Field | Value |
|---|---|
| Model ID | `qwen3-next-80b-a3b-instruct` |
| Provider | Alibaba |
| Modality | text |
| Task type | synchronous |
| Billing unit | 1K tokens |
| API endpoint | `/v1/chat/completions` |


## API endpoints

Base URL: `https://runapi.ai`

- `POST /v1/chat/completions`

Use the OpenAI or Anthropic SDK with your RunAPI API key. No extra SDK required.

## Context

Qwen models from Alibaba are Apache-2.0 ultra-sparse MoE LLMs with 262K native context. qwen3-next-80b-a3b-instruct matches models with 7× more active parameters on LiveCodeBench while running at 10× throughput. Through RunAPI they share a single API key with pay-as-you-go token billing, callable from the OpenAI Chat Completions, OpenAI Responses, and Anthropic Messages surfaces. These are Qwen text models, distinct from the Qwen 2 image line.

## FAQ

### Od jakiego wariantu powinienem zacząć?

Wybierz najtańszy wariant, który spełnia Twoje wymagania jakościowe. Większość zespołów zaczyna od szybkiego wariantu, a do produkcji przechodzi na pro.

### Czy jest darmowy plan?

Nowe konta otrzymują darmowe pierwsze wywołania dla każdego modelu. Później płacisz za każde wywołanie.

### Czy streamujecie wyniki?

Tam, gdzie streaming jest dostępny, RunAPI streamuje end-to-end.

### Jak są rozliczane nieudane próby?

Nieudane generacje nie są obciążane opłatą.

### Czy wyniki są buforowane?

Wygenerowane wyniki są zapisywane i można je pobrać po ID zadania. Dane wejściowe nie są buforowane.

### Czy mogę używać komercyjnie?

Tak — użycie komercyjne jest dostępne dla każdego wariantu, chyba że licencja modelu wyraźnie to ogranicza; informacja taka jest podana na stronie wariantu.

### A co z limitami zapytań?

Limity na klucz rosną wraz z poziomem wykorzystania. Aktualne limity znajdziesz na stronie cennika.

### Gdzie mogę zgłosić problem?

Otwórz zgłoszenie w publicznym repozytorium GitHub albo napisz do supportu.

