---
title: "Qwen API — varianti, prezzi e model skill | RunAPI"
url: "https://runapi.ai/it/models/qwen.md"
canonical: "https://runapi.ai/it/models/qwen.md"
locale: "it"
model: "Qwen"
provider: "Alibaba"
modality: "text"
variant_count: 1
price_from_cents: 1
---

# Qwen API

Alibaba Qwen API access via RunAPI — Apache-2.0 ultra-sparse MoE with 262K context, 80B total / 3.9B active.

**Provider:** Alibaba
**Modality:** Text
**Catalog:** 1 endpoints

Qwen is Alibaba&#39;s Apache-2.0 family of language models. qwen3-next-80b-a3b-instruct uses a hybrid attention architecture (DeltaNet linear + GQA) with an ultra-sparse MoE — 80B total parameters, only ~3.9B active per token across 512 experts. It delivers 262K native context (extendable to 1M) and matches Qwen3-235B-A22B on coding and conversational benchmarks while using 7× fewer active parameters and 10× higher throughput. Available through RunAPI with one key and per-token billing.

## Variants

Single-SKU line. The SDK model ID is `qwen3-next-80b-a3b-instruct` and all usage details are documented here.

## Pricing

| Endpoint | Pricing | Billing |
|---|---|---|
| `chat_completion` | $0.010 | 1K tokens |

## Spec sheet

| Field | Value |
|---|---|
| Model ID | `qwen3-next-80b-a3b-instruct` |
| Provider | Alibaba |
| Modality | text |
| Task type | synchronous |
| Billing unit | 1K tokens |
| API endpoint | `/v1/chat/completions` |


## API endpoints

Base URL: `https://runapi.ai`

- `POST /v1/chat/completions`

Use the OpenAI or Anthropic SDK with your RunAPI API key. No extra SDK required.

## Context

Qwen models from Alibaba are Apache-2.0 ultra-sparse MoE LLMs with 262K native context. qwen3-next-80b-a3b-instruct matches models with 7× more active parameters on LiveCodeBench while running at 10× throughput. Through RunAPI they share a single API key with pay-as-you-go token billing, callable from the OpenAI Chat Completions, OpenAI Responses, and Anthropic Messages surfaces. These are Qwen text models, distinct from the Qwen 2 image line.

## FAQ

### Da quale variante dovrei iniziare?

Scegli la variante più economica che soddisfa il tuo livello di qualità. La maggior parte dei team inizia con la variante veloce e passa alla pro per la produzione.

### C’è un piano gratuito?

I nuovi account ricevono le prime chiamate gratuite su ogni modello. Dopo, paghi per chiamata.

### Trasmettete i risultati in streaming?

Dove lo streaming è disponibile, RunAPI trasmette end-to-end.

### Come vengono addebitati i fallimenti?

Le generazioni non riuscite non vengono addebitate.

### Gli output vengono memorizzati nella cache?

Gli output generati vengono salvati e recuperabili tramite ID del task. Gli input non vengono memorizzati nella cache.

### Posso usarlo a fini commerciali?

Sì — l’uso commerciale è incluso per ogni variante, salvo che una licenza del modello lo limiti esplicitamente; in tal caso è indicato nella pagina della variante.

### E i limiti di rate limit?

I rate limit per chiave scalano in base al tier di utilizzo. Vedi la pagina prezzi per i limiti aggiornati.

### Dove posso segnalare problemi?

Apri un issue nel repo GitHub pubblico oppure scrivi al supporto.

