Qwen API
Alibaba Qwen API access via RunAPI — Apache-2.0 ultra-sparse MoE with 262K context, 80B total / 3.9B active.
# Base URL
https://runapi.ai
# Endpoints
POST /v1/chat/completions
curl https://runapi.ai/v1/chat/completions \
-H "Authorization: Bearer $RUNAPI_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "qwen3-next-80b-a3b-instruct",
"messages": [
{
"role": "user",
"content": "Analyze this large codebase, identify where request timeouts are handled, and add consistent retry logic across the services."
}
]
}'
from openai import OpenAI
client = OpenAI(
base_url="https://runapi.ai/v1",
api_key="your-runapi-key"
)
response = client.chat.completions.create(
model="qwen3-next-80b-a3b-instruct",
messages=[{"role": "user", "content": "Analyze this large codebase, identify where request timeouts are handled, and add consistent retry logic across the services."}]
)
import OpenAI from "openai";
const client = new OpenAI({
baseURL: "https://runapi.ai/v1",
apiKey: "your-runapi-key"
});
const response = await client.chat.completions.create({
model: "qwen3-next-80b-a3b-instruct",
messages: [{ role: "user", content: "Analyze this large codebase, identify where request timeouts are handled, and add consistent retry logic across the services." }]
});
Qwen is Alibaba's Apache-2.0 family of language models. qwen3-next-80b-a3b-instruct uses a hybrid attention architecture (DeltaNet linear + GQA) with an ultra-sparse MoE — 80B total parameters, only ~3.9B active per token across 512 experts. It delivers 262K native context (extendable to 1M) and matches Qwen3-235B-A22B on coding and conversational benchmarks while using 7× fewer active parameters and 10× higher throughput. Available through RunAPI with one key and per-token billing.
- Variantes para diferentes metas de qualidade e latência
- API key unificada
- O model skill inclui documentação, schemas e notas de setup
- Gerações com falha não são cobradas
PREÇOS
FICHA TÉCNICA
| ID do modelo | qwen3-next-80b-a3b-instruct |
| Provedor | Alibaba |
| Modalidade | text |
| Tipo de tarefa | synchronous |
| Cobrança | 1K tokens |
| Endpoint | /v1/chat/completions |
| Comercial | Sim |
| Status | Operacional |
Endpoints da API Qwen
Use o SDK OpenAI ou Anthropic com sua chave RunAPI. Nenhum SDK extra necessário.
| Endpoint | Protocol |
|---|---|
| /v1/chat/completions | OpenAI compatible |
Como construir com este model skill
Escolha o modelo
Selecione o modelo e a variante que combinam com seu tipo de saída, meta de qualidade e latência.
Autentique uma vez
Use sua chave RunAPI para todos os modelos compatíveis.
Instale o skill
Adicione o model skill ao workspace de código antes de implementar a funcionalidade.
Receba a saída
Consulte por task ID ou trate o callback quando a geração terminar.
Onde Qwen se encaixa
Qwen models from Alibaba are Apache-2.0 ultra-sparse MoE LLMs with 262K native context. qwen3-next-80b-a3b-instruct matches models with 7× more active parameters on LiveCodeBench while running at 10× throughput. Through RunAPI they share a single API key with pay-as-you-go token billing, callable from the OpenAI Chat Completions, OpenAI Responses, and Anthropic Messages surfaces. These are Qwen text models, distinct from the Qwen 2 image line.
Por que usar Qwen pela RunAPI
Uma API key
Use as mesmas credenciais entre modelos e provedores.
Pronto para skills
O model skill inclui schemas, notas de setup, contexto de preços e IDs de modelo.
Cobrança previsível
O preço por uso fica visível antes da chamada.
Perguntas frequentes
Como chamo este modelo?
Instale o model skill e siga as notas de setup com sua chave RunAPI.
Gerações com falha custam dinheiro?
Gerações com falha não são cobradas
Posso chamar a partir da minha aplicação?
Sim. Instale o model skill no workspace de código e use durante a implementação da funcionalidade.
Modelos similares a Qwen
Comece a construir com Qwen.
- chat_completion