Text · Alibaba

Qwen API

Alibaba Qwen API access via RunAPI — Apache-2.0 ultra-sparse MoE with 262K context, 80B total / 3.9B active.

Operacional · 1 endpoints · a partir de $0.010
runapi.ai
# Base URL
https://runapi.ai

# Endpoints
POST /v1/chat/completions
curl https://runapi.ai/v1/chat/completions \
  -H "Authorization: Bearer $RUNAPI_KEY" \
  -H "Content-Type: application/json" \
  -d '{
  "model": "qwen3-next-80b-a3b-instruct",
  "messages": [
    {
      "role": "user",
      "content": "Analyze this large codebase, identify where request timeouts are handled, and add consistent retry logic across the services."
    }
  ]
}'
from openai import OpenAI

client = OpenAI(
    base_url="https://runapi.ai/v1",
    api_key="your-runapi-key"
)

response = client.chat.completions.create(
    model="qwen3-next-80b-a3b-instruct",
    messages=[{"role": "user", "content": "Analyze this large codebase, identify where request timeouts are handled, and add consistent retry logic across the services."}]
)
import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://runapi.ai/v1",
  apiKey: "your-runapi-key"
});

const response = await client.chat.completions.create({
  model: "qwen3-next-80b-a3b-instruct",
  messages: [{ role: "user", content: "Analyze this large codebase, identify where request timeouts are handled, and add consistent retry logic across the services." }]
});
https://runapi.ai /v1/chat/completions
VISÃO GERAL

Qwen is Alibaba's Apache-2.0 family of language models. qwen3-next-80b-a3b-instruct uses a hybrid attention architecture (DeltaNet linear + GQA) with an ultra-sparse MoE — 80B total parameters, only ~3.9B active per token across 512 experts. It delivers 262K native context (extendable to 1M) and matches Qwen3-235B-A22B on coding and conversational benchmarks while using 7× fewer active parameters and 10× higher throughput. Available through RunAPI with one key and per-token billing.

  • Variantes para diferentes metas de qualidade e latência
  • API key unificada
  • O model skill inclui documentação, schemas e notas de setup
  • Gerações com falha não são cobradas
PREÇOS

PREÇOS

Gerações com falha não são cobradas
Chat completion
Input $0.25 / 1M tokens
Output $1.00 / 1M tokens
FICHA TÉCNICA

FICHA TÉCNICA

ID do modelo qwen3-next-80b-a3b-instruct
Provedor Alibaba
Modalidade text
Tipo de tarefa synchronous
Cobrança 1K tokens
Endpoint /v1/chat/completions
Comercial Sim
Status Operacional
API

Endpoints da API Qwen

Use o SDK OpenAI ou Anthropic com sua chave RunAPI. Nenhum SDK extra necessário.

Endpoint Protocol
/v1/chat/completions OpenAI compatible
COMO FUNCIONA

Como construir com este model skill

01

Escolha o modelo

Selecione o modelo e a variante que combinam com seu tipo de saída, meta de qualidade e latência.

02

Autentique uma vez

Use sua chave RunAPI para todos os modelos compatíveis.

03

Instale o skill

Adicione o model skill ao workspace de código antes de implementar a funcionalidade.

04

Receba a saída

Consulte por task ID ou trate o callback quando a geração terminar.

CONTEXTO

Onde Qwen se encaixa

Qwen models from Alibaba are Apache-2.0 ultra-sparse MoE LLMs with 262K native context. qwen3-next-80b-a3b-instruct matches models with 7× more active parameters on LiveCodeBench while running at 10× throughput. Through RunAPI they share a single API key with pay-as-you-go token billing, callable from the OpenAI Chat Completions, OpenAI Responses, and Anthropic Messages surfaces. These are Qwen text models, distinct from the Qwen 2 image line.

Provider
Alibaba
Modality
Text
POR QUE RUNAPI

Por que usar Qwen pela RunAPI

Uma API key

Use as mesmas credenciais entre modelos e provedores.

Pronto para skills

O model skill inclui schemas, notas de setup, contexto de preços e IDs de modelo.

Cobrança previsível

O preço por uso fica visível antes da chamada.

FAQ

Perguntas frequentes

Como chamo este modelo?

Instale o model skill e siga as notas de setup com sua chave RunAPI.

Gerações com falha custam dinheiro?

Gerações com falha não são cobradas

Posso chamar a partir da minha aplicação?

Sim. Instale o model skill no workspace de código e use durante a implementação da funcionalidade.

COMEÇAR

Comece a construir com Qwen.