Text · Alibaba

Qwen API

Alibaba Qwen API access via RunAPI — Apache-2.0 ultra-sparse MoE with 262K context, 80B total / 3.9B active.

운영 중 · 1 endpoints · 최저 $0.010
runapi.ai
# Base URL
https://runapi.ai

# Endpoints
POST /v1/chat/completions
curl https://runapi.ai/v1/chat/completions \
  -H "Authorization: Bearer $RUNAPI_KEY" \
  -H "Content-Type: application/json" \
  -d '{
  "model": "qwen3-next-80b-a3b-instruct",
  "messages": [
    {
      "role": "user",
      "content": "Analyze this large codebase, identify where request timeouts are handled, and add consistent retry logic across the services."
    }
  ]
}'
from openai import OpenAI

client = OpenAI(
    base_url="https://runapi.ai/v1",
    api_key="your-runapi-key"
)

response = client.chat.completions.create(
    model="qwen3-next-80b-a3b-instruct",
    messages=[{"role": "user", "content": "Analyze this large codebase, identify where request timeouts are handled, and add consistent retry logic across the services."}]
)
import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://runapi.ai/v1",
  apiKey: "your-runapi-key"
});

const response = await client.chat.completions.create({
  model: "qwen3-next-80b-a3b-instruct",
  messages: [{ role: "user", content: "Analyze this large codebase, identify where request timeouts are handled, and add consistent retry logic across the services." }]
});
https://runapi.ai /v1/chat/completions
개요

Qwen is Alibaba's Apache-2.0 family of language models. qwen3-next-80b-a3b-instruct uses a hybrid attention architecture (DeltaNet linear + GQA) with an ultra-sparse MoE — 80B total parameters, only ~3.9B active per token across 512 experts. It delivers 262K native context (extendable to 1M) and matches Qwen3-235B-A22B on coding and conversational benchmarks while using 7× fewer active parameters and 10× higher throughput. Available through RunAPI with one key and per-token billing.

  • 품질과 지연 시간 목표에 맞춘 모델 변형
  • 통합 API key
  • Model skill에 docs, schema, 설정 메모 포함
  • 실패한 생성은 과금되지 않습니다
요금

요금

실패한 생성은 과금되지 않습니다
Chat completion
Input $0.25 / 1M tokens
Output $1.00 / 1M tokens
스펙

스펙

모델 ID qwen3-next-80b-a3b-instruct
제공사 Alibaba
모달리티 text
작업 유형 synchronous
과금 1K tokens
Endpoint /v1/chat/completions
상업적 사용
상태 운영 중
API

Qwen API 엔드포인트

RunAPI 키로 OpenAI 또는 Anthropic SDK를 사용하세요. 추가 SDK가 필요 없습니다.

Endpoint Protocol
/v1/chat/completions OpenAI compatible
작동 방식

이 model skill로 구현하는 방법

01

모델 선택

출력 유형, 품질 기준, 지연 시간 목표에 맞는 모델과 변형을 고릅니다.

02

한 번 인증

모든 지원 모델에 RunAPI key를 사용합니다.

03

skill 설치

기능을 구현하기 전에 코딩 워크스페이스에 model skill을 추가합니다.

04

결과 받기

task ID로 조회하거나 생성 완료 시 callback을 처리합니다.

컨텍스트

Qwen의 위치

Qwen models from Alibaba are Apache-2.0 ultra-sparse MoE LLMs with 262K native context. qwen3-next-80b-a3b-instruct matches models with 7× more active parameters on LiveCodeBench while running at 10× throughput. Through RunAPI they share a single API key with pay-as-you-go token billing, callable from the OpenAI Chat Completions, OpenAI Responses, and Anthropic Messages surfaces. These are Qwen text models, distinct from the Qwen 2 image line.

Provider
Alibaba
Modality
Text
RUNAPI를 선택하는 이유

RunAPI로 Qwen을 쓰는 이유

하나의 API key

모델과 제공사를 넘나들며 같은 인증 정보를 사용합니다.

Skill-ready

model skill에 schema, 설정 메모, 가격 컨텍스트, 모델 ID가 포함됩니다.

예측 가능한 과금

호출 전에 사용량 기반 가격을 확인할 수 있습니다.

FAQ

자주 묻는 질문

이 모델은 어떻게 호출하나요?

model skill을 설치하고 RunAPI key와 함께 설정 메모를 따르세요.

실패한 생성도 비용이 드나요?

실패한 생성은 과금되지 않습니다

애플리케이션에서 호출할 수 있나요?

네. 코딩 워크스페이스에 model skill을 설치하고 모델 기능을 추가할 때 사용하세요.

지금 시작

Qwen로 개발을 시작하세요.

Endpoints
  • chat_completion
카테고리
제공사
Docs