Text · Z.ai

GLM API

Z.ai GLM API access via RunAPI — MIT-licensed MoE models with up to 200K context, leading open-weight coding benchmarks.

운영 중 · 7 variants · 최저 $0.010
runapi.ai
# Base URL
https://runapi.ai

# Endpoints
POST /v1/chat/completions
curl https://runapi.ai/v1/chat/completions \
  -H "Authorization: Bearer $RUNAPI_KEY" \
  -H "Content-Type: application/json" \
  -d '{
  "model": "glm-5.1",
  "messages": [
    {
      "role": "user",
      "content": "Read this multi-file repository, find the failing integration test, and propose a patch with an explanation of the root cause."
    }
  ]
}'
from openai import OpenAI

client = OpenAI(
    base_url="https://runapi.ai/v1",
    api_key="your-runapi-key"
)

response = client.chat.completions.create(
    model="glm-5.1",
    messages=[{"role": "user", "content": "Read this multi-file repository, find the failing integration test, and propose a patch with an explanation of the root cause."}]
)
import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://runapi.ai/v1",
  apiKey: "your-runapi-key"
});

const response = await client.chat.completions.create({
  model: "glm-5.1",
  messages: [{ role: "user", content: "Read this multi-file repository, find the failing integration test, and propose a patch with an explanation of the root cause." }]
});
https://runapi.ai /v1/chat/completions
개요

GLM is Z.ai's family of MIT-licensed Mixture-of-Experts language models. GLM-4.5 (355B total / 32B active, 128K context) introduced the open-weight MoE line with a flagship and a lighter Air tier. GLM-4.6 and 4.7 extend to 200K context with stronger code generation — 4.7 reaches 73.8% on SWE-bench. The GLM-5 series (744B / 40B active, 200K context) pushes further to 77.8% SWE-bench Verified, and GLM-5.1 holds the top open-weight score on SWE-bench Pro at 58.4%. All are available through RunAPI with one key and per-token billing.

  • 품질과 지연 시간 목표에 맞춘 모델 변형
  • 통합 API key
  • Model skill에 docs, schema, 설정 메모 포함
  • 실패한 생성은 과금되지 않습니다
변형

변형

Variant Billing From
glm-4.5 1K tokens $0.020 보기 →
glm-4.5-air 1K tokens $0.010 보기 →
glm-4.6 1K tokens $0.020 보기 →
glm-4.7 1K tokens $0.020 보기 →
glm-5 1K tokens $0.020 보기 →
glm-5-turbo 1K tokens $0.020 보기 →
glm-5.1 1K tokens $0.030 보기 →
API

GLM API 엔드포인트

RunAPI 키로 OpenAI 또는 Anthropic SDK를 사용하세요. 추가 SDK가 필요 없습니다.

Endpoint Protocol
/v1/chat/completions OpenAI compatible
작동 방식

이 model skill로 구현하는 방법

01

모델 선택

출력 유형, 품질 기준, 지연 시간 목표에 맞는 모델과 변형을 고릅니다.

02

한 번 인증

모든 지원 모델에 RunAPI key를 사용합니다.

03

skill 설치

기능을 구현하기 전에 코딩 워크스페이스에 model skill을 추가합니다.

04

결과 받기

task ID로 조회하거나 생성 완료 시 callback을 처리합니다.

컨텍스트

GLM의 위치

GLM models from Z.ai are MIT-licensed MoE LLMs spanning 128K–200K context. GLM-5.1 leads open-weight models on SWE-bench Pro. Through RunAPI they share a single API key with pay-as-you-go token billing, callable from the OpenAI Chat Completions, OpenAI Responses, and Anthropic Messages surfaces.

Provider
Z.ai
Modality
Text
RUNAPI를 선택하는 이유

RunAPI로 GLM을 쓰는 이유

하나의 API key

모델과 제공사를 넘나들며 같은 인증 정보를 사용합니다.

Skill-ready

model skill에 schema, 설정 메모, 가격 컨텍스트, 모델 ID가 포함됩니다.

예측 가능한 과금

호출 전에 사용량 기반 가격을 확인할 수 있습니다.

FAQ

자주 묻는 질문

이 모델은 어떻게 호출하나요?

model skill을 설치하고 RunAPI key와 함께 설정 메모를 따르세요.

실패한 생성도 비용이 드나요?

실패한 생성은 과금되지 않습니다

애플리케이션에서 호출할 수 있나요?

네. 코딩 워크스페이스에 model skill을 설치하고 모델 기능을 추가할 때 사용하세요.

지금 시작

GLM로 개발을 시작하세요.