GLM API
Z.ai GLM API access via RunAPI — MIT-licensed MoE models with up to 200K context, leading open-weight coding benchmarks.
# Base URL
https://runapi.ai
# Endpoints
POST /v1/chat/completions
curl https://runapi.ai/v1/chat/completions \
-H "Authorization: Bearer $RUNAPI_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "glm-5.1",
"messages": [
{
"role": "user",
"content": "Read this multi-file repository, find the failing integration test, and propose a patch with an explanation of the root cause."
}
]
}'
from openai import OpenAI
client = OpenAI(
base_url="https://runapi.ai/v1",
api_key="your-runapi-key"
)
response = client.chat.completions.create(
model="glm-5.1",
messages=[{"role": "user", "content": "Read this multi-file repository, find the failing integration test, and propose a patch with an explanation of the root cause."}]
)
import OpenAI from "openai";
const client = new OpenAI({
baseURL: "https://runapi.ai/v1",
apiKey: "your-runapi-key"
});
const response = await client.chat.completions.create({
model: "glm-5.1",
messages: [{ role: "user", content: "Read this multi-file repository, find the failing integration test, and propose a patch with an explanation of the root cause." }]
});
GLM is Z.ai's family of MIT-licensed Mixture-of-Experts language models. GLM-4.5 (355B total / 32B active, 128K context) introduced the open-weight MoE line with a flagship and a lighter Air tier. GLM-4.6 and 4.7 extend to 200K context with stronger code generation — 4.7 reaches 73.8% on SWE-bench. The GLM-5 series (744B / 40B active, 200K context) pushes further to 77.8% SWE-bench Verified, and GLM-5.1 holds the top open-weight score on SWE-bench Pro at 58.4%. All are available through RunAPI with one key and per-token billing.
- 품질과 지연 시간 목표에 맞춘 모델 변형
- 통합 API key
- Model skill에 docs, schema, 설정 메모 포함
- 실패한 생성은 과금되지 않습니다
변형
GLM API 엔드포인트
RunAPI 키로 OpenAI 또는 Anthropic SDK를 사용하세요. 추가 SDK가 필요 없습니다.
| Endpoint | Protocol |
|---|---|
| /v1/chat/completions | OpenAI compatible |
이 model skill로 구현하는 방법
모델 선택
출력 유형, 품질 기준, 지연 시간 목표에 맞는 모델과 변형을 고릅니다.
한 번 인증
모든 지원 모델에 RunAPI key를 사용합니다.
skill 설치
기능을 구현하기 전에 코딩 워크스페이스에 model skill을 추가합니다.
결과 받기
task ID로 조회하거나 생성 완료 시 callback을 처리합니다.
GLM의 위치
GLM models from Z.ai are MIT-licensed MoE LLMs spanning 128K–200K context. GLM-5.1 leads open-weight models on SWE-bench Pro. Through RunAPI they share a single API key with pay-as-you-go token billing, callable from the OpenAI Chat Completions, OpenAI Responses, and Anthropic Messages surfaces.
RunAPI로 GLM을 쓰는 이유
하나의 API key
모델과 제공사를 넘나들며 같은 인증 정보를 사용합니다.
Skill-ready
model skill에 schema, 설정 메모, 가격 컨텍스트, 모델 ID가 포함됩니다.
예측 가능한 과금
호출 전에 사용량 기반 가격을 확인할 수 있습니다.
자주 묻는 질문
이 모델은 어떻게 호출하나요?
model skill을 설치하고 RunAPI key와 함께 설정 메모를 따르세요.
실패한 생성도 비용이 드나요?
실패한 생성은 과금되지 않습니다
애플리케이션에서 호출할 수 있나요?
네. 코딩 워크스페이스에 model skill을 설치하고 모델 기능을 추가할 때 사용하세요.