Z.ai
Z.ai's GLM — MIT-licensed MoE LLMs from 128K to 200K context, top open-weight SWE-bench scores, via one RunAPI key.
Z.ai builds the GLM family of MIT-licensed Mixture-of-Experts language models for coding and agentic workflows. The line spans GLM-4.5 (355B / 32B active, 128K context) through GLM-5.1 (754B / 40B active, 200K context), which holds the top open-weight SWE-bench Pro score at 58.4%. All are available through RunAPI from the OpenAI and Anthropic SDKs with per-token billing.
- Eén API-key gedeeld tussen providers
- Modelskills brengen docs en schema's naar je workspace
- Betalen per call, zonder verplichting
- Mislukte generaties worden niet in rekening gebracht
Wat opvalt
Alle modellen van Z.ai
Installeer een Z.ai modelskill.
Kies een model en voeg de skill toe zodat je codeertool docs, schema's, prijsnotities en setupstappen heeft.
# Base URL
https://runapi.ai
# Endpoints
POST /v1/chat/completions
curl https://runapi.ai/v1/chat/completions \
-H "Authorization: Bearer $RUNAPI_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "glm-5.1",
"messages": [
{
"role": "user",
"content": "Read this multi-file repository, find the failing integration test, and propose a patch with an explanation of the root cause."
}
]
}'
from openai import OpenAI
client = OpenAI(
base_url="https://runapi.ai/v1",
api_key="your-runapi-key"
)
response = client.chat.completions.create(
model="glm-5.1",
messages=[{"role": "user", "content": "Read this multi-file repository, find the failing integration test, and propose a patch with an explanation of the root cause."}]
)
import OpenAI from "openai";
const client = new OpenAI({
baseURL: "https://runapi.ai/v1",
apiKey: "your-runapi-key"
});
const response = await client.chat.completions.create({
model: "glm-5.1",
messages: [{ role: "user", content: "Read this multi-file repository, find the failing integration test, and propose a patch with an explanation of the root cause." }]
});
Alle varianten van Z.ai
| Model | Variant | Billing | From | |
|---|---|---|---|---|
|
GLM
|
glm-4.5 | 1K tokens | $0.020 | Bekijken → |
| glm-4.5-air | 1K tokens | $0.010 | Bekijken → | |
| glm-4.6 | 1K tokens | $0.020 | Bekijken → | |
| glm-4.7 | 1K tokens | $0.020 | Bekijken → | |
| glm-5 | 1K tokens | $0.020 | Bekijken → | |
| glm-5-turbo | 1K tokens | $0.020 | Bekijken → | |
| glm-5.1 | 1K tokens | $0.030 | Bekijken → |
Veelgestelde vragen over Z.ai
Is dit een officiële Z.ai-integratie?
RunAPI biedt een beheerde API-laag met transparante prijzen, mogelijkheden en foutgedrag.
Heb ik een Z.ai-account nodig?
Nee — je RunAPI-sleutel is genoeg voor beheerde toegang.
Wat is de extra latency door proxying?
Meestal onder de 20 ms. RunAPI houdt de proxylaag dicht bij de regio’s waar het model draait.
Worden afbeeldingen / video’s gecached?
Genereerde output wordt opgeslagen en is op te halen via task ID. Invoer wordt niet gecached.
Kan ik mijn eigen key gebruiken?
Nog niet — calls gebruiken RunAPI-beheerde toegang.