Z.ai
Z.ai's GLM — MIT-licensed MoE LLMs from 128K to 200K context, top open-weight SWE-bench scores, via one RunAPI key.
Z.ai builds the GLM family of MIT-licensed Mixture-of-Experts language models for coding and agentic workflows. The line spans GLM-4.5 (355B / 32B active, 128K context) through GLM-5.1 (754B / 40B active, 200K context), which holds the top open-weight SWE-bench Pro score at 58.4%. All are available through RunAPI from the OpenAI and Anthropic SDKs with per-token billing.
- Una sola API key condivisa tra i provider
- I model skill portano documentazione e schema nel tuo workspace
- Fatturazione per chiamata, senza impegno
- Le generazioni non riuscite non vengono addebitate
Cosa spicca
Tutti i modelli di Z.ai
Installa un model skill Z.ai.
Scegli un modello e aggiungi il suo skill così il tuo editor ha documentazione, schema, note prezzi e passaggi di setup.
# Base URL
https://runapi.ai
# Endpoints
POST /v1/chat/completions
curl https://runapi.ai/v1/chat/completions \
-H "Authorization: Bearer $RUNAPI_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "glm-5.1",
"messages": [
{
"role": "user",
"content": "Read this multi-file repository, find the failing integration test, and propose a patch with an explanation of the root cause."
}
]
}'
from openai import OpenAI
client = OpenAI(
base_url="https://runapi.ai/v1",
api_key="your-runapi-key"
)
response = client.chat.completions.create(
model="glm-5.1",
messages=[{"role": "user", "content": "Read this multi-file repository, find the failing integration test, and propose a patch with an explanation of the root cause."}]
)
import OpenAI from "openai";
const client = new OpenAI({
baseURL: "https://runapi.ai/v1",
apiKey: "your-runapi-key"
});
const response = await client.chat.completions.create({
model: "glm-5.1",
messages: [{ role: "user", content: "Read this multi-file repository, find the failing integration test, and propose a patch with an explanation of the root cause." }]
});
Tutte le varianti di Z.ai
| Model | Variant | Billing | From | |
|---|---|---|---|---|
|
GLM
|
glm-4.5 | 1K tokens | $0.020 | Visualizza → |
| glm-4.5-air | 1K tokens | $0.010 | Visualizza → | |
| glm-4.6 | 1K tokens | $0.020 | Visualizza → | |
| glm-4.7 | 1K tokens | $0.020 | Visualizza → | |
| glm-5 | 1K tokens | $0.020 | Visualizza → | |
| glm-5-turbo | 1K tokens | $0.020 | Visualizza → | |
| glm-5.1 | 1K tokens | $0.030 | Visualizza → |
Domande frequenti su Z.ai
È un'integrazione ufficiale di Z.ai?
RunAPI espone una superficie API gestita con prezzi, capacità e comportamento degli errori trasparenti.
Mi serve un account Z.ai?
No — la tua chiave RunAPI è sufficiente per l’accesso gestito.
Qual è l’overhead di latenza del proxying?
In genere sotto i 20 ms. RunAPI mantiene il layer proxy vicino alle regioni di esecuzione del modello.
Le immagini / i video vengono cachati?
Gli output generati vengono salvati e possono essere recuperati tramite task ID. Gli input non vengono cachati.
Posso usare una mia chiave?
Al momento no — le chiamate usano l’accesso gestito da RunAPI.