GLM glm-4.5-air API
Een modelvariant beschikbaar via de uniforme AI-API van RunAPI.
# Base URL
https://runapi.ai
# Endpoints
POST /v1/chat/completions
curl https://runapi.ai/v1/chat/completions \
-H "Authorization: Bearer $RUNAPI_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "glm-4.5-air",
"messages": [
{
"role": "user",
"content": "Read this multi-file repository, find the failing integration test, and propose a patch with an explanation of the root cause."
}
]
}'
from openai import OpenAI
client = OpenAI(
base_url="https://runapi.ai/v1",
api_key="your-runapi-key"
)
response = client.chat.completions.create(
model="glm-4.5-air",
messages=[{"role": "user", "content": "Read this multi-file repository, find the failing integration test, and propose a patch with an explanation of the root cause."}]
)
import OpenAI from "openai";
const client = new OpenAI({
baseURL: "https://runapi.ai/v1",
apiKey: "your-runapi-key"
});
const response = await client.chat.completions.create({
model: "glm-4.5-air",
messages: [{ role: "user", content: "Read this multi-file repository, find the failing integration test, and propose a patch with an explanation of the root cause." }]
});
glm-4.5-air biedt de ideale balans tussen kwaliteit en kosten binnen de GLM-familie.
- Prijs per call in USD
- Mislukte generaties worden niet gefactureerd
- Streaming wanneer ondersteund door het model
- Modelskill-setup
Prijzen
Technische details
| Model-ID | glm-4.5-air |
| Provider | Z.ai |
| Modaliteit | text |
| Taaktype | synchronous |
| Facturatie-eenheid | 1K tokens |
| API endpoint | /v1/chat/completions |
| Commerciële licentie | Ja — inbegrepen via API |
| Status | Operationeel |
Snelstart — glm-4.5-air
Zelfde structuur · variant vastgelegd in model
| Endpoint | Protocol |
|---|---|
| /v1/chat/completions | OpenAI compatible |
Gebruik glm-4.5-air in vier stappen
Installeren
Installeer de modelskill voor deze modelreeks.
Configureren
Zet het modelveld op de volledige model-ID die op deze pagina staat.
Aanroepen
Stuur een getypeerde request met je prompt, inputs en callback-instellingen.
Ontvangen
Lees de task-response, webhook-callback of cached output-URL van RunAPI.
Wat is er anders aan glm-4.5-air
Lighter GLM-4.5 tier for fast, lower-cost everyday work
355B / 32B active; 128K context; flagship open-weight MoE baseline
Lighter GLM-4.5 tier for fast, lower-cost everyday work
200K context; first GLM on Cambricon chips; sharper code generation
Lighter GLM-4.5 tier for fast, lower-cost everyday work
200K context; 73.8% SWE-bench; persistent thinking across turns
Ideaal voor
Klantenservice
Beantwoord klantvragen vanuit een privékennisbank en verlaag zo het aantal tickets.
Documentanalyse
Stel samenvattingen van contracten op en markeer belangrijke clausules voor beoordeling door een jurist.
Codegeneratie
Genereer automatisch unittests, code reviews en refactoringsuggesties in CI.
Veelgestelde vragen over glm-4.5-air
Is de model-ID stabiel tussen versies?
RunAPI houdt de model-ID stabiel en verwerkt compatibele versie-updates zonder de opzet van je request te wijzigen.
Wat is de rate limit voor deze variant?
Rate limits per key schalen mee met je usage tier. Bekijk de prijzenpagina voor de actuele limieten.
Kan ik later van variant wisselen?
Ja — variant is een flag. Wissel door de modelparameter aan te passen.
Ondersteunt het streaming?
Waar streaming beschikbaar is, streamt RunAPI end-to-end.
Waar meld ik kwaliteitsproblemen?
Open een issue in de publieke GitHub-repo of mail support.