GLM glm-4.5 API
Variante modello disponibile tramite l'API AI unificata di RunAPI.
# Base URL
https://runapi.ai
# Endpoints
POST /v1/chat/completions
curl https://runapi.ai/v1/chat/completions \
-H "Authorization: Bearer $RUNAPI_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "glm-4.5",
"messages": [
{
"role": "user",
"content": "Read this multi-file repository, find the failing integration test, and propose a patch with an explanation of the root cause."
}
]
}'
from openai import OpenAI
client = OpenAI(
base_url="https://runapi.ai/v1",
api_key="your-runapi-key"
)
response = client.chat.completions.create(
model="glm-4.5",
messages=[{"role": "user", "content": "Read this multi-file repository, find the failing integration test, and propose a patch with an explanation of the root cause."}]
)
import OpenAI from "openai";
const client = new OpenAI({
baseURL: "https://runapi.ai/v1",
apiKey: "your-runapi-key"
});
const response = await client.chat.completions.create({
model: "glm-4.5",
messages: [{ role: "user", content: "Read this multi-file repository, find the failing integration test, and propose a patch with an explanation of the root cause." }]
});
glm-4.5 punta al giusto equilibrio tra qualità e costo all’interno della famiglia GLM.
- Prezzi pay-per-call in USD
- Le generazioni fallite non vengono addebitate
- Streaming quando supportato dal modello
- Setup del model skill
Prezzi
Dettagli tecnici
| ID modello | glm-4.5 |
| Provider | Z.ai |
| Modalità | text |
| Tipo di task | synchronous |
| Unità di fatturazione | 1K tokens |
| API endpoint | /v1/chat/completions |
| Licenza commerciale | Sì — inclusa via API |
| Stato | Operativo |
Quickstart — glm-4.5
Stessa struttura · variante fissata nel model
| Endpoint | Protocol |
|---|---|
| /v1/chat/completions | OpenAI compatible |
Usa glm-4.5 in quattro passaggi
Installa
Installa il model skill per questa linea di modello.
Configura
Imposta il campo model con l'ID completo del model mostrato in questa pagina.
Invia
Invia una richiesta tipizzata con prompt, input e impostazioni di callback.
Ricevi
Leggi la risposta del task, il callback webhook o l'URL dell'output in cache da RunAPI.
Cosa cambia in glm-4.5
355B / 32B active; 128K context; flagship open-weight MoE baseline
Lighter GLM-4.5 tier for fast, lower-cost everyday work
355B / 32B active; 128K context; flagship open-weight MoE baseline
200K context; first GLM on Cambricon chips; sharper code generation
355B / 32B active; 128K context; flagship open-weight MoE baseline
200K context; 73.8% SWE-bench; persistent thinking across turns
Ideale per
Customer support
Rispondi alle domande dei clienti partendo da una knowledge base privata, riducendo il volume dei ticket.
Analisi documentale
Redigi riepiloghi di contratti e segnala le clausole chiave per la revisione dell'avvocato.
Generazione di codice
Genera automaticamente test unitari, code review e suggerimenti di refactoring in CI.
Domande frequenti su glm-4.5
L'ID del modello resta stabile tra le versioni?
RunAPI mantiene stabile l’ID del modello e gestisce gli aggiornamenti di versione compatibili senza modificare la forma della richiesta.
Qual è il rate limit di questa variante?
I limiti per chiave scalano in base al tier di utilizzo. Consulta la pagina prezzi per i limiti attuali.
Posso cambiare variante in seguito?
Sì — la variante è un flag. Puoi cambiarla modificando il parametro model.
Fa streaming?
Dove lo streaming è disponibile, RunAPI esegue lo streaming end-to-end.
Dove posso segnalare problemi di qualità?
Apri un issue nel repository GitHub pubblico oppure scrivi all’assistenza.