VARIANT · Z.ai / GLM

GLM glm-5-turbo API

Variante modello disponibile tramite l'API AI unificata di RunAPI.

Operativo · text · Uso commerciale consentito
runapi.ai
# Base URL
https://runapi.ai

# Endpoints
POST /v1/chat/completions
curl https://runapi.ai/v1/chat/completions \
  -H "Authorization: Bearer $RUNAPI_KEY" \
  -H "Content-Type: application/json" \
  -d '{
  "model": "glm-5-turbo",
  "messages": [
    {
      "role": "user",
      "content": "Read this multi-file repository, find the failing integration test, and propose a patch with an explanation of the root cause."
    }
  ]
}'
from openai import OpenAI

client = OpenAI(
    base_url="https://runapi.ai/v1",
    api_key="your-runapi-key"
)

response = client.chat.completions.create(
    model="glm-5-turbo",
    messages=[{"role": "user", "content": "Read this multi-file repository, find the failing integration test, and propose a patch with an explanation of the root cause."}]
)
import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://runapi.ai/v1",
  apiKey: "your-runapi-key"
});

const response = await client.chat.completions.create({
  model: "glm-5-turbo",
  messages: [{ role: "user", content: "Read this multi-file repository, find the failing integration test, and propose a patch with an explanation of the root cause." }]
});
https://runapi.ai /v1/chat/completions
Cambia variante
OVERVIEW

glm-5-turbo punta al giusto equilibrio tra qualità e costo all’interno della famiglia GLM.

  • Prezzi pay-per-call in USD
  • Le generazioni fallite non vengono addebitate
  • Streaming quando supportato dal modello
  • Setup del model skill
PRICING

Prezzi

Le generazioni fallite non vengono addebitate
Chat completion
Input $0.60 / 1M tokens
Output $2.00 / 1M tokens
Cache read $0.12
Cache write 5m Free
SCHEDA TECNICA

Dettagli tecnici

ID modello glm-5-turbo
Provider Z.ai
Modalità text
Tipo di task synchronous
Unità di fatturazione 1K tokens
API endpoint /v1/chat/completions
Licenza commerciale Sì — inclusa via API
Stato Operativo
SKILLS

Quickstart — glm-5-turbo

Stessa struttura · variante fissata nel model

Endpoint Protocol
/v1/chat/completions OpenAI compatible
COME FUNZIONA

Usa glm-5-turbo in quattro passaggi

01

Installa

Installa il model skill per questa linea di modello.

02

Configura

Imposta il campo model con l'ID completo del model mostrato in questa pagina.

03

Invia

Invia una richiesta tipizzata con prompt, input e impostazioni di callback.

04

Ricevi

Leggi la risposta del task, il callback webhook o l'URL dell'output in cache da RunAPI.

DIFFERENCES

Cosa cambia in glm-5-turbo

VS GLM-4.5

Speed-optimized GLM-5 tier for lower latency

355B / 32B active; 128K context; flagship open-weight MoE baseline

VS GLM-4.5-AIR

Speed-optimized GLM-5 tier for lower latency

Lighter GLM-4.5 tier for fast, lower-cost everyday work

VS GLM-4.6

Speed-optimized GLM-5 tier for lower latency

200K context; first GLM on Cambricon chips; sharper code generation

CASI D'USO

Ideale per

Customer support

Rispondi alle domande dei clienti partendo da una knowledge base privata, riducendo il volume dei ticket.

Analisi documentale

Redigi riepiloghi di contratti e segnala le clausole chiave per la revisione dell'avvocato.

Generazione di codice

Genera automaticamente test unitari, code review e suggerimenti di refactoring in CI.

FAQ

Domande frequenti su glm-5-turbo

L'ID del modello resta stabile tra le versioni?

RunAPI mantiene stabile l’ID del modello e gestisce gli aggiornamenti di versione compatibili senza modificare la forma della richiesta.

Qual è il rate limit di questa variante?

I limiti per chiave scalano in base al tier di utilizzo. Consulta la pagina prezzi per i limiti attuali.

Posso cambiare variante in seguito?

Sì — la variante è un flag. Puoi cambiarla modificando il parametro model.

Fa streaming?

Dove lo streaming è disponibile, RunAPI esegue lo streaming end-to-end.

Dove posso segnalare problemi di qualità?

Apri un issue nel repository GitHub pubblico oppure scrivi all’assistenza.

INIZIA ORA

Inizia a costruire con GLM.