VARIANT · Z.ai / GLM

GLM glm-5-turbo API

Variante modello disponibile tramite l'API AI unificata di RunAPI.

Operativo · text · Uso commerciale consentito

runapi.ai

# Base URL
https://runapi.ai

# Endpoints
POST /v1/chat/completions

curl https://runapi.ai/v1/chat/completions \
  -H "Authorization: Bearer $RUNAPI_KEY" \
  -H "Content-Type: application/json" \
  -d '{
  "model": "glm-5-turbo",
  "messages": [
    {
      "role": "user",
      "content": "Read this multi-file repository, find the failing integration test, and propose a patch with an explanation of the root cause."
    }
  ]
}'

from openai import OpenAI

client = OpenAI(
    base_url="https://runapi.ai/v1",
    api_key="your-runapi-key"
)

response = client.chat.completions.create(
    model="glm-5-turbo",
    messages=[{"role": "user", "content": "Read this multi-file repository, find the failing integration test, and propose a patch with an explanation of the root cause."}]
)

import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://runapi.ai/v1",
  apiKey: "your-runapi-key"
});

const response = await client.chat.completions.create({
  model: "glm-5-turbo",
  messages: [{ role: "user", content: "Read this multi-file repository, find the failing integration test, and propose a patch with an explanation of the root cause." }]
});

https://runapi.ai /v1/chat/completions

Cambia variante

glm-4.5 glm-4.5-air glm-4.6 glm-4.7 glm-5 glm-5.1

OVERVIEW

glm-5-turbo punta al giusto equilibrio tra qualità e costo all’interno della famiglia GLM.

Prezzi pay-per-call in USD
Le generazioni fallite non vengono addebitate
Streaming quando supportato dal modello
Setup del model skill

PRICING

Prezzi

Le generazioni fallite non vengono addebitate

Chat completion

Input $0.60 / 1M tokens

Output $2.00 / 1M tokens

Cache read $0.12

Cache write 5m Free

SCHEDA TECNICA

Dettagli tecnici

ID modello	glm-5-turbo
Provider	Z.ai
Modalità	text
Tipo di task	synchronous
Unità di fatturazione	1K tokens
API endpoint	/v1/chat/completions
Licenza commerciale	Sì — inclusa via API
Stato	Operativo

SKILLS

Quickstart — glm-5-turbo

Stessa struttura · variante fissata nel model

Endpoint	Protocol
/v1/chat/completions	OpenAI compatible

COME FUNZIONA

Usa glm-5-turbo in quattro passaggi

01

Installa

Installa il model skill per questa linea di modello.

02

Configura

Imposta il campo model con l'ID completo del model mostrato in questa pagina.

03

Invia

Invia una richiesta tipizzata con prompt, input e impostazioni di callback.

04

Ricevi

Leggi la risposta del task, il callback webhook o l'URL dell'output in cache da RunAPI.

DIFFERENCES

Cosa cambia in glm-5-turbo

VS GLM-4.5

Speed-optimized GLM-5 tier for lower latency

355B / 32B active; 128K context; flagship open-weight MoE baseline

VS GLM-4.5-AIR

Speed-optimized GLM-5 tier for lower latency

Lighter GLM-4.5 tier for fast, lower-cost everyday work

VS GLM-4.6

Speed-optimized GLM-5 tier for lower latency

200K context; first GLM on Cambricon chips; sharper code generation

CASI D'USO

Ideale per

Customer support

Rispondi alle domande dei clienti partendo da una knowledge base privata, riducendo il volume dei ticket.

Analisi documentale

Redigi riepiloghi di contratti e segnala le clausole chiave per la revisione dell'avvocato.

Generazione di codice

Genera automaticamente test unitari, code review e suggerimenti di refactoring in CI.

FAQ

Domande frequenti su glm-5-turbo

L'ID del modello resta stabile tra le versioni?

RunAPI mantiene stabile l’ID del modello e gestisce gli aggiornamenti di versione compatibili senza modificare la forma della richiesta.

Qual è il rate limit di questa variante?

I limiti per chiave scalano in base al tier di utilizzo. Consulta la pagina prezzi per i limiti attuali.

Posso cambiare variante in seguito?

Sì — la variante è un flag. Puoi cambiarla modificando il parametro model.

Fa streaming?

Dove lo streaming è disponibile, RunAPI esegue lo streaming end-to-end.

Dove posso segnalare problemi di qualità?

Apri un issue nel repository GitHub pubblico oppure scrivi all’assistenza.

Altre varianti di GLM

glm-4.5-air più economico

$0.010 / 1K tokens

$0.020 / 1K tokens

$0.020 / 1K tokens

$0.020 / 1K tokens

$0.020 / 1K tokens

$0.030 / 1K tokens

Alternative da altri modelli

Anthropic's LLM for complex reasoning, code, analysis, and extended-context tasks.

Reasoning-first LLMs via RunAPI — flash for fast, low-cost work; pro for complex agentic tasks.

OpenAI text embeddings for semantic search, retrieval, clustering, and ranking workflows.

INIZIA ORA

Inizia a costruire con GLM.

Crea un account gratuito Leggi la guida rapida →