VARIANTE · Z.ai / GLM

GLM glm-5-turbo API

Uma variante de modelo exposta pela API de IA unificada da RunAPI.

Operacional · text · Uso comercial permitido
runapi.ai
# Base URL
https://runapi.ai

# Endpoints
POST /v1/chat/completions
curl https://runapi.ai/v1/chat/completions \
  -H "Authorization: Bearer $RUNAPI_KEY" \
  -H "Content-Type: application/json" \
  -d '{
  "model": "glm-5-turbo",
  "messages": [
    {
      "role": "user",
      "content": "Read this multi-file repository, find the failing integration test, and propose a patch with an explanation of the root cause."
    }
  ]
}'
from openai import OpenAI

client = OpenAI(
    base_url="https://runapi.ai/v1",
    api_key="your-runapi-key"
)

response = client.chat.completions.create(
    model="glm-5-turbo",
    messages=[{"role": "user", "content": "Read this multi-file repository, find the failing integration test, and propose a patch with an explanation of the root cause."}]
)
import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://runapi.ai/v1",
  apiKey: "your-runapi-key"
});

const response = await client.chat.completions.create({
  model: "glm-5-turbo",
  messages: [{ role: "user", content: "Read this multi-file repository, find the failing integration test, and propose a patch with an explanation of the root cause." }]
});
https://runapi.ai /v1/chat/completions
Trocar variante
VISÃO GERAL

GLM glm-5-turbo está disponível com a mesma autenticação RunAPI, fluxo de model skill e preços por uso.

  • API key unificada
  • Setup do model skill
  • Referência de ID de modelo
  • Gerações com falha não são cobradas
PREÇOS

PREÇOS

Gerações com falha não são cobradas
Chat completion
Input $0.60 / 1M tokens
Output $2.00 / 1M tokens
Cache read $0.12
Cache write 5m Free
FICHA TÉCNICA

FICHA TÉCNICA

ID do modelo glm-5-turbo
Provedor Z.ai
Modalidade text
Tipo de tarefa synchronous
Cobrança 1K tokens
Endpoint /v1/chat/completions
Comercial Sim
Status Operacional
MODELS

Model skill — glm-5-turbo

Instale o skill uma vez, depois use o ID do variant desta página durante o desenvolvimento.

Endpoint Protocol
/v1/chat/completions OpenAI compatible
COMO FUNCIONA

Como usar glm-5-turbo

01

Escolha o modelo

Selecione o modelo e a variante que combinam com o fluxo do seu app.

02

Envie o ID do modelo

Use este ID de variante no corpo da requisição.

03

Execute a tarefa

Envie a requisição e armazene o task ID retornado.

04

Colete a saída

Consulte ou receba o callback quando a tarefa terminar.

DIFERENÇAS

Comparativo de glm-5-turbo

VS GLM-4.5

Speed-optimized GLM-5 tier for lower latency

355B / 32B active; 128K context; flagship open-weight MoE baseline

VS GLM-4.5-AIR

Speed-optimized GLM-5 tier for lower latency

Lighter GLM-4.5 tier for fast, lower-cost everyday work

VS GLM-4.6

Speed-optimized GLM-5 tier for lower latency

200K context; first GLM on Cambricon chips; sharper code generation

CASOS DE USO

Onde usar esta variante

Chat

Use LLMs para chat e raciocínio.

Código

Gere e revise trabalho de implementação.

Automação

Conecte modelos a tarefas backend.

FAQ

Perguntas frequentes sobre glm-5-turbo

Como seleciono glm-5-turbo?

Envie o ID de modelo mostrado no quickstart.

O preço é por uso?

Sim. O preço é medido por chamada ou unidade.

COMEÇAR

Comece com GLM hoje.