VARIANTE · Z.ai / GLM

GLM glm-5-turbo API

Uma variante de modelo exposta pela API de IA unificada da RunAPI.

Operacional · text · Uso comercial permitido

runapi.ai

# Base URL
https://runapi.ai

# Endpoints
POST /v1/chat/completions

curl https://runapi.ai/v1/chat/completions \
  -H "Authorization: Bearer $RUNAPI_KEY" \
  -H "Content-Type: application/json" \
  -d '{
  "model": "glm-5-turbo",
  "messages": [
    {
      "role": "user",
      "content": "Read this multi-file repository, find the failing integration test, and propose a patch with an explanation of the root cause."
    }
  ]
}'

from openai import OpenAI

client = OpenAI(
    base_url="https://runapi.ai/v1",
    api_key="your-runapi-key"
)

response = client.chat.completions.create(
    model="glm-5-turbo",
    messages=[{"role": "user", "content": "Read this multi-file repository, find the failing integration test, and propose a patch with an explanation of the root cause."}]
)

import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://runapi.ai/v1",
  apiKey: "your-runapi-key"
});

const response = await client.chat.completions.create({
  model: "glm-5-turbo",
  messages: [{ role: "user", content: "Read this multi-file repository, find the failing integration test, and propose a patch with an explanation of the root cause." }]
});

https://runapi.ai /v1/chat/completions

Trocar variante

glm-4.5 glm-4.5-air glm-4.6 glm-4.7 glm-5 glm-5.1

VISÃO GERAL

GLM glm-5-turbo está disponível com a mesma autenticação RunAPI, fluxo de model skill e preços por uso.

API key unificada
Setup do model skill
Referência de ID de modelo
Gerações com falha não são cobradas

PREÇOS

PREÇOS

Gerações com falha não são cobradas

Chat completion

Input $0.60 / 1M tokens

Output $2.00 / 1M tokens

Cache read $0.12

Cache write 5m Free

FICHA TÉCNICA

FICHA TÉCNICA

ID do modelo	glm-5-turbo
Provedor	Z.ai
Modalidade	text
Tipo de tarefa	synchronous
Cobrança	1K tokens
Endpoint	/v1/chat/completions
Comercial	Sim
Status	Operacional

MODELS

Model skill — glm-5-turbo

Instale o skill uma vez, depois use o ID do variant desta página durante o desenvolvimento.

Endpoint	Protocol
/v1/chat/completions	OpenAI compatible

COMO FUNCIONA

Como usar glm-5-turbo

01

Escolha o modelo

Selecione o modelo e a variante que combinam com o fluxo do seu app.

02

Envie o ID do modelo

Use este ID de variante no corpo da requisição.

03

Execute a tarefa

Envie a requisição e armazene o task ID retornado.

04

Colete a saída

Consulte ou receba o callback quando a tarefa terminar.

DIFERENÇAS

Comparativo de glm-5-turbo

VS GLM-4.5

Speed-optimized GLM-5 tier for lower latency

355B / 32B active; 128K context; flagship open-weight MoE baseline

VS GLM-4.5-AIR

Speed-optimized GLM-5 tier for lower latency

Lighter GLM-4.5 tier for fast, lower-cost everyday work

VS GLM-4.6

Speed-optimized GLM-5 tier for lower latency

200K context; first GLM on Cambricon chips; sharper code generation

CASOS DE USO

Onde usar esta variante

Chat

Use LLMs para chat e raciocínio.

Código

Gere e revise trabalho de implementação.

Automação

Conecte modelos a tarefas backend.

FAQ

Perguntas frequentes sobre glm-5-turbo

Como seleciono glm-5-turbo?

Envie o ID de modelo mostrado no quickstart.

O preço é por uso?

Sim. O preço é medido por chamada ou unidade.

Outras variantes de GLM

glm-4.5-air Mais barato

$0.010 / 1K tokens

$0.020 / 1K tokens

$0.020 / 1K tokens

$0.020 / 1K tokens

$0.020 / 1K tokens

$0.030 / 1K tokens

Modelos relacionados

Acesso à API do Claude para o LLM da Anthropic em tarefas de raciocínio complexo, código, análise e contexto estendido.

Acesso à API do DeepSeek via RunAPI — flash para trabalho rápido e barato; pro para tarefas agênticas complexas.

OpenAI text embeddings for semantic search, retrieval, clustering, and ranking workflows.

COMEÇAR

Comece com GLM hoje.

Criar conta grátis Ler início rápido →