VARIANTE · Z.ai / GLM

GLM glm-4.6 API

Une variante de modèle exposée par l'API IA unifiée de RunAPI.

Opérationnel · text · Usage commercial pris en charge
runapi.ai
# Base URL
https://runapi.ai

# Endpoints
POST /v1/chat/completions
curl https://runapi.ai/v1/chat/completions \
  -H "Authorization: Bearer $RUNAPI_KEY" \
  -H "Content-Type: application/json" \
  -d '{
  "model": "glm-4.6",
  "messages": [
    {
      "role": "user",
      "content": "Read this multi-file repository, find the failing integration test, and propose a patch with an explanation of the root cause."
    }
  ]
}'
from openai import OpenAI

client = OpenAI(
    base_url="https://runapi.ai/v1",
    api_key="your-runapi-key"
)

response = client.chat.completions.create(
    model="glm-4.6",
    messages=[{"role": "user", "content": "Read this multi-file repository, find the failing integration test, and propose a patch with an explanation of the root cause."}]
)
import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://runapi.ai/v1",
  apiKey: "your-runapi-key"
});

const response = await client.chat.completions.create({
  model: "glm-4.6",
  messages: [{ role: "user", content: "Read this multi-file repository, find the failing integration test, and propose a patch with an explanation of the root cause." }]
});
https://runapi.ai /v1/chat/completions
Changer de variante
APERÇU

GLM glm-4.6 est disponible avec la même auth RunAPI, le même workflow de model skill et les mêmes tarifs à l'usage.

  • API key unifiée
  • Setup du model skill
  • Référence d'ID de modèle
  • Les générations échouées ne sont pas facturées
TARIFS

TARIFS

Les générations échouées ne sont pas facturées
Chat completion
Input $0.30 / 1M tokens
Output $1.10 / 1M tokens
Cache read $0.06
Cache write 5m Free
FICHE TECHNIQUE

FICHE TECHNIQUE

ID de modèle glm-4.6
Fournisseur Z.ai
Modalité text
Type de tâche synchronous
Facturation 1K tokens
Endpoint /v1/chat/completions
Commercial Oui
Statut Opérationnel
MODELS

Compétence de modèle — glm-4.6

Installez la compétence une seule fois, puis utilisez l'identifiant de variant de cette page lors de votre développement.

Endpoint Protocol
/v1/chat/completions OpenAI compatible
FONCTIONNEMENT

Utiliser glm-4.6

01

Choisir le modèle

Sélectionnez le modèle et la variante adaptés au workflow de votre app.

02

Passer l'ID de modèle

Utilisez cet ID de variante dans le corps de la requête.

03

Lancer la tâche

Envoyez la requête et stockez le task ID retourné.

04

Récupérer la sortie

Interrogez ou recevez le callback quand la tâche se termine.

DIFFÉRENCES

Comparaison de glm-4.6

VS GLM-4.5

200K context; first GLM on Cambricon chips; sharper code generation

355B / 32B active; 128K context; flagship open-weight MoE baseline

VS GLM-4.5-AIR

200K context; first GLM on Cambricon chips; sharper code generation

Lighter GLM-4.5 tier for fast, lower-cost everyday work

VS GLM-4.7

200K context; first GLM on Cambricon chips; sharper code generation

200K context; 73.8% SWE-bench; persistent thinking across turns

CAS D’USAGE

Où utiliser cette variante

Chat

Utilisez les LLM pour le chat et le raisonnement.

Code

Générez et révisez le travail d'implémentation.

Automatisation

Connectez les modèles aux tâches backend.

FAQ

Questions fréquentes sur glm-4.6

Comment sélectionner glm-4.6 ?

Passez l'ID de modèle affiché dans le quickstart.

Les tarifs sont-ils à l'usage ?

Oui. Les tarifs sont mesurés par appel ou par unité.

COMMENCER

Commencez avec GLM aujourd'hui.