VARIANT · Z.ai / GLM

GLM glm-4.7 API

Wariant modelu dostępny przez ujednolicone AI API RunAPI.

Operacyjny · text · Do użytku komercyjnego

runapi.ai

# Base URL
https://runapi.ai

# Endpoints
POST /v1/chat/completions

curl https://runapi.ai/v1/chat/completions \
  -H "Authorization: Bearer $RUNAPI_KEY" \
  -H "Content-Type: application/json" \
  -d '{
  "model": "glm-4.7",
  "messages": [
    {
      "role": "user",
      "content": "Read this multi-file repository, find the failing integration test, and propose a patch with an explanation of the root cause."
    }
  ]
}'

from openai import OpenAI

client = OpenAI(
    base_url="https://runapi.ai/v1",
    api_key="your-runapi-key"
)

response = client.chat.completions.create(
    model="glm-4.7",
    messages=[{"role": "user", "content": "Read this multi-file repository, find the failing integration test, and propose a patch with an explanation of the root cause."}]
)

import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://runapi.ai/v1",
  apiKey: "your-runapi-key"
});

const response = await client.chat.completions.create({
  model: "glm-4.7",
  messages: [{ role: "user", content: "Read this multi-file repository, find the failing integration test, and propose a patch with an explanation of the root cause." }]
});

https://runapi.ai /v1/chat/completions

Zmień wariant

glm-4.5 glm-4.5-air glm-4.6 glm-5 glm-5-turbo glm-5.1

OVERVIEW

glm-4.7 trafia w optymalny punkt między jakością a kosztem w rodzinie GLM.

Cennik za wywołanie w USD
Nieudane generacje nie są rozliczane
Streaming, gdy jest obsługiwany przez model
Setup model skilla

PRICING

Cennik

Nieudane generacje nie są rozliczane

Chat completion

Input $0.30 / 1M tokens

Output $1.10 / 1M tokens

Cache read $0.06

Cache write 5m Free

SPECYFIKACJA

Szczegóły techniczne

ID modelu	glm-4.7
Dostawca	Z.ai
Modalność	text
Typ zadania	synchronous
Jednostka rozliczeniowa	1K tokens
API endpoint	/v1/chat/completions
Licencja komercyjna	Tak — wliczona przez API
Status	Operacyjny

SKILLS

Szybki start — glm-4.7

Ten sam format · wariant przypięty w modelu

Endpoint	Protocol
/v1/chat/completions	OpenAI compatible

JAK TO DZIAŁA

Użyj glm-4.7 w czterech krokach

01

Instalacja

Zainstaluj model skill dla tej linii modeli.

02

Konfiguracja

Ustaw pole model na pełny identyfikator modelu widoczny na tej stronie.

03

Wywołanie

Wyślij typowane żądanie z promptem, danymi wejściowymi i ustawieniami callbacku.

04

Odbiór

Odczytaj odpowiedź zadania, webhook callback lub adres URL zapisanego wyniku z RunAPI.

DIFFERENCES

Co wyróżnia glm-4.7

VS GLM-4.5

200K context; 73.8% SWE-bench; persistent thinking across turns

355B / 32B active; 128K context; flagship open-weight MoE baseline

VS GLM-4.5-AIR

200K context; 73.8% SWE-bench; persistent thinking across turns

Lighter GLM-4.5 tier for fast, lower-cost everyday work

VS GLM-4.6

200K context; 73.8% SWE-bench; persistent thinking across turns

200K context; first GLM on Cambricon chips; sharper code generation

PRZYPADKI UŻYCIA

Najlepiej sprawdza się w

Obsługa klienta

Odpowiadaj na pytania klientów na podstawie prywatnej bazy wiedzy, zmniejszając liczbę zgłoszeń.

Analiza dokumentów

Twórz podsumowania umów i wyłapuj kluczowe klauzule do weryfikacji przez prawnika.

Generowanie kodu

Automatycznie generuj testy jednostkowe, sugestie code review i refaktoryzacji w CI.

FAQ

Najczęściej zadawane pytania o glm-4.7

Czy identyfikator modelu jest stały między wersjami?

RunAPI utrzymuje stały identyfikator modelu i obsługuje zgodne odświeżenia wersji bez zmiany kształtu żądania.

Jaki jest limit rate limit dla tej warianty?

Limity na klucz skalują się wraz z poziomem wykorzystania. Aktualne limity znajdziesz na stronie cennika.

Czy mogę później zmienić wariant?

Tak — wariant to flaga. Zmieniasz go, aktualizując parametr model.

Czy obsługuje streaming?

Tam, gdzie streaming jest dostępny, RunAPI streamuje end-to-end.

Gdzie zgłaszać problemy z jakością?

Otwórz issue w publicznym repo na GitHubie albo napisz do supportu.

Inne warianty modelu GLM

glm-4.5-air najtańszy

$0.010 / 1K tokens

$0.020 / 1K tokens

$0.020 / 1K tokens

$0.020 / 1K tokens

glm-5-turbo szybki

$0.020 / 1K tokens

$0.030 / 1K tokens

Alternatywy z innych modeli

Anthropic's LLM for complex reasoning, code, analysis, and extended-context tasks.

Reasoning-first LLMs via RunAPI — flash for fast, low-cost work; pro for complex agentic tasks.

OpenAI text embeddings for semantic search, retrieval, clustering, and ranking workflows.

ZACZNIJ TERAZ

Zacznij budować z GLM.

Utwórz darmowe konto Przeczytaj quickstart →