GLM glm-4.7 API
Wariant modelu dostępny przez ujednolicone AI API RunAPI.
# Base URL
https://runapi.ai
# Endpoints
POST /v1/chat/completions
curl https://runapi.ai/v1/chat/completions \
-H "Authorization: Bearer $RUNAPI_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "glm-4.7",
"messages": [
{
"role": "user",
"content": "Read this multi-file repository, find the failing integration test, and propose a patch with an explanation of the root cause."
}
]
}'
from openai import OpenAI
client = OpenAI(
base_url="https://runapi.ai/v1",
api_key="your-runapi-key"
)
response = client.chat.completions.create(
model="glm-4.7",
messages=[{"role": "user", "content": "Read this multi-file repository, find the failing integration test, and propose a patch with an explanation of the root cause."}]
)
import OpenAI from "openai";
const client = new OpenAI({
baseURL: "https://runapi.ai/v1",
apiKey: "your-runapi-key"
});
const response = await client.chat.completions.create({
model: "glm-4.7",
messages: [{ role: "user", content: "Read this multi-file repository, find the failing integration test, and propose a patch with an explanation of the root cause." }]
});
glm-4.7 trafia w optymalny punkt między jakością a kosztem w rodzinie GLM.
- Cennik za wywołanie w USD
- Nieudane generacje nie są rozliczane
- Streaming, gdy jest obsługiwany przez model
- Setup model skilla
Cennik
Szczegóły techniczne
| ID modelu | glm-4.7 |
| Dostawca | Z.ai |
| Modalność | text |
| Typ zadania | synchronous |
| Jednostka rozliczeniowa | 1K tokens |
| API endpoint | /v1/chat/completions |
| Licencja komercyjna | Tak — wliczona przez API |
| Status | Operacyjny |
Szybki start — glm-4.7
Ten sam format · wariant przypięty w modelu
| Endpoint | Protocol |
|---|---|
| /v1/chat/completions | OpenAI compatible |
Użyj glm-4.7 w czterech krokach
Instalacja
Zainstaluj model skill dla tej linii modeli.
Konfiguracja
Ustaw pole model na pełny identyfikator modelu widoczny na tej stronie.
Wywołanie
Wyślij typowane żądanie z promptem, danymi wejściowymi i ustawieniami callbacku.
Odbiór
Odczytaj odpowiedź zadania, webhook callback lub adres URL zapisanego wyniku z RunAPI.
Co wyróżnia glm-4.7
200K context; 73.8% SWE-bench; persistent thinking across turns
355B / 32B active; 128K context; flagship open-weight MoE baseline
200K context; 73.8% SWE-bench; persistent thinking across turns
Lighter GLM-4.5 tier for fast, lower-cost everyday work
200K context; 73.8% SWE-bench; persistent thinking across turns
200K context; first GLM on Cambricon chips; sharper code generation
Najlepiej sprawdza się w
Obsługa klienta
Odpowiadaj na pytania klientów na podstawie prywatnej bazy wiedzy, zmniejszając liczbę zgłoszeń.
Analiza dokumentów
Twórz podsumowania umów i wyłapuj kluczowe klauzule do weryfikacji przez prawnika.
Generowanie kodu
Automatycznie generuj testy jednostkowe, sugestie code review i refaktoryzacji w CI.
Najczęściej zadawane pytania o glm-4.7
Czy identyfikator modelu jest stały między wersjami?
RunAPI utrzymuje stały identyfikator modelu i obsługuje zgodne odświeżenia wersji bez zmiany kształtu żądania.
Jaki jest limit rate limit dla tej warianty?
Limity na klucz skalują się wraz z poziomem wykorzystania. Aktualne limity znajdziesz na stronie cennika.
Czy mogę później zmienić wariant?
Tak — wariant to flaga. Zmieniasz go, aktualizując parametr model.
Czy obsługuje streaming?
Tam, gdzie streaming jest dostępny, RunAPI streamuje end-to-end.
Gdzie zgłaszać problemy z jakością?
Otwórz issue w publicznym repo na GitHubie albo napisz do supportu.