# Base URL
https://runapi.ai
# Endpoints
POST /v1/chat/completions
curl https://runapi.ai/v1/chat/completions \
-H "Authorization: Bearer $RUNAPI_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "glm-4.5-air",
"messages": [
{
"role": "user",
"content": "Read this multi-file repository, find the failing integration test, and propose a patch with an explanation of the root cause."
}
]
}'
from openai import OpenAI
client = OpenAI(
base_url="https://runapi.ai/v1",
api_key="your-runapi-key"
)
response = client.chat.completions.create(
model="glm-4.5-air",
messages=[{"role": "user", "content": "Read this multi-file repository, find the failing integration test, and propose a patch with an explanation of the root cause."}]
)
import OpenAI from "openai";
const client = new OpenAI({
baseURL: "https://runapi.ai/v1",
apiKey: "your-runapi-key"
});
const response = await client.chat.completions.create({
model: "glm-4.5-air",
messages: [{ role: "user", content: "Read this multi-file repository, find the failing integration test, and propose a patch with an explanation of the root cause." }]
});
切換 variant
OVERVIEW
glm-4.5-air 針對 GLM 系列中品質與成本的最佳平衡點。
- 按次收費,美元計價
- 生成失敗不收費
- 如模型支援,提供串流輸出
- Model skill setup
PRICING
收費
失敗的生成不會收費
Chat completion
Input
$0.10
/ 1M tokens
Output
$0.55
/ 1M tokens
Cache read
$0.02
Cache write 5m
Free
規格說明
技術詳情
| 模型 ID | glm-4.5-air |
| 供應商 | Z.ai |
| 模式 | text |
| 任務類型 | synchronous |
| 計費單位 | 1K tokens |
| API endpoint | /v1/chat/completions |
| 商業授權 | 是 — 已透過 API 包含 |
| 狀態 | 可正常運作 |
SKILLS
快速開始 — glm-4.5-air
結構一致 · variant 已固定於 model 中
| Endpoint | Protocol |
|---|---|
| /v1/chat/completions | OpenAI compatible |
運作方式
四步使用 glm-4.5-air
01
安裝
為此模型系列安裝 model skill。
02
設定
將 model 欄位設為本頁顯示的完整 model ID。
03
呼叫
連同 prompt、inputs 及 callback 設定,送出一個 typed request。
04
接收
從 RunAPI 讀取 task response、webhook callback 或 cached output URL。
DIFFERENCES
glm-4.5-air 有咩不同
VS GLM-4.5
Lighter GLM-4.5 tier for fast, lower-cost everyday work
355B / 32B active; 128K context; flagship open-weight MoE baseline
VS GLM-4.6
Lighter GLM-4.5 tier for fast, lower-cost everyday work
200K context; first GLM on Cambricon chips; sharper code generation
VS GLM-4.7
Lighter GLM-4.5 tier for fast, lower-cost everyday work
200K context; 73.8% SWE-bench; persistent thinking across turns
使用場景
最適合
客戶支援
從私有知識庫回答客戶問題,減少工單數量。
文件分析
草擬合約摘要,並標示重點條款供律師審閱。
程式碼生成
在 CI 自動生成單元測試、程式碼審查同重構建議。
FAQ
關於 glm-4.5-air 的常見問題
模型 ID 會否在不同版本之間保持穩定?
RunAPI 會保持 model ID 穩定,並處理相容的版本更新,而不需要改動你的 request 格式。
這個 variant 的 rate limit 係多少?
每個 key 的 rate limit 會按使用層級而定。請查看定價頁了解最新限制。
之後可以切換 variant 嗎?
可以——variant 只係一個旗標。只要更改 model 參數就可以切換。
支援 streaming 嗎?
在可用 streaming 的情況下,RunAPI 會端到端串流。
我應該在邊度回報品質問題?
可以在公開 GitHub repo 開 issue,或者電郵支援團隊。
立即開始