GLM API
Z.ai GLM API 调用 —— MIT 开源 MoE 模型,最高 200K 上下文,开放权重编码基准领先。
# Base URL
https://runapi.ai
# Endpoints
POST /v1/chat/completions
curl https://runapi.ai/v1/chat/completions \
-H "Authorization: Bearer $RUNAPI_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "glm-5.1",
"messages": [
{
"role": "user",
"content": "阅读这个多文件仓库,找出失败的集成测试,并给出补丁及根因说明。"
}
]
}'
from openai import OpenAI
client = OpenAI(
base_url="https://runapi.ai/v1",
api_key="your-runapi-key"
)
response = client.chat.completions.create(
model="glm-5.1",
messages=[{"role": "user", "content": "阅读这个多文件仓库,找出失败的集成测试,并给出补丁及根因说明。"}]
)
import OpenAI from "openai";
const client = new OpenAI({
baseURL: "https://runapi.ai/v1",
apiKey: "your-runapi-key"
});
const response = await client.chat.completions.create({
model: "glm-5.1",
messages: [{ role: "user", content: "阅读这个多文件仓库,找出失败的集成测试,并给出补丁及根因说明。" }]
});
GLM 是 Z.ai 的 MIT 开源 MoE 语言模型系列。GLM-4.5(355B 总参 / 32B 激活,128K 上下文)是开放权重 MoE 基线;GLM-4.6 和 4.7 将上下文扩展到 200K 并强化代码生成,4.7 在 SWE-bench 达到 73.8%。GLM-5 系列(744B / 40B 激活,200K 上下文)SWE-bench Verified 达 77.8%,GLM-5.1 以 58.4% 拿下 SWE-bench Pro 开放权重最高分。全部可通过 RunAPI 用一个密钥按 token 计费调用。
- 多变体覆盖不同速度/质量层级
- Model skill 包含文档、schema 和接入说明
- 适合面向应用的编码工作流
- 失败的生成不计费
对比全部 API 变体
GLM API 端点
使用 OpenAI 或 Anthropic SDK 配合 RunAPI key 调用,无需额外 SDK。
| Endpoint | Protocol |
|---|---|
| /v1/chat/completions | OpenAI compatible |
四步从 model skill 到首次结果
选择模型
根据输出类型、质量要求和延迟目标选择模型与变体。
配置
设置 RunAPI key,并在代码工作区安装对应 model skill。
调用
按 skill 里的说明,把模型能力接入到你的应用里。
接收
按 task ID 轮询、在支持时使用流式,或处理 webhook 回调。
GLM API 是什么?
Z.ai 的 GLM 模型是 MIT 开源的 MoE 大语言模型,上下文 128K–200K。GLM-5.1 在 SWE-bench Pro 上领跑开放权重。通过 RunAPI 共用一个 API key、按量计费,可用 OpenAI Chat Completions、OpenAI Responses 与 Anthropic Messages 接口调用。
为什么用 RunAPI 调用 GLM API
一把认证,覆盖所有提供方
一把 RunAPI key 解锁整个模型目录。无需为每家提供方单独建账户。
统一的定价与账单
USD 按次定价,按月结算。失败的生成不计费。
Schema 优先的 SDK
Typed schema 和接入说明已打包进 model skill,让实现从正确契约开始。
常见问题
应该从哪个变体开始?
选满足质量要求的最便宜变体。多数团队从 fast 起步,生产时升级到 pro。
有免费额度吗?
新账户每个模型都有免费调用额度,之后按次计费。
支持流式吗?
模型支持流式时,RunAPI 端到端流式。
失败怎么计费?
失败的生成不计费。
输出会缓存吗?
输出按任务 ID 存储在 R2 供回取。输入不缓存。
可以商用吗?
可以——所有变体默认含商用许可,除非模型许可明确限制;有例外会在变体页面注明。
速率限制?
Key 级限流随使用层级伸缩。当前限制见定价页。
在哪里报问题?
在公共 GitHub 仓库提 issue 或邮件联系 support。