提供方

Z.ai

Z.ai 的 GLM——MIT 开源 MoE 大语言模型,128K–200K 上下文,开放权重 SWE-bench 最高分,一个 RunAPI 密钥即可调用。

1 models · 7 variants · 起价 $0.010
概览

Z.ai 打造 MIT 开源的 GLM MoE 语言模型系列。GLM-4.5(355B / 32B 激活,128K 上下文)到 GLM-5.1(754B / 40B 激活,200K 上下文),后者以 58.4% 拿下开放权重 SWE-bench Pro 最高分。全部可通过 RunAPI 用 OpenAI 与 Anthropic SDK 按 token 计费调用。

  • 一把 key 覆盖所有提供方
  • Model skill 把文档和 schema 带进代码工作区
  • 按次计费,无最低消费
  • 失败的生成不计费
特性

亮点

模型

Z.ai 全部模型

快速开始

安装一个 Z.ai model skill。

选择模型并添加它的 skill,让编码工具获得文档、schema、定价说明和接入步骤。

runapi.ai
# Base URL
https://runapi.ai

# Endpoints
POST /v1/chat/completions
curl https://runapi.ai/v1/chat/completions \
  -H "Authorization: Bearer $RUNAPI_KEY" \
  -H "Content-Type: application/json" \
  -d '{
  "model": "glm-5.1",
  "messages": [
    {
      "role": "user",
      "content": "阅读这个多文件仓库,找出失败的集成测试,并给出补丁及根因说明。"
    }
  ]
}'
from openai import OpenAI

client = OpenAI(
    base_url="https://runapi.ai/v1",
    api_key="your-runapi-key"
)

response = client.chat.completions.create(
    model="glm-5.1",
    messages=[{"role": "user", "content": "阅读这个多文件仓库,找出失败的集成测试,并给出补丁及根因说明。"}]
)
import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://runapi.ai/v1",
  apiKey: "your-runapi-key"
});

const response = await client.chat.completions.create({
  model: "glm-5.1",
  messages: [{ role: "user", content: "阅读这个多文件仓库,找出失败的集成测试,并给出补丁及根因说明。" }]
});
https://runapi.ai /v1/chat/completions
参考

Z.ai 全部变体

完整定价表 →
Model Variant Billing From
GLM
glm-4.5 1K tokens $0.020 查看 →
glm-4.5-air 1K tokens $0.010 查看 →
glm-4.6 1K tokens $0.020 查看 →
glm-4.7 1K tokens $0.020 查看 →
glm-5 1K tokens $0.020 查看 →
glm-5-turbo 1K tokens $0.020 查看 →
glm-5.1 1K tokens $0.030 查看 →
常见问题

Z.ai 常见问题

这是 Z.ai 官方集成吗?

RunAPI 提供托管 API 接入,定价、能力和错误行为都清晰透明。

需要单独的 Z.ai 账号吗?

不需要——RunAPI key 即可使用托管接入。

代理会带来多少延迟?

一般在 20 ms 以内。RunAPI 会让代理层尽量靠近模型执行区域。

输出会缓存吗?

输出按任务 ID 存储在 R2 供回取。输入不缓存。

能自带 key 吗?

目前不支持——调用使用 RunAPI 托管接入。

立即开始

立即体验 Z.ai 模型。