变体 · Z.ai / GLM

GLM glm-4.7 API

同一把 API key,同一套 model skill 工作流——切换变体只需改模型 ID。

运行中 · text · 可商用
runapi.ai
# Base URL
https://runapi.ai

# Endpoints
POST /v1/chat/completions
curl https://runapi.ai/v1/chat/completions \
  -H "Authorization: Bearer $RUNAPI_KEY" \
  -H "Content-Type: application/json" \
  -d '{
  "model": "glm-4.7",
  "messages": [
    {
      "role": "user",
      "content": "阅读这个多文件仓库,找出失败的集成测试,并给出补丁及根因说明。"
    }
  ]
}'
from openai import OpenAI

client = OpenAI(
    base_url="https://runapi.ai/v1",
    api_key="your-runapi-key"
)

response = client.chat.completions.create(
    model="glm-4.7",
    messages=[{"role": "user", "content": "阅读这个多文件仓库,找出失败的集成测试,并给出补丁及根因说明。"}]
)
import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://runapi.ai/v1",
  apiKey: "your-runapi-key"
});

const response = await client.chat.completions.create({
  model: "glm-4.7",
  messages: [{ role: "user", content: "阅读这个多文件仓库,找出失败的集成测试,并给出补丁及根因说明。" }]
});
https://runapi.ai /v1/chat/completions
切换变体
概览

glm-4.7 在 GLM 家族中处于质量与成本的最佳平衡点。

  • USD 按次定价
  • 失败不计费
  • 模型支持时流式
  • Schema 校验后的工具调用
定价

定价

失败的生成不计费
Chat completion
Input $0.30 / 1M tokens
Output $1.10 / 1M tokens
Cache read $0.06
Cache write 5m Free
规格

技术细节

模型 ID glm-4.7
提供方 Z.ai
模态 text
任务类型 synchronous
计费单位 1K tokens
API 端点 /v1/chat/completions
商用许可 允许商用
状态 运行中
技能

Model skill — glm-4.7

安装一次 skill,开发时使用本页的变体 ID。

Endpoint Protocol
/v1/chat/completions OpenAI compatible
工作流程

用 model skill 使用 glm-4.7

01

安装

安装该模型线对应的 model skill。

02

配置

把 model 字段设置为本页展示的完整模型 ID。

03

调用

按 skill 说明把提示词、输入文件和回调处理接入应用。

04

接收

从 RunAPI 读取任务响应、webhook 回调或缓存输出 URL。

差异

glm-4.7 与其它变体的差异

VS GLM-4.5

200K 上下文;SWE-bench 73.8%;跨轮次持续思考

355B / 32B 激活;128K 上下文;开放权重 MoE 旗舰基线

VS GLM-4.5-AIR

200K 上下文;SWE-bench 73.8%;跨轮次持续思考

更轻量的 GLM-4.5,低成本日常任务首选

VS GLM-4.6

200K 上下文;SWE-bench 73.8%;跨轮次持续思考

200K 上下文;首款昇腾芯片 GLM;代码生成增强

应用场景

最适合的场景

客户支持

基于私有知识库回答客户问题,减少工单量。

文档分析

起草合同摘要并标记关键条款供律师审阅。

代码生成

在 CI 中自动生成单元测试、代码审查和重构建议。

常见问题

glm-4.7 常见问题

模型 ID 跨版本稳定吗?

RunAPI 保持模型 ID 稳定,并在不改变请求形态的前提下处理兼容版本刷新。

该变体的限流?

Key 级限流随使用层级伸缩。当前限制见定价页。

能切到其它变体吗?

可以——变体只是参数,改 model 字段即可。

支持流式吗?

模型支持流式时,RunAPI 端到端流式。

质量问题在哪里报?

在公共 GitHub 仓库提 issue 或邮件联系 support。

立即开始

立即体验 GLM。