siliconflow/z-ai/glm-4.7

硅基流动
LLM推理模型通用模型强推理中文优化工具调用长上下文稳定输出

GLM-4.7 系列是智谱最新旗舰模型,面向 Agentic Coding 场景强化了编码能力、长程任务规划与工具协同,并在多个公开基准的当期榜单中取得开源模型中的出色表现。通用能力提升,回复更简洁自然,写作更具沉浸感。在执行复杂智能体任务,在工具调用时指令遵循更强,Artifacts 与 Agentic Coding 的前端美感和长程任务完成效率进一步提升。

模型基本信息

输入类型:文本
输出类型:文本
TPM:600,000
上下文长度128K
最大输入长度:128K
最大输出长度:8K

模型特性

工具调用
代码生成
多步推理
结构化输出
长上下文理解
函数调用

模型价格

条件计费项价格
输入<32K,输出<=0.2K输入2 元 / M Tokens
输出8 元 / M Tokens
输入<32K,输出>0.2K输入3 元 / M Tokens
输出14 元 / M Tokens
输入>=32K输入4 元 / M Tokens
输出16 元 / M Tokens

API部署与调用

CURL
curl --location -g --request POST "https://api.example.com/v1/chat/completions" \
--header "Authorization: Bearer $API_KEY" \
--header "Content-Type: application/json" \
--data-raw '{
    "messages": [
        {
            "role": "user",
            "content": "你可以帮我做什么"
        }
    ],
    "model": "Pro/zai-org/GLM-4.7",
    "stream": false
}'