qiniu/z-ai/glm-5

七牛云
文本生成编程智能体推理744BMoE200KVibe Coding旗舰全能

GLM-5 是智谱推出的新一代大语言模型,专注于复杂系统工程和长周期 Agent 任务。模型规模 744B 参数(40B 激活),预训练数据 28.5T tokens。

模型基本信息

输入类型:文本
输出类型:文本
TPM:600,000
上下文长度203K
最大输入长度:170K
最大输出长度:16K

模型特性

工具调用
前缀续写
FIM补全
结构化输出
缓存

模型价格

条件计费项价格
输入<32K输入4 元 / M Tokens
输出18 元 / M Tokens
输入>=32K输入6 元 / M Tokens
输出22 元 / M Tokens

API部署与调用

CURL
curl --location -g --request POST "https://api.example.com/v1/chat/completions" \
--header "Authorization: Bearer $API_KEY" \
--header "Content-Type: application/json" \
--data-raw '{
    "messages": [
        {
            "role": "user",
            "content": "你可以帮我做什么"
        }
    ],
    "model": "z-ai/glm-5",
    "stream": false
}'