sophnet/z-ai/glm-5

算能
文本生成编程智能体推理744BMoE200KVibe Coding旗舰全能

GLM-5 是智谱推出的新一代大语言模型,专注于复杂系统工程和长周期 Agent 任务。模型规模 744B 参数(40B 激活),预训练数据 28.5T tokens。

模型基本信息

输入类型:文本
输出类型:文本
TPM:600,000
上下文长度203K
最大输入长度:170K
最大输出长度:16K

模型特性

工具调用
前缀续写
FIM补全
结构化输出
缓存

模型价格

条件计费项价格
输入<=32K输入3.924元 / M Tokens
输出17.6418元 / M Tokens
缓存0.7840.8元 / M Tokens
输入<64K输入5.886元 / M Tokens
输出21.5622元 / M Tokens
缓存1.1761.2元 / M Tokens
输入>=64输入7.848元 / M Tokens
输出25.4826元 / M Tokens
缓存1.5681.6元 / M Tokens

调用示意

CURL
curl -X POST  "https://route.showapi.com/openai/v1/chat/completions" \
-H "Authorization: Bearer [AppKey]" \
-H "Content-Type: application/json" \
-d '{
    "messages": [
        {
            "role": "user",
            "content": "介绍你的能力和优势,并给出你的名字"
        }
    ],
    "model": "sophnet/z-ai/glm-5",
    "stream": true,
    "temperature": 0.7
}'