compshare/z-ai/glm-4.6v

优云智算
VLM多模态模型图文理解模型图像理解 文档解析 多模态推理 OCR语义 长上下文

GLM-4.6V 系列是 GLM 系列在多模态方向上的一次重要迭代,包含 GLM-4.6V(旗舰版)、GLM-4.6V-FlashX(轻量高速版)、GLM-4.6V-Flash(完全免费)。它将训练时上下文窗口提升到128k tokens,在视觉理解精度上达到同参数规模 SOTA,并首次在模型架构中将 Function Call(工具调用)能力原生融入视觉模型,打通从「视觉感知」到「可执行行动(Action)」的链路,为真实业务场景中的多模态 Agent 提供统一的技术底座。

模型基本信息

输入类型:文本、图像
输出类型:文本
上下文长度131K
最大输入长度:131K
最大输出长度:8K

模型特性

多模态理解
图像理解
工具调用
结构化输出
多步推理
文档解析

模型价格

条件计费项价格
输入长度(0, 32K]输入0.981元 / M Tokens
输出2.943元 / M Tokens
输入长度(32K, 128K]输入1.962元 / M Tokens
输出5.886元 / M Tokens

调用示意

CURL
curl -X POST  "https://route.showapi.com/openai/v1/chat/completions" \
-H "Authorization: Bearer [AppKey]" \
-H "Content-Type: application/json" \
-d '{
    "messages": [
        {
            "role": "user",
            "content": "介绍你的能力和优势,并给出你的名字"
        }
    ],
    "model": "compshare/z-ai/glm-4.6v",
    "stream": true,
    "temperature": 0.7
}'