siliconflow/qwen/qwen3.5-35b-a3b

硅基流动
文本生成编程智能体MoE256K35BTools视觉

Qwen3.5 Series 35B-A3B 是一个原生视觉语言模型,采用混合架构设计,整合线性注意机制和稀疏专家混合模型,达到更高的推理效率。其整体性能与 Qwen3.5-27B 相当。

模型基本信息

输入类型:文本、图像、视频
输出类型:文本
TPM:40,000
上下文长度262K
最大输入长度:262K
最大输出长度:66K

模型特性

工具调用
结构化输出
视觉输入
推理

模型价格

条件计费项价格
输入 [0,128k)输入0.4 元 / M Tokens
输出3.2 元 / M Tokens
输入 [128k,256k)输入1.6 元 / M Tokens
输出12.8 元 / M Tokens

API部署与调用

CURL
curl --location -g --request POST "https://api.example.com/v1/chat/completions" \
--header "Authorization: Bearer $API_KEY" \
--header "Content-Type: application/json" \
--data-raw '{
    "messages": [
        {
            "role": "user",
            "content": "你可以帮我做什么"
        }
    ],
    "model": "Qwen/Qwen3.5-35B-A3B",
    "stream": false
}'