qiniu/meituan/longcat-flash-lite

七牛云
LLMMoE模型Agent模型高性价比低激活参数长上下文工具调用编程优化推理加速

LongCat-Flash-Lite 模型采用高效 MoE 架构(总参数 685亿,激活参数约 30亿),通过 N-gram 嵌入表实现参数的高效利用,并针对推理效率与特定场景深度优化。

模型基本信息

输入类型:文本
输出类型:文本
上下文长度262K
最大输入长度:262K
最大输出长度:66K

模型特性

工具调用
代码生成
Agent任务
结构化输出
长上下文理解

API部署与调用

CURL
curl --location -g --request POST "https://api.example.com/v1/chat/completions" \
--header "Authorization: Bearer $API_KEY" \
--header "Content-Type: application/json" \
--data-raw '{
    "messages": [
        {
            "role": "user",
            "content": "你可以帮我做什么"
        }
    ],
    "model": "meituan/longcat-flash-lite",
    "stream": false
}'