qiniu/meituan/longcat-flash-lite

七牛云

LLMMoE模型Agent模型高性价比低激活参数长上下文工具调用编程优化推理加速

LongCat-Flash-Lite 模型采用高效 MoE 架构（总参数 685亿，激活参数约 30亿），通过 N-gram 嵌入表实现参数的高效利用，并针对推理效率与特定场景深度优化。

模型基本信息

输入类型：文本

输出类型：文本

上下文长度262K

最大输入长度：262K

最大输出长度：66K

模型特性

工具调用

代码生成

Agent任务

结构化输出

长上下文理解

API部署与调用

CURL

curl --location -g --request POST "https://api.example.com/v1/chat/completions" \
--header "Authorization: Bearer $API_KEY" \
--header "Content-Type: application/json" \
--data-raw '{
    "messages": [
        {
            "role": "user",
            "content": "你可以帮我做什么"
        }
    ],
    "model": "meituan/longcat-flash-lite",
    "stream": false
}'