sophnet/xiaomi/mimo-v2-flash

算能
文本生成智能体推理编程MoE256k

MiMo-V2-Flash 是小米开发的开源基础语言模型。它是一种混合专家模型,拥有 3090 亿个参数和 150 亿个有效参数,并采用了混合注意力架构。MiMo-V2-Flash 支持混合思维切换和 256K 上下文窗口,在推理、编码和智能体场景下表现出色。其性能与 Claude Sonnet 4.5 相当,而成本仅低约 3.5%。

模型基本信息

输入类型:文本
输出类型:文本
TPM:600,000
上下文长度256K
最大输入长度:256K
最大输出长度:256K

模型特性

工具调用
结构化输出
推理

模型价格

条件计费项价格
输入<=256K输入0.7 元 / M Tokens
输出2.1 元 / M Tokens

API部署与调用

CURL
curl --location -g --request POST "https://api.example.com/v1/chat/completions" \
--header "Authorization: Bearer $API_KEY" \
--header "Content-Type: application/json" \
--data-raw '{
    "messages": [
        {
            "role": "user",
            "content": "你可以帮我做什么"
        }
    ],
    "model": "MiMo-V2-Flash",
    "stream": false
}'