qiniu/bytedance-seed/seed-2.0-mini

七牛云
LLMVLM多模态模型低延迟高并发成本优化轻量推理多模态理解可调推理强度

Seed-2.0-mini 针对延迟敏感、高并发及成本敏感的场景,强调快速反应和灵活的推论部署。它提供与 ByteDance-Seed-1.6 相当的性能,支援 256k 语境,四种推理努力模式(最小/低/中/高),多模态理解,并针对轻量级任务进行优化,其中成本和速度优先。

模型基本信息

输入类型:文本、图像、视频
输出类型:文本
TPM:600,000
上下文长度262K
最大输入长度:262K
最大输出长度:33K

模型特性

工具调用
结构化输出
推理

模型价格

条件计费项价格
输入长度 (0, 32K]输入0.2 元 / M Tokens
输出2 元 / M Tokens
输入长度 (32K, 128K]输入0.4 元 / M Tokens
输出4 元 / M Tokens
输入长度 (128K, 256K] 输入0.8 元 / M Tokens
输出8 元 / M Tokens

API部署与调用

CURL
curl --location -g --request POST "https://api.example.com/v1/chat/completions" \
--header "Authorization: Bearer $API_KEY" \
--header "Content-Type: application/json" \
--data-raw '{
    "messages": [
        {
            "role": "user",
            "content": "你可以帮我做什么"
        }
    ],
    "model": "doubao-seed-2.0-mini",
    "stream": false
}'