谷歌正式发布Gemini 3.1 Flash-Lite模型,以每秒363个token的惊人输出速度刷新轻量级AI推理性能纪录。该模型在响应效率与成本控制上实现突破性平衡,定价仅为0.25美元/百万Token,显著优于GPT-5 mini及Gemini 2.5 Flash,在同等任务负载下展现出更高性价比。其专为高并发、低延迟场景优化,适用于实时内容生成、多轮对话与边缘端部署等广泛需求,标志着大模型轻量化落地进入新阶段。
Gemini 3.1Flash-Lite363token/s0.25美元高性价比
2026-03-04