技术博客

谷歌Gemini 3.1 Flash-Lite：AI模型的性价比革命

谷歌正式发布Gemini 3.1 Flash-Lite模型，以每秒363个token的惊人输出速度刷新轻量级AI推理性能纪录。该模型在响应效率与成本控制上实现突破性平衡，定价仅为0.25美元/百万Token，显著优于GPT-5 mini及Gemini 2.5 Flash，在同等任务负载下展现出更高性价比。其专为高并发、低延迟场景优化，适用于实时内容生成、多轮对话与边缘端部署等广泛需求，标志着大模型轻量化落地进入新阶段。

Gemini 3.1Flash-Lite363token/s0.25美元高性价比

2026-03-04

AI热点

2026-06-29

IT-tools：数字化时代开发者的效率革命指南

科技热点

IT-tools：数字化时代开发者的效率革命指南