一项突破性实践表明,仅需约1500美元训练成本、参数量约1B的小模型,即可从零开始完成高质量预训练,并成功将混合推理机制(HRM)推向下一代推理架构讨论的中心。该成果挑战了“大模型即强性能”的固有认知,凸显小模型在效率、可部署性与架构创新上的独特价值,为轻量化AI研发提供了可复现、低成本的技术路径。
客服热线请拨打
400-998-8033