北京大学研究团队近期推出了一种名为Fairy2i的新型通用框架,能够对现有预训练模型进行极低比特量化处理。该技术仅需2比特即可实现复数模型的高效压缩,显著降低模型体积与计算需求,使大型模型在移动设备上流畅运行,性能接近全精度模型。这一突破有效解决了大模型在资源受限设备上的部署难题,为边缘计算与移动端AI应用提供了新的可能性。
客服热线请拨打
400-998-8033