莱斯大学研究团队在人工智能优化领域取得突破,开发出DFloat11技术。该技术可将模型大小压缩30%,同时保持输出结果与原始模型一致,实现无损性能优化。此外,通过为GPU定制的解压缩内核,推理速度最高提升39倍,有效解决了传统量化技术中精度损失的问题,显著提高推理效率。
客服热线请拨打
400-998-8033