在ICML 2026会议上,一支联合研究团队提出LU-KV框架,创新性地引入投资回报率(ROI)理念指导KV缓存资源的动态分配。该框架在高达80%的KV缓存压缩率下,仅造成0.52%的相对性能损失(以Qwen2.5-32B模型在LongBench基准上的评测结果为依据),显著突破了效率与精度的传统权衡边界,达成当前该方向的SOTA水平。
客服热线请拨打
400-998-8033