探索数据筛选新境界:香港科技大学与vivo的创新方案
香港科技大学与vivo联合开发了一种全新的预训练数据筛选方案,该方案可将数据处理效率提升10倍。通过使用fastText评分器,配置过程变得极为简便。此外,vivo自研大模型的数据筛选方法现已公开,为数据预处理领域提供了创新性解决方案,助力更高效、精准的预训练数据处理。
数据筛选方案预训练数据fastText评分器数据处理效率vivo大模型
2025-05-15
香港科技大学与vivo AI Lab的突破:PreSelect方案引领AI预训练数据效率革命
香港科技大学与vivo AI Lab联合开发了名为“PreSelect”的全新预训练数据筛选方案,该方案通过配置fastText评分器,可将数据效率提升高达10倍。这一创新成果已被ICML 2025国际机器学习会议接收,为AI预训练领域带来了突破性进展。
PreSelect方案数据效率fastText评分器ICML会议AI预训练
2025-05-15
AI热点
1
2025-08-02
三维资产一键生成:AIGC技术引领3D生成革命