近日,来自卡内基梅隆大学(CMU)等机构的华人学者团队提出了一种名为“批判性微调”(CFT)的新技术,旨在推动SFT技术的复兴。该方法在处理复杂推理任务时表现出色,仅用50,000个样本训练,便在多数基准测试中超越了需200万个以上样本的强化学习方法,效果可与DeepSeek相媲美,为模型训练提供了新的思路。
客服热线请拨打
400-998-8033