卡内基梅隆大学(CMU)团队近期发布了一项名为LCPO的新技术,该技术显著提升了AI模型的性能。通过LCPO训练的15亿参数L1模型,在数学推理任务中的表现比S1模型提升了超过100%。此外,L1模型在逻辑推理和MMLU等非训练任务上也表现出色,尤其在简短推理中,其性能与GPT-4o相当,且每token性能是S1模型的两倍。
客服热线请拨打
400-998-8033