本文介绍CL-Bench最新演进成果——生成式CL-Bench:GENIUS。该框架聚焦一个核心命题:当上下文不再仅作为学习知识的载体,而转化为对创造行为施加的复杂限制时,大语言模型是否仍能保持充分的灵活性与适应性?GENIUS通过系统化设计多层级上下文约束任务,实证检验模型在受限生成场景下的推理韧性、风格迁移能力与语义一致性表现,为评估生成式AI的真实创造力提供了新范式。
客服热线请拨打
400-998-8033