技术博客

CL-bench：上下文学习评测的新突破

近日，一支研究团队正式发布论文《CL-bench》，在AI评测领域取得重要突破。该工作聚焦于上下文学习（In-Context Learning, ICL）能力的系统性评估，构建了首个面向中文大模型、覆盖多任务与多层次推理的标准化评测基准。CL-bench不仅强化了对模型少样本泛化能力的刻画，还为大模型在真实场景中的适应性提供了可复现、可比较的量化依据，标志着中文语境下AI评测正迈向更严谨、更专业的阶段。

CL-bench上下文学习AI评测大模型论文发布

2026-02-04

上下文学习：AI认知革命的新范式

本文介绍了一种新兴的AI学习范式——上下文学习（In-Context Learning），并重点阐述了专为评估大模型该能力而设计的中文基准测试CL-bench。区别于传统微调方式，上下文学习依赖模型在提示中直接解析示例并泛化推理，对模型的语义理解与逻辑迁移能力提出更高要求。CL-bench作为首个聚焦中文场景的系统性评测基准，涵盖多任务、多层次的指令理解和少样本适应挑战，为衡量大模型真实“即学即用”能力提供了可复现、可比较的专业标尺。

上下文学习AI学习CL-bench大模型基准测试

2026-02-04

AI热点

2026-06-29

BrowserBC技术：实现网页操作的通用化革命

科技热点

BrowserBC技术：实现网页操作的通用化革命