随着大型人工智能模型的快速发展,AI在处理传统复杂问题方面已逐渐游刃有余,但在答案验证能力上仍存在明显短板。为应对这一挑战,上海AI实验室与澳门大学联合开发了一款通用答案验证模型CompassVerifier,并推出配套评测集VerifierBench。这一突破性进展填补了当前缺乏有效“验证-提升-验证”循环迭代体系的空白,为人工智能答案验证领域提供了全新的解决方案,推动AI模型在训练与验证能力上的协同发展。
客服热线请拨打
400-998-8033