SSI-Bench是首个专门用于评估大模型在约束流形中空间推理能力的基准测试,通过结构化排序任务,系统考察模型对三维构型的几何与拓扑关系的理解能力。研究表明,当前主流模型在空间智能方面高度依赖二维表征,其三维空间推理表现显著低于人类水平,暴露出三维构型识别与约束推理能力的严重不足。该基准为推动真正具身化、几何感知型AI的发展提供了关键评测工具。
客服热线请拨打
400-998-8033