SSI-Bench是首个专门用于评估大模型在约束流形中空间推理能力的基准测试,通过排序任务系统考察模型对三维结构几何关系与拓扑关系的理解精度。研究表明,当前主流大型语言与多模态模型的空间智能仍高度依赖二维表征,在三维空间推理任务上表现显著弱于人类,暴露出其空间认知能力的根本性局限。
客服热线请拨打
400-998-8033