技术博客

CVPR 2026｜3DThinker：开创三维意象思考的新纪元

在CVPR 2026上，研究团队联合推出3DThinker——首个具备三维意象思考能力的多模态大模型。区别于现有模型局限于纯文本或2D视觉推理，3DThinker能基于输入的几张场景图片，在内部构建并推理场景的三维几何结构，显著提升对空间布局、深度关系与隐含几何信息的理解能力。该工作标志着多模态AI从“看图说话”迈向“构图思维”的关键跃迁，为具身智能、机器人导航与沉浸式内容生成开辟新路径。

3DThinker三维意象CVPR2026多模态几何推理

2026-03-11

AI热点

2026-06-29

IT-tools：数字化时代开发者的效率革命指南

科技热点

IT-tools：数字化时代开发者的效率革命指南