近日,IDEA研究院提出了一种创新的目标检测模型——Rex-Thinker,该模型能够“思考”并理解语言指令,以实现对特定物体的精准定位。与传统方法不同,Rex-Thinker基于思维链技术,有效提升了指代物体检测的准确性与可解释性。在日常生活中,人们常通过语言描述寻找目标,例如“穿蓝衬衫的人”或“桌子左边的杯子”,而Rex-Thinker正是通过理解这类指令,解决了计算机视觉领域中精确定位目标的核心挑战。这一突破为人工智能在视觉与语言交互方面带来了新的可能性。
目标检测语言指令Rex-Thinker思维链精准定位
2025-07-03