在2025年国际计算机视觉大会(ICCV 2025)上,由浙江大学、香港中文大学、上海交通大学与上海人工智能实验室联合研发的EgoAgent引发广泛关注。该智能体首次实现第一人称视角下的感知、行动与预测一体化,突破传统计算机视觉系统在动态环境理解中的局限。通过融合多模态感知与实时决策机制,EgoAgent能够在复杂场景中自主完成任务规划与行为预测,显著提升人机交互的自然性与准确性。此项研究为智能机器人、自动驾驶及增强现实等领域提供了全新的技术路径,代表了第一人称视觉智能的重要进展。
客服热线请拨打
400-998-8033