谷歌近期对Gemini 2.5 Pro进行了重要升级,显著增强了其视觉理解与推理能力,并在此基础上推出了专用的计算机操作模型。该模型使AI智能体具备了与图形用户界面(GUI)直接交互的能力,可执行点击、输入文本和滚动等类人操作,标志着AI在实际任务自动化中的进一步突破。这一进展依托于Gemini 2.5 Pro强大的多模态处理性能,为AI操作系统的演进提供了新的可能性。
客服热线请拨打
400-998-8033