技术博客

代码能力：多模态大模型突破STEM视觉感知瓶颈的新路径

在CVPR 2026会议上，学界指出当前大型多模态模型在STEM视觉任务中存在显著感知短板——尤其在解析复杂科学图像（如分子结构、电路图、天文影像）时准确率不足。研究者提出，强化代码能力或为突破瓶颈的关键路径。基于此理念，CodePercept模型应运而生：它将视觉理解与可执行代码生成深度耦合，支持对STEM图像的符号化建模与动态推理，标志着多模态大模型向“感知—理解—计算”闭环迈出实质性一步。

CVPR 2026STEM视觉代码能力CodePercept多模态

2026-05-12

AI热点

2026-06-25

GitHub Copilot App：重塑开发者的AI协作新时代

科技热点

GitHub Copilot App：重塑开发者的AI协作新时代