技术博客

“心灵之眼”启示:生成图像技术在跨模态推理中的应用

近日,由上海交通大学、上海创智学院、复旦大学与Generative AI Research Lab(GAIR)联合研发的“Thinking with Generated Images”技术取得突破性进展。该技术使大型人工智能模型能够生成视觉化中间步骤,模拟人类利用内心图像进行跨模态推理的过程,为人工智能领域注入新活力。

生成图像技术跨模态推理人工智能模型内心图像模拟上海交大研究
2025-05-30
上海交通大学团队突破:KV Cache技术加速扩散型大型语言模型推理

上海交通大学的研究团队提出了一种创新方法,成功将KV Cache技术应用于扩散型大型语言模型(dLLMs)的推理加速。这一突破表明,KV Cache不仅适用于自回归模型,还能显著提升dLLMs的推理效率。该方法无需额外训练步骤,为大型语言模型的性能优化提供了新思路。

扩散型模型推理加速KV Cache技术大型语言模型上海交大研究
2025-05-27
上海交通大学携手SII突破性研究:312条轨迹标注实现模型性能飞跃

上海交通大学与SII合作的最新研究表明,通过仅使用312条人类标注轨迹,结合Claude 3.7 Sonnet技术合成更丰富的动作决策,可使模型性能提升高达241%,成功超越Claude 3.7原有性能。这一突破性成果为轨迹合成技术在模型性能优化领域的应用提供了新方向。

轨迹合成技术Claude 3.7性能动作决策提升上海交大研究模型性能优化
2025-05-26