技术博客

全景视野革新:影石研究院开源DiT360模型解读

影石研究院团队基于DiT架构开发了全新的全景图像生成模型DiT360,旨在推动空间智能领域的发展。针对该领域普遍面临的数据稀缺问题,影石研究院决定将DiT360作为开源模型对外发布,并提供在线可玩版本,便于研究者与开发者使用和迭代。该模型在生成高质量全景图像方面表现出色,为虚拟现实、自动驾驶和三维重建等应用提供了强有力的技术支持。通过开源策略,影石希望激发更多创新应用,促进空间智能技术的普及与进步。

DiT360全景生成影石研究院开源模型空间智能
2025-10-20
缅怀科学巨星:杨振宁教授的传奇一生

据新华社报道,著名物理学家杨振宁先生因疾病于2025年10月18日在北京逝世,享年103岁。杨振宁教授一生致力于科学探索与教育事业,其在理论物理领域的卓越成就广为人知,同时他对新兴科技领域亦有深远影响。近年来,他积极推动基础科学与前沿技术融合,尤其在中国AI与计算机产业发展中发挥了重要引导作用。他倡导跨学科合作,强调数学与物理在人工智能算法发展中的核心地位,为技术创新提供了理论支撑。他的思想与贡献深刻改变了中国高科技发展的路径,使AI与计算机领域因之受益匪浅。

杨振宁逝世AI计算机贡献
2025-10-20
X-VLA:引领机器人领域的跨本体具身基座模型

清华大学智能产业研究院(AIR)与上海人工智能实验室联合发布了通用跨本体具身基座模型X-VLA。该模型在机器人连续叠衣任务中表现出卓越的稳定性,可持续运行120分钟,展现了其在实际应用场景中的强大能力。尤为突出的是,X-VLA仅采用0.9B参数规模,便实现了五大SOTA(State of the Art)性能突破,显著提升了参数效率,为轻量化具身智能模型的发展提供了新范式。目前,X-VLA的代码及相关资源已全面开源,旨在推动学术界与工业界在机器人与人工智能领域的深入研究与应用。

X-VLA具身模型开源参数效率机器人
2025-10-20
人工智能领域的创新探索:解析计数幻觉现象

一项由阿德莱德大学、美团与上海交通大学组成的联合研究团队,首次对人工智能绘画中的“计数幻觉”现象进行了系统性量化分析。研究聚焦于扩散模型在生成图像时频繁出现的“六指问题”,即AI在绘制人手时常常错误地生成六根而非五根手指。该研究通过大量实验揭示了这一幻觉在不同模型架构和训练数据下的普遍性与成因,为理解生成式AI在精细结构处理上的局限提供了重要依据。研究成果标志着对AI视觉生成机制认知的重要进展。

计数幻觉扩散模型AI绘画六指问题系统分析
2025-10-20
深入剖析强化学习:卡帕西访谈解读

在长达两个半小时的深度访谈中,特斯拉前AI总监、OpenAI创始成员卡帕西系统剖析了强化学习的局限性与潜力。他指出,尽管该方法在训练效率、样本利用率和稳定性方面存在明显缺陷,但在当前可用的AI方法中,强化学习仍展现出相对优势。相较于监督学习等其他范式,强化学习在处理动态环境和长期决策任务中更具适应性。卡帕西强调,其核心价值在于能够通过试错机制自主探索最优策略,这使其在复杂AI系统开发中难以被完全替代。

卡帕西强化学习AI方法特斯拉OpenAI
2025-10-20
ObjectRelator框架:开启跨视角视觉理解的革命

在ICCV 2025会议上,HighlightAI项目展示了一项突破性成果:由INSAIT与复旦大学等机构联合研发的ObjectRelator框架,首次实现了第一人称与第三人称视角下同一物体的精准匹配。该框架通过构建跨视角的统一表征模型,显著提升了视觉理解的连贯性与准确性,在多个基准测试中刷新了当前最佳性能(SOTA),推动了跨视角视觉理解技术的发展。

ObjectRelator跨视角视觉理解SOTAHighlightAI
2025-10-20
探索清华大学SAC Flow:序列化与稳定训练的未来

清华大学提出了一种名为SAC Flow的新型强化学习方法,通过将流策略建模为序列模型,实现了序列化处理、稳定训练与数据高效三大核心优势。该方法引入GRU和Transformer等成熟序列建模技术,有效提升了梯度回传的稳定性,显著增强了训练过程的收敛性。同时,SAC Flow在少量数据下即可实现高效学习,大幅提升了样本利用率,在复杂控制任务中展现出优越性能。这一创新为强化学习领域的稳定性与效率问题提供了新的解决方案。

序列化稳定训练数据高效强化学习流策略
2025-10-20
Self-Forcing++:自回归视频生成模型的重大突破

在自回归视频生成模型的研究中,Self-Forcing++技术实现了关键突破,显著提升了长视频生成能力,使模型能够连续生成超过4分钟的高质量视频,突破了此前仅能生成数秒短视频的技术瓶颈。尽管Sora、Wan、Hunyuan-Video及Veo等主流模型依托扩散模型在视觉质量上不断逼近真实世界,但其生成时长受限的问题长期存在。Self-Forcing++通过优化自回归机制,有效解决了时间连贯性与计算复杂度之间的矛盾,为长视频生成提供了新的技术路径。这一进展标志着自回归模型在长序列建模方面迈出了重要一步,推动了视频生成技术向更广泛应用场景迈进。

自回归长视频Sora扩散模型突破
2025-10-20
北京大学研究团队提出InteractMove:3D场景中人-物交互动作生成的创新框架

北京大学研究团队在ACMMM 2025会议上提出了一种名为InteractMove的新框架,致力于解决3D场景中人与可移动物体之间的交互动作生成问题。该研究首次引入基于文本描述的人-物交互动作生成任务,填补了该领域的技术空白。团队构建了一个大规模数据集,并设计了创新的模型架构,在多个评估指标上显著优于现有方法,展现出卓越的生成精度与动作合理性。InteractMove为虚拟现实、智能交互等应用提供了重要技术支持。

InteractMove3D交互文本生成人机动作北大研究
2025-10-20
揭开算法背后数学原理的神秘面纱

一项历经80年的经典算法,其背后的数学原理终于被数学家们揭开。最新研究表明,该算法的运行时间可能与约束条件的数量呈指数关系,即随着约束数量的增加,所需计算时间呈指数级增长。这一发现不仅深化了人们对算法复杂性的理解,也为优化计算效率提供了理论依据。研究结合严谨的数学推导与大规模仿真验证,揭示了算法在处理高维约束问题时的根本局限,为未来设计更高效的替代算法指明方向。

算法数学原理约束指数
2025-10-20
GPT-5助力数学研究:深入解析Erdős问题的新进展

2023年10月17日,OpenAI研究团队成员Mark Sellke与Mehtaab利用先进的GPT-5模型,对erdosproblems.com网站上标记为“开放”的Erdős数学问题展开了系统性研究。通过执行数千次高精度查询,研究团队探索了多个长期未解的组合数学难题,旨在评估大语言模型在复杂数学推理中的潜力。该研究不仅展示了GPT-5在理解与推导抽象数学问题方面的能力,也为人工智能辅助数学研究提供了新的实践路径。此次工作标志着AI在理论数学领域应用的重要进展。

OpenAIGPT-5Erdős数学问题研究
2025-10-20
英伟达MIT联手打造:LongLive技术革新长视频创作

英伟达与麻省理工学院(MIT)联合研发的LongLive技术,实现了边打字边生成长视频的交互式创作方式,达到当前最先进的SOTA水平。该技术通过实时交互机制生成流畅画面,有效解决了传统长视频制作中常见的卡顿与不连贯问题。无论是15秒的短视频还是长达240秒的长视频,LongLive均能保持画面连贯性与节奏流畅性,显著降低视频创作门槛,使内容生成如同打字般便捷高效。

英伟达MITLongLive长视频交互式
2025-10-20
人工智能领域的革命性进步:SEAL框架的诞生

麻省理工学院近期在人工智能领域取得突破性进展,推出名为“SEAL”的自适应大型模型框架。该框架突破传统人工智能的被动学习模式,赋予模型主动学习与持续进化的关键能力,使其能够在动态环境中自主优化和调整。这一创新标志着人工智能正从静态训练迈向自我驱动的学习新阶段,为复杂任务处理、智能决策和长期学习系统提供了全新可能。研究团队强调,SEAL框架有望成为推动下一代人工智能发展的核心技术之一。

人工智能自适应SEAL主动学习进化模型
2025-10-20
AI数学新纪元:GPT-5助力破解埃尔德什数学难题

近日,数学领域迎来重大突破:两位研究人员借助GPT-5人工智能,仅用一个周末便解决了10个长期未解的埃尔德什数学难题。这一成果标志着AI在基础科学研究中的深度参与。著名数学家陶哲轩指出,AI在数学研究中最关键的应用在于自动化处理繁琐的文献查阅,使研究者能更专注于创造性思维与理论构建。此次成就不仅展示了人工智能在复杂逻辑推理中的潜力,也预示着科研范式正在向“人类智慧+AI协同”的新模式演进,AI正成为推动科学探索的重要引擎。

AI数学埃尔德什陶哲轩GPT-5科研范式
2025-10-20
英伟达联手MIT和香港大学,SANA-Video引领视频生成技术革新

英伟达联合麻省理工学院(MIT)、香港大学等机构的研究人员提出了一种名为SANA-Video的新型视频生成架构。该架构通过核心算法的创新,将视频生成的训练成本降低了高达99%,显著提升了训练效率。SANA-Video具备卓越的生成速度,能够以27帧每秒(FPS)的速率实时生成视频,并在短短35秒内完成1分钟高清视频的生成。这一技术突破标志着AI在视频内容创作领域的重大进展,预示着视频生成即将迎来一场由高效率与高性能驱动的AI革命,为未来多媒体应用开辟了广阔前景。

英伟达SANA视频生成MITAI革命
2025-10-20
量子计算的破晓:薛定谔孙子的创业传奇

薛定谔的孙子创立了一家专注于量子计算技术的创新企业,致力于推动量子算法与硬件的融合应用。公司成立初期,资深科技投资者老黄便敏锐洞察其潜力,成为早期股东之一。该企业依托薛定谔家族在量子物理领域的深厚背景,结合现代计算需求,探索量子叠加与纠缠在信息处理中的实际应用。正如那句广为流传的话所说:“如果你自认为已经理解了量子力学,那么实际上你可能并没有真正理解它。”这一理念也贯穿于公司的研发哲学之中,提醒团队保持谦逊与探索精神。

量子计算薛定谔老黄理解公司
2025-10-20