近日,由南京大学、香港大学等8家单位学者联合撰写的一篇综述论文《A Survey: Learning Embodied Intelligence from Physical Simulators and World Models》引发关注。该论文共计38页,引用文献超过400篇,通过25张图表和6张表格系统性地探讨了物理模拟器与世界模型如何协同推动机器人智能从单纯执行任务(“会做”)向理解任务本质(“会想”)的转变。文章内容涵盖技术原理、应用案例及未来发展方向,为相关领域研究者提供了全面的参考。
上海交通大学教授、上海人工智能实验室双聘研究员翟广涛提出,构建一个完善的人工智能评测体系,实际上等同于实现通用人工智能(AGI)。他指出,当前人工智能评测标准多聚焦于特定任务性能,难以全面反映智能系统的综合能力。翟广涛强调,唯有建立涵盖认知、学习、推理、迁移等多维度能力的评测框架,才能推动人工智能向更高层次发展。这一观点为人工智能研究提供了新思路,也为未来技术突破指明了方向。
在ICML 2025会议上,M+框架的介绍标志着大型语言模型(LLM)技术的一项重大突破。该框架通过增强模型的隐空间记忆能力,有效解决了传统语言模型因上下文窗口大小限制而面临的挑战。这一创新不仅推动了隐空间长期记忆技术的发展,还为下一代具备持久记忆功能的语言模型奠定了坚实的技术基础。M+框架的提出,代表了在语言模型领域迈向更高效、更智能的信息处理与存储的重要一步。
在2025年国际机器学习大会(ICML 2025)上,一篇发表于2015年的论文因其在深度学习领域的重要影响荣获时间检验奖。该论文首次提出了Batch Normalization(批次归一化)理论,这一技术迅速成为神经网络训练中的关键手段,被广泛应用于各类深度学习模型中。然而,近年来的研究表明,该理论的部分假设和推导存在错误,尽管如此,其实际效果依然显著,对整个领域的发展起到了重要推动作用。此次奖项不仅是对该论文历史贡献的认可,也引发了学术界对经典理论重新审视的热潮。
本文探讨了大型语言模型(LLM)在理解和处理人类语言时可能遇到的一些细微但重要的问题。例如,一个简单的标点符号“:”就可能导致模型的理解出现偏差。此外,在数学考试中,“解”字的使用也可能对模型产生误导,尽管它可能帮助学生获得分数。这些例子揭示了即使是最先进的语言模型,在面对特定语言结构时仍存在局限性。
近日,月之暗面团队发布了Kimi K2的新版本,引发了广泛关注。作为一名内容创作者,我对这款AI产品最初持怀疑态度,因为市场上类似的产品层出不穷,质量参差不齐。然而,出于好奇,我决定亲自体验一番。新版本在内容创作方面的表现令人印象深刻,展示了其在AI领域的创新突破。
近日,马斯克旗下的xAI团队推出的Grok二次元虚拟角色再次引发广泛关注,尤其是其新功能“智能伴侣”。该功能基于Grok最新发布的四大模型,能够实现与用户的自然流畅互动,极大提升了人机交流的体验。相较于此前的版本升级,“智能伴侣”的热度有过之而无不及,成为社交媒体和科技圈热议的话题。这一创新不仅展现了AI在虚拟角色塑造上的巨大潜力,也反映了用户对个性化、情感化交互方式的强烈需求。
MIRIX系统是由加州大学圣地亚哥分校(UCSD)和纽约大学(NYU)联合研发的新型人工智能系统,在多模态长期记忆技术领域实现了重大突破。与Gemini系统相比,MIRIX的性能提升了410%,同时内存使用量减少了99.9%,显著提高了运行效率并降低了资源消耗。此外,MIRIX的应用程序已同步上线,为用户提供了便捷的操作体验,标志着AI技术在实际应用层面迈出了重要一步。
在短短五个月内,一家由OpenAI前首席技术官创立的初创公司迅速崛起,估值达到120亿美元。该公司在种子轮融资中成功筹集了20亿美元,吸引了大量关注。团队汇聚了来自OpenAI的顶尖人才,计划在未来几个月内推出其首个多模态人工智能产品。值得一提的是,为了推动技术共享与进步,该公司决定将部分产品组件免费开源。这一举措不仅展示了其技术实力,也体现了对人工智能领域开放合作的承诺。
秘塔AI近日推出了国内首个免费的深度研究工具——Deep Research。该工具在多项权威评测中名列前茅,其准确率甚至超越了开源工具WebSailor。Deep Research的独特之处在于其多线程迭代搜索功能,能够持续搜索直至形成完整的逻辑链条,从而确保研究的深度与完整性。此外,它还支持一键生成互动研究报告,报告不仅内容详实,视觉效果也十分出众,为用户提供了全新的数据展示体验。
随着大型语言模型(LLM)在代码生成领域的广泛应用,其在不同评估标准下的表现差异引发了广泛关注。LLM在HumanEval测试中得分超过80分,但在LeetCode上的错误率却高达40%,这一现象表明问题的根源并非模型本身,而是评估标准的主观性和局限性。上海AI实验室与西安交通大学的最新研究SAGA提出了一种创新方法,通过人机协作将测试用例转化为可量化、可扩展的AI产品,从而将代码评估过程从主观判断转变为客观科学。这种方法不仅提升了评估的准确性,还为LLM的进一步优化提供了可靠依据。
最新研究揭示,ChatGPT作为一种AI技术,正在悄然影响人类的语言习惯,甚至改变英语的表达方式,植入自身的偏好。数据显示,已有36万视频和77万播客证实了这种影响的存在,表明人们可能在无意识中被AI“驯化”,成为其语言风格的“复读机”。这一现象引发了对自我表达真实性的反思:我们是在表达自我,还是在传递AI的偏好?面对AI技术的迅猛发展,重新审视人与AI之间的关系已迫在眉睫。
在加拿大一片人迹罕至的茂密森林中,一位迷失者在手机电量仅剩3%的情况下,成功借助AI导航技术找到出路。由于信号极弱,Google Maps等传统地图服务无法使用,而ChatGPT通过实时坐标信息提供了精准引导,最终实现了一场令人惊叹的技术救援。这一事件不仅展现了AI导航在极端环境下的可靠性,也预示了其在未来户外探险和紧急救援中的巨大潜力。
近日,老黄完成了一笔高达120亿美元的种子轮融资投资,创下了该领域的最高纪录。与此同时,小额投资领域中的H20项目在中国上市后市值一夜激增1600亿美元,成为市场焦点。目前,老黄正于北京参加链博会,并宣布了一个积极的消息:H20项目已经恢复供应。据悉,包括腾讯和字节跳动在内的多家中国企业客户已排队购买H20项目的相关产品,显示出该项目在市场中的强劲需求与广泛认可。
根据METR报告,AI Agent的能力正在以指数级速度增长,在多个复杂任务中展现出接近甚至超越人类表现的潜力。无论是在软件开发、数学竞赛还是科学问答等领域,AI Agent已经能够完成人类需要50至200分钟才能解决的任务,并且其能力提升的速度令人惊叹——大约每2至6个月就能翻倍。这种快速进化不仅反映了人工智能技术的飞速进步,也预示着未来AI将在更多专业领域发挥关键作用。
本文首次深入探讨了潜空间推理领域,提出了一种全新的推理框架,不再依赖传统的Token模型。该框架涵盖了循环、递归和连续思维等多种推理形式,并对其进行了系统性的分析与总结。研究表明,这一新框架在带宽方面取得了显著提升,相比传统方法提高了2700倍以上,为未来的内容创作和信息处理提供了重要参考。