近日,上海人工智能实验室的邹易澄团队与复旦大学的桂韬团队合作,推出了一种名为POLAR(策略判别学习)的预训练奖励模型。这一创新成果标志着奖励模型领域迈入了预训练的新时代。POLAR模型通过实现与绝对偏好解耦,展现出高效扩展性和强大的泛化能力,其特性类似于大型语言模型。该模型的推出为大型模型的后训练带来了突破性进展,有望解决强化学习(RL)链路扩展中的最后一环问题,推动人工智能技术迈向更高层次的发展。
随着人工智能(AI)技术的迅猛发展,来自美国科罗拉多大学丹佛分校和肯尼绍州立大学的华人科研团队提出了一种全新的AI方法论理论体系——“思想微积分”。该团队近期发布了三篇重要论文,引入了“能力实现率(CRR)”模型和“认知几何学”框架,为下一代AI的发展提供了关键理论支持。研究者认为,当前我们正处于AI发展的关键转折点——“元语言时刻”,未来将迈入“思想微积分”时代。这一理论体系被认为是人工智能领域最具前瞻性的发展之一,有望深刻影响AI的认知能力和应用边界。
近日,Meta公司发布了一份长达40页的报告,深入探讨了具身智能的未来发展方向。报告中提出了一种全新的概念——“心智世界模型”。该模型不仅能够感知和理解物理世界(如物体的运动和机械因果关系),还具备捕捉和模拟人类心理规律的能力,包括意图、情感和社会关系。与传统的世界模型(例如LeCun提出的JEPA)相比,心智世界模型实现了物理规律和心理规律的“双轨建模”,即同时考虑物理和心理两个层面,为具身智能的发展提供了全新的理论框架。
最新研究揭示,MCP协议中存在一个严重的安全漏洞,可能引发整个数据库信息泄露。这一漏洞源于LLM(大型语言模型)的指令/数据混淆缺陷,使攻击者能够通过特定手段直接访问数据库,获取敏感信息。研究人员指出,该问题影响范围广泛,尤其在依赖MCP协议进行数据传输和存储的系统中更为突出。目前,相关团队正在积极修复该漏洞,并建议用户采取临时防护措施以降低风险。
近日,Inception Labs 推出了一款名为 Mercury 的商业级大语言模型,该模型基于扩散技术构建,在代码生成方面展现出卓越性能,相较于传统自回归模型,其生成速度提升了10倍。这一突破性进展为语言模型的应用开辟了全新可能,尤其在提升开发效率和优化计算资源利用方面具有重要意义。Mercury 的推出标志着语言模型技术迈入了一个高效、快速发展的新阶段。
香港中文大学、北京大学、智平方与北京智源研究院联合研发的Fast-in-Slow(FiS-VLA)模型,在具身机器人领域实现了推理与操控能力的双重提升。该模型采用创新性的双系统架构,标志着人工智能在机器人技术中的进一步突破。FiS-VLA不仅提升了机器人的实时反应能力,还增强了其复杂环境下的决策水平,为未来智能机器的发展奠定了坚实基础。
随着云计算的快速发展,越来越多的企业将业务大规模迁移至云端,保障网络通信的高质性能成为关键。在网络传输过程中,丢包问题往往会影响业务的稳定性和用户体验。阿里云操作系统控制台通过一种高效的方法,帮助用户快速定位并解决网络丢包问题,从而确保业务的顺畅运行。本文将深入探讨这一方法的技术原理及其在实际场景中的应用价值。
数学家Boaz Klartag在非专业领域取得突破,成功解决了一个长期存在的数学难题——高维空间中的球体堆积问题。该问题的核心在于如何在特定的高维空间内实现球体的最大密度填充。Klartag的研究不仅在数学领域具有重要意义,还可能为无线通信技术的发展提供新的思路和解决方案。
在一篇探讨自然语言处理未来方向的文章中,Mamba模型的作者提出了一个极具争议的观点:“Tokens是胡扯”。文章指出,Transformer模型在处理自然语言时存在根本性的局限,而分词(Tokenization)实际上是为了解决这些缺陷而引入的一种妥协手段。作者认为,Tokenization并非技术优势,而是Transformer架构内在不足的表现。这一观点引发了对当前主流模型设计原则的深刻反思,并为下一代语言模型的发展提供了新的思路。
深度学习技术通过模拟人脑神经元网络的连接方式,使机器能够从大量数据中提取深层次的模式和信息,彻底改变了人工智能领域。在深度学习模型的训练过程中,如何高效地将数据输入模型是一个至关重要的环节。目前常用的方法包括批处理(batch processing)和小批量(mini-batch)训练。批处理利用全部数据进行计算,虽然稳定性强,但计算成本高;而小批量训练则通过每次使用部分数据更新模型参数,平衡了计算效率与模型性能,因此被广泛应用于实际场景中。
随着人工智能技术的快速发展,多智能体系统(MAS)在解决复杂问题和提升系统性能方面展现出显著优势。本文探讨了为何在特定情境下需要构建多智能体系统,并分析了互联智能系统的应用动机。通过协作与分布式处理,MAS能够有效应对单智能体难以胜任的任务需求,尤其在大规模、动态环境中表现突出。然而,设计和维护多个协作智能体也带来了诸多挑战,包括通信效率、任务分配及协调机制等问题。尽管如此,在许多领域中,这些挑战并未阻碍MAS的发展,反而促使人们放弃传统的单智能体方法,转向更灵活、高效的互联智能系统。文章进一步阐述了多智能体系统在实用性上的优势及其在解决当前技术领域紧迫问题中的关键作用。
最新研究揭示了一种名为ASA(安全攻击)的新型威胁,该攻击方式对所有开源的大型模型构成了显著的安全风险。研究人员不仅深入分析了此类攻击的脆弱性,还开发了一个标准化评估工具——ASABench,用于衡量模型在面对ASA攻击时的安全性表现。此外,他们提出了一种高效的防御机制LAPT,旨在有效抵御ASA攻击,从而提升模型的安全防护水平。这项研究为开源模型的安全性问题提供了系统性的解决方案,并为未来的研究奠定了基础。
近日,来自卡耐基梅隆大学(CMU)、阿联酋穆罕默德·本·扎耶德人工智能大学(MBZUAI)和加州大学圣迭戈分校(UCSD)的研究者们对当前人工智能领域的一个热门话题——世界模型(World Models)进行了深入探讨。研究团队指出了世界模型在实际应用中面临的五大局限性,并提出了一种新的研究范式,旨在克服这些关键挑战。这一新方法为未来的人工智能发展提供了重要的理论支持和技术方向。
据麻省理工学院(MIT)最新研究显示,AI在与患者进行交流时,若患者输入的信息中存在拼写错误或使用非正式语言,AI更倾向于建议患者无需就医。这一现象引发了对AI医疗系统准确性和可靠性的讨论。研究指出,AI可能因语言表达的不规范而误判病情的严重程度,从而影响患者的健康决策。随着AI在医疗领域的广泛应用,如何提升其对多样化语言输入的理解能力成为亟待解决的问题。
在ICCV 2025会议上,UniOcc项目被正式介绍为一个面向自动驾驶领域的综合性数据集和基准测试平台。该项目完全开源,旨在支持多种任务,包括空间占用预测、长期序列预测以及动态目标追踪。UniOcc的推出为自动驾驶技术的研究提供了标准化的感知环境,推动了多模态技术和更强泛化能力的发展。
在被称为“人类最后的考试”(HLE)的全球性技术挑战中,上海交通大学联合深势科技团队凭借其开源方案取得了32.1分的优异成绩,刷新了该领域的历史记录。这一突破不仅展现了团队在人工智能与大模型技术上的深厚积累,也标志着中国科研力量在全球竞争中的崛起。此次成绩超越了包括OpenAI和谷歌在内的国际顶尖机构,为开源技术的发展注入了新的活力。