在过去一周内,开源Qwen模型连续三次斩获冠军,显著超越了多个闭源模型,成为基础模型推理和编程领域的佼佼者,达到了当前最佳水平(SOTA)。其卓越的表现不仅巩固了其在通用问答领域(通义千问)的竞争地位,也使得该领域的竞争形势愈发激烈。开源Qwen的持续突破,为人工智能模型的发展注入了新的活力。
近日,香港科技大学与北京人形机器人研究所联合提出了一种全新的足式机器人全域目标追踪范式——LOVON,旨在解决复杂开放环境中机器人自主执行长程多目标任务的难题。LOVON使足式机器人能够像人类一样,灵活完成诸如先移动到椅子旁、再迅速接近行人等连续任务。传统方法在面对运动中的视觉抖动、目标丢失等实时问题时表现不佳,导致机器人易出现迷路或识别错误。LOVON的提出标志着足式机器人在自主任务执行能力上的重大突破。
随着大型推理模型在复杂任务中的表现不断提升,一种结合强化学习(RL)与软性函数变换(SFT)优势的训练方法——ZERO-RL,正成为推动这一进步的核心技术。该方法通过可验证奖励强化学习(RLVR)动态引导模型,逐步增强其在强推理场景中的首次通过率(pass@1),从而显著提高模型效率。新一代模型如OpenAI-o3、DeepSeek-R1和Kimi-1.5已成功应用该技术,在数学和编程等高难度推理任务中展现出卓越能力。
近年来,大型语言模型(LLMs)在处理复杂推理任务方面展现出卓越的能力,这一进步主要得益于过程级奖励模型(PRMs)的支持。PRMs 在多步推理过程中发挥着关键作用,通过评估模型在每一步推理中的表现,指导其学习方向,从而提升整体推理能力。这种精细化的评估机制使 LLMs 能够更有效地应对复杂的决策流程,推动人工智能在自然语言处理领域的进一步发展。
本文基于上海AI实验室与北京航空航天大学合作开展的研究,探讨了家用智能设备可能存在的安全隐患。研究团队由多位跨校联合培养的博士生组成,包括上海AI实验室与上海交通大学联合培养的博士生卢晓雅、北京航空航天大学的博士生陈泽人,以及上海AI实验室与复旦大学联合培养的博士生胡栩浩。研究围绕当前广泛使用的智能设备展开,揭示了其在安全性方面存在的潜在风险,旨在引起公众对智能设备使用安全的关注,并为未来智能设备的设计与监管提供参考。
随着大型人工智能模型的快速发展,隐私安全与公平性之间的矛盾日益突出,二者关系被形象地比喻为“跷跷板效应”。近日,中国人民大学与上海人工智能实验室联合研究发现了一种可能的最佳平衡法则,为解决大型模型在伦理对齐问题上提供了新思路。该研究揭示了隐私保护与算法公平性之间的复杂关系,并尝试通过创新方法实现两者的协同优化。这一成果为人工智能伦理治理提供了重要的理论支持,也为未来模型设计提供了实践指导。
上海交通大学的研究团队在《Nature》子刊上发表了一项突破性研究成果,该团队成功开发了一种结合无人机物理建模与深度学习的端到端方法。这一创新方案使无人机集群能够实现高效自主导航,同时具备轻量化、可部署性以及协同作业能力。与现有技术相比,该方法在鲁棒性和机动性方面表现出了显著优势,为无人机集群系统的实际应用提供了全新思路和技术支持。
在2025年世界人工智能大会(WAIC)上,XREAL首次展示了其旗舰产品One Pro,标志着AR(增强现实)与AI(人工智能)融合迈入新纪元。作为一家致力于将尖端技术无缝融入日常生活的科技公司,XREAL通过其轻便的智能眼镜系列产品,正在重塑人们的交互方式和生活方式。随着人工智能技术的不断进步,XREAL将智能设备从单一的显示工具转变为智能空间中的AI伙伴,为用户带来更自然、更直观的数字体验。这一技术融合不仅展现了XREAL在AR与AI领域的领先地位,也为未来智能生活描绘了全新图景。
随着大型语言模型在各行业的广泛应用,其在处理复杂问题时可能出现的“幻觉循环”现象,即模型生成看似合理但实际存在逻辑错误或不准确的输出,已成为企业面临的关键挑战。这种问题不仅影响用户体验,还可能带来严重的决策风险。为确保输出的准确性和可靠性,企业需要通过工程化手段对模型进行有效管理和约束。这些手段包括构建高质量的训练数据集、引入多模型交叉验证机制、优化推理算法以减少不确定性,以及建立完善的后处理校验流程。通过这些措施,可以在提升模型性能的同时,降低其产生错误输出的可能性,从而增强用户对模型输出的信任度。
在AI驱动的软件开发趋势下,Trae插件作为一款高效的Agent代码编辑工具,正在逐步改变代码协作与开发实践。字节跳动架构师冯绪将在AICon北京会议上分享Trae插件在实际项目中的落地经验,涵盖其在代码生成、智能补全和自动化调试方面的应用。这一分享旨在帮助开发者更好地理解Trae插件的技术优势,并探索其在复杂系统架构中的潜力。
近日,Perplexity公司推出了一款创新型网络浏览器——Comet,其设计核心在于将人工智能助手的自然语言交互功能深度融入用户的浏览体验。Comet通过智能语言模型,让用户能够以更直观、自然的方式与网页内容互动,极大提升了信息获取的效率和用户体验。这款浏览器不仅优化了传统浏览功能,还重新定义了人机交互在数字环境中的可能性,为未来网络交互设计提供了全新思路。
在快速变化的技术行业中,包容型领导力已成为推动组织长期成功的关键因素。这种领导方式不仅关注多元化团队的构建,更强调在组织文化的各个层面持续贯彻包容性原则。技术组织若希望在激烈的竞争中保持创新活力与持续发展,就必须将包容型领导力视为核心战略,而非一项短期任务。通过营造开放、尊重和协作的工作环境,包容型领导力能够激发员工的创造力与归属感,从而提升整体绩效和组织凝聚力。
在数字化转型的浪潮下,企业纷纷将业务系统迁移至云端,以提升效率和灵活性。尤其在金融行业,由于监管机构对安全与合规性的严格要求,如数据本地化存储、加密传输及基础设施资源控制等,私有云逐渐成为主流选择。国投瑞银在这一趋势中,成功实践了基于Kubernetes的双集群高可用架构设计,有效满足了金融行业对云服务的特殊需求。该架构不仅提升了系统的稳定性与容灾能力,还为企业在合规性与资源控制方面提供了有力保障,为金融行业的云化转型提供了可借鉴的范例。
随着Coze的开源发布,业界普遍认为其可能对Dify构成一定的竞争压力。Coze开源后,本地部署的案例逐渐增多,这引发了社区内的广泛讨论和关注。许多开发者和企业开始探索Coze的本地部署能力,以评估其在实际应用中的潜力。这一趋势不仅反映了Coze在技术上的吸引力,也表明开源模式正在激发更多创新可能性。业界对Coze与Dify之间的潜在竞争格局保持高度关注,期待看到两者在未来如何推动行业发展。
阿里巴巴集团近日首次对外披露了其夸克AI眼镜项目的最新研发进展,标志着公司AI To C战略正式迈入硬件领域。作为一项长期保密的产品,夸克AI眼镜的亮相展现了阿里巴巴在人工智能消费级硬件领域的布局意图。该项目不仅体现了阿里巴巴对AI技术落地的深度探索,也彰显了其在智能穿戴设备市场的潜在竞争力。通过这一创新产品,阿里巴巴希望将AI技术更紧密地融入用户的日常生活场景。
京东云近日宣布正式开源其企业级智能体JoyAgent,这一举措标志着行业内首个完全开源的企业级智能体的诞生。JoyAgent不仅实现了产品级的开源,还涵盖了前端、后端、框架、引擎以及核心子智能体的所有部分,为开发者和企业提供了全面的技术支持。此次开源行动彰显了京东云在智能体技术领域的领先地位,也为推动企业智能化转型提供了全新的可能性。




