EvaLearn是由复旦大学自然语言处理实验室与字节跳动Seed等机构联合提出的一种新型大模型评测方法。该方法专注于评估大型AI模型的学习能力与效率,提供了一个全新的评测基准,从而帮助研究者从更贴近人类学习的角度理解模型的潜力。这一评测体系的提出,为衡量AI模型在不同任务中的适应性和学习速度提供了科学依据,也为未来模型优化和算法创新提供了重要参考。
近日,90后华人科学家赵晟佳正式加入Meta超级智能实验室(Meta Superintelligence Labs,简称MSL),担任首席科学家一职。赵晟佳毕业于清华大学,曾是推动ChatGPT至o3版本迭代的核心成员,在人工智能领域展现出卓越的技术洞察力与研发能力。针对这一重要人事变动,Meta首席人工智能科学家Yann LeCun公开表达了对赵晟佳加入的欢迎与期待,认为其专业背景与创新能力将为MSL在超级智能领域的前沿探索注入新的动力。
Spring AI MCP 是 Spring AI 框架中对模型上下文协议(MCP)的集成实现,为 Java 开发者提供了标准化接口,以支持与多种数据源和工具的交互。该集成方案兼容同步与异步通信模式,提升了基于 Spring 框架的 AI 应用在模型上下文管理方面的灵活性和扩展性。
毕树超,Meta公司超级智能团队的一员,在加入Meta后首次公开表达了他对人工通用智能(AGI)的看法。他回顾了人工智能领域70年的发展历程,从AlexNet引发的深度学习革命,到Transformer模型和Scaling Law推动的大型模型发展,再到强化学习与预训练技术的结合,这些技术进步都指向了AGI的实现。毕树超坚信,智能并非人类所独有,AGI的时代已经到来。
近日,由北京航空航天大学、上海人工智能实验室以及英国利物浦大学组成的研究团队提出了一种创新方法——ROME,该方法将信息瓶颈理论应用于数据集蒸馏任务,显著提升了模型的鲁棒性。这一技术的优势在于无需进行对抗训练,即可将模型的抗干扰能力提高近40%。研究团队的成果为提升模型对抗鲁棒性提供了有效的新途径,也为未来人工智能模型的优化开辟了全新思路。
阿里巴巴近日开源了一款电影级别的AI视频模型——通义万相Wan2.2。该模型基于MoE(Mixture of Experts)架构,是首个将MoE架构应用于视频生成扩散模型的实例。通义万相Wan2.2能够生成具有电影级视觉效果的视频内容,为AI视频生成领域树立了新的里程碑。值得一提的是,该模型的5B版本可以在消费级别的显卡上运行,大大降低了使用门槛,为更多开发者和创作者提供了实践和创新的可能性。
本文探讨了AI智能问答系统背后的工程技术,揭示了从用户提出问题到系统提供精确回答的完整流程。早期的AI系统主要关注于问题的识别和处理,通过不断的技术革新,现代智能问答系统已能够实现高效且精准的信息检索与回答。这一过程涉及自然语言处理、机器学习和大数据分析等多项技术的综合应用。
清华大学的研究团队近日推出了一项突破性的社会模拟项目——AgentSociety。该项目能够支持多达30,000个AI代理同时在线运行,并以其超越现实时间的处理速度而备受关注。AgentSociety不仅展示了人工智能在社会模拟领域的巨大潜力,还通过在GitHub上开源其代码,为全球开发者和研究人员提供了自由访问和使用的机会。这一举措有望激发社区对AI代理社会模拟的兴趣,推动相关技术的发展与广泛应用。
随着人工智能技术的快速发展,AI智能体的自主性问题成为关注的焦点。本文探讨了如何在提升AI智能体效率的同时,避免其失控风险,提出了一个五级自主性框架,旨在为AI开发者提供设计和治理的参考标准。通过这一框架,开发者能够更好地平衡AI智能体的自主性与人类协作之间的关系,确保AI技术的安全性和可控性。文章还强调了AI伦理在智能体设计中的重要性,呼吁行业在追求技术突破的同时,注重对AI行为的规范与监督。
尽管微软曾大力推广JavaScript作为服务端开发的首选语言,但开发者们普遍认识到其在服务端的应用存在局限性。Node.js作为JavaScript在服务端的主流运行环境,虽然在某些场景下表现出色,但其性能瓶颈逐渐显现,尤其是在高并发和计算密集型任务中。微软在最近的开发者大会上公开承认,尽管他们持续推动JavaScript在服务端的发展,但受限于物理规律和架构设计,JavaScript难以完全胜任所有服务端场景。这一现实促使开发者们开始探索其他语言和框架,以满足日益增长的性能需求。
近年来,多模态大型语言模型(MLLM)在人工智能领域取得了显著进展,但它们是否真正能够理解世界仍是一个值得探讨的问题。加州大学圣地亚哥分校(UC San Diego)在2025年的国际机器学习会议(ICML)上发表了一项重要研究,题为《Core Knowledge Deficits in Multi-Modal Language Models》。该研究系统地分析了MLLM在核心知识方面的不足,揭示了当前模型在跨模态理解和推理能力上的局限性。尽管这些模型在处理语言和图像等多模态任务中表现出色,但它们在深层次的知识整合和真实世界推理方面仍存在显著缺陷。这项研究为未来多模态模型的发展提供了重要的理论依据和改进方向。
在ICCV 2025会议上,一项名为UV-CoT的无监督视觉推理技术取得了重要进展。该技术借鉴了文本领域中的思维链(Chain-of-Thought,CoT)推理机制,并将其成功应用于视觉理解任务,从而显著增强了模型的推理能力与可解释性。通过偏好优化,UV-CoT能够重塑图像级的思维链,在无监督条件下实现更深层次的视觉推理,为未来视觉人工智能的发展提供了新的方向。
据最新统计数据显示,我国在人工智能领域上市的企业数量已超过300家,展现出人工智能行业的蓬勃发展态势。这一数字不仅体现了资本市场对人工智能技术的高度认可,也反映出我国在科技创新方面的持续投入与成果。人工智能作为新一轮科技革命的重要驱动力,正在广泛渗透至制造业、医疗、金融、教育等多个领域,推动产业智能化升级。随着政策支持和技术突破的不断推进,人工智能行业的竞争格局和发展趋势也愈发引人关注。
工信部正计划优化和完善人形机器人产业的发展政策,旨在推动相关领域的技术进步和提升市场竞争力。随着人工智能和智能制造技术的快速发展,人形机器人作为高端制造业的重要组成部分,正逐步成为全球科技竞争的新高地。通过政策引导和资源支持,工信部希望加快核心技术的突破,推动产业链协同发展,助力中国在全球人形机器人市场中占据更有利的位置。
随着5G技术的快速发展和广泛应用,其对经济增长的推动作用日益显著。根据相关数据显示,5G技术的全面部署预计将在未来十年内为全球经济贡献数千亿美元的增长。其高速率、低时延和大连接的特性,为各行各业的数字转型提供了坚实基础,尤其在智能制造、智慧城市、远程医疗和自动驾驶等领域催生了大量创新应用。5G不仅提升了生产效率,还推动了新兴产业链的形成,创造了大量就业机会。与此同时,5G与人工智能、大数据、物联网等技术的深度融合,正加速构建一个更加智能、互联的未来社会。可以预见,5G技术将成为未来经济发展的核心驱动力之一。
随着数字化进程的加速,网络安全问题日益突出,网络安全保险作为风险管理的重要工具,正迅速发展并进入快速增长阶段。根据市场研究报告,全球网络安全保险市场规模预计将在未来几年内实现显著增长,年复合增长率超过20%。这一趋势不仅反映了企业对网络攻击风险的重视,也体现了保险公司在产品创新和服务优化方面的持续努力。网络安全保险正逐步成为企业风险管理不可或缺的一部分。