华为正式宣布开源其首个Serverless分布式计算引擎openYuanrong,标志着其在分布式计算领域的重大技术突破。该引擎以“单机编程、分布式运行”为核心设计理念,显著降低了分布式应用的开发复杂度,同时提升了运行效率。凭借卓越的性能表现,openYuanrong已在华为MetaERP、小艺、华为云、终端云、ICT及海思等多个核心产品与平台实现规模化应用,展现出强大的技术支撑能力。此次开源不仅是华为长期技术积累的成果展示,也体现了其推动全球开发者共建开放生态的战略布局。
近期,关于虚拟 DOM 可能被逐步淘汰的讨论引发前端社区广泛关注。随着 Vite 生态的持续演进,创始人尤雨溪正推动其从“极速构建工具”向完整技术生态转型。从 Vite+ 的商业化探索、Oxlint 的性能优化,到 DevTools、Nitro 服务器、Vitest 4.0 以及自研打包器 Rolldown 的更新,Vite 已不再局限于速度竞争,而是致力于构建一个自洽且可盈利的生态系统。这一系列动作表明,Vite 正在通过深度整合开发工具链,强化其在前端领域的战略地位。
在TPAMI 2025的研究中,针对AI对抗迁移性评估的关键问题进行了深入探讨。研究指出,对抗样本的迁移性——即在某一模型上生成的对抗样本可有效误导其他未知模型——是评估黑盒深度学习系统安全性的核心指标。然而,当前研究存在两大短板:其一,缺乏在公平超参数设置下对同类迁移攻击方法的系统性对比;其二,对攻击隐蔽性的评估仍局限于单一指标,缺少多样性度量标准。该工作呼吁建立统一、公正的评估框架,以推动对抗迁移攻击研究的可比性与实用性。
最新研究进展显示,VAE(变分自编码器)在图像生成领域的主导地位正面临挑战。清华大学与快手可灵团队联合推出的SVG扩散模型,摒弃了传统的VAE架构,在训练效率方面实现突破性提升,训练速度较传统方法加快6200%。同时,该模型在图像生成速度上也提升了3500%,显著优化了整体性能。这一成果紧随谢赛宁关于“VAE在图像生成中或已过时”的观点,标志着图像生成技术正加速向更高效、更快速的方向演进。
AlphaGo之父近日提出一种全新的强化学习算法设计方法,首次实现人工智能系统自主设计高效AI算法。该方法突破传统依赖人工调参与模型设计的局限,通过引入自进化机制,使AI在复杂环境中自我优化并生成新型学习策略。这一进展不仅提升了算法开发效率,也为强化学习在游戏、机器人及自动化决策等领域的应用开辟了新路径。相关研究已在国际顶级人工智能会议上发表,引发广泛关注。
华南理工大学与深圳北理莫斯科大学开展技术合作,成功研发出两项联邦学习领域的创新技术——FedMSBA与FedMAR。该技术有效提升了联邦学习系统的安全性能,能够精准防御数据投毒攻击并防止梯度信息泄露,显著增强了数据安全与隐私保护能力。研究成果已发表于国际权威期刊《IEEE Transactions on Mobile Computing》(TMC),为物联网与人工智能应用提供了可靠的技术支撑。此项突破不仅推动了AI创新的发展,也为个人数据隐私构建了更加坚实的防护屏障。
由OpenAI投资研发的AI驱动人形机器人NEO正式上市,引发广泛关注。该机器人专为家庭场景设计,月薪成本仅相当于3500元人民币的人力支出,具备高度智能化的服务能力。NEO早鸟价为20000美元,折合人民币约141978元,适合一次性购入;同时提供灵活的月租方案,每月499美元,约合人民币3542元,降低使用门槛。凭借先进的AI技术与人性化设计,NEO有望重塑家庭服务模式,推动智能机器人普及进程。
近期,随着虚拟DOM的讨论逐渐升温,尤雨溪主导的Vite正经历从高效构建工具向完整生态系统的战略转型。通过推出Vite+、Oxlint、官方DevTools、Nitro服务器运行时、Vitest 4.0测试框架以及新兴的Rolldown打包器,Vite已构建起覆盖开发、测试、部署与性能优化的闭环生态。这一系列动作不仅强化了其在前端工具链中的核心地位,也暗示了未来可能的商业化路径。Vite生态的持续演进,标志着其从开源项目向可持续发展模式的重要跨越。
字节跳动即将推出名为“Vue Native”的全新项目,旨在推动Vue框架在原生应用开发领域的深度应用。该项目通过实现框架融合,使开发者能够使用Vue语法直接构建高性能原生移动应用,降低跨平台开发的技术门槛。据官方透露,Vue Native将无缝兼容现有Vue生态,让全球超过200万Vue开发者无需额外学习成本即可实现向原生开发者的转型。此举有望重塑前端开发格局,提升开发效率并加速产品迭代周期,进一步巩固字节跳动在开源技术领域的影响力。
GigaBrain-0作为中国首个基于世界模型驱动的端到端视觉语言联合模型(VLA),已正式对外开源。该模型采用创新的世界模型生成数据技术,显著提升了在真实设备上的泛化能力,处理数据量可达传统方法的10倍,并在实际部署中性能超越当前最佳水平(SOTA)。GigaBrain-0的发布标志着我国在视觉语言模型领域实现了从数据生成到实际应用闭环的重要突破,为人工智能系统的自主决策与环境交互提供了全新范式,具有广泛的应用前景与研究价值。
长期以来,全球生成模型研究高度依赖变分自编码器(VAE)进行像素空间建模。然而,阿里巴巴旗下高德地图近期提出了一种全新的训练框架——EPG(Efficient Pixel Generation),为像素生成提供了不依赖VAE的高效路径。该框架通过简化模型结构与优化训练流程,在多个基准测试中展现出优于传统VAE方法的生成质量与计算效率,标志着生成模型技术迈入新阶段。EPG框架的提出,不仅降低了对VAE架构的依赖,也为工业级图像生成应用提供了更具扩展性的解决方案。
美团技术团队近日推出名为LongCat-Video的视频生成模型,具备136亿参数,能够在数分钟内高效生成720p分辨率、每秒30帧的高质量视频内容。该模型在文本到视频、图像到视频以及长视频续写等多个任务中表现出卓越性能,生成效率相较传统方法提升达10倍,显著推动视频生成技术的发展。
清华大学姚班团队近日推出一款名为Dexbotic的开源工具箱,该工具箱基于PyTorch框架构建,专注于视觉语言动作(Vision-Language-Action, VLA)模型的研究与应用。Dexbotic旨在为学术界与工业界提供一个通用、高效的技术基础,推动VLA模型在机器人感知、决策与控制等领域的深度融合与实际部署。通过开源方式,团队希望促进技术共享与协作创新,加速智能系统从理论研究向现实场景的转化。
中国科学院智能信息处理重点实验室近日发布了名为Auto-RAG的前沿技术,标志着Agentic RAG领域的重要突破。与传统RAG模型依赖“先检索、后生成”的线性流程不同,Auto-RAG依托大型语言模型(LLM)的自主决策能力,构建了从检索规划、信息提取到答案推断的闭环推理机制。该技术能够动态调整信息检索策略,模拟人类侦探式的思维过程,显著提升了复杂问答任务中的准确性和适应性,为智能信息处理开辟了新路径。
卡内基梅隆大学与斯坦福大学的研究团队首次全面追踪了AI的“工作流”,揭示AI正通过编程方式重新定义办公逻辑。研究显示,AI不再局限于代码生成或内容创作,而是将PPT制作等任务视为函数调用,实现无需鼠标操作的全自动化办公。这一“编程办公”模式标志着AI从模仿人类转向以程序化思维执行任务,显著提升效率并打破传统工作边界。该实验不仅展示了“函数PPT”和“无鼠标交互”的可行性,更预示着职场运作逻辑的深层变革,为未来人机协作提供了全新范式。
MetaAI的最新研究揭示,即便在Transformer模型已高度发展的背景下,对其自回归机制进行微小而深入的调整,仍可显著提升模型性能,最高增幅达55%。该优化仅增加3%的计算成本,却实现了效率与效果的双重突破。研究表明,在成熟的技术架构中,通过精细的微调与创新,依然能够挖掘巨大潜力,为未来模型优化提供了新方向。




