技术博客

破解大模型训练难题：AdamW与Muon之间的平衡之道

在大型语言模型（LLM）的训练优化领域，如何兼顾训练稳定性与收敛速度一直是核心挑战。AdamW凭借其对权重衰减的精确控制，成为稳定训练的主流选择；而Muon则以快速收敛著称，但在稳定性上有所欠缺。华为诺亚实验室提出的开源算法ROOT，旨在破解这一“既要又要”的难题。通过融合AdamW的稳定机制与Muon的加速特性，ROOT在多个大模型训练任务中实现了更优的平衡，显著提升了训练效率与模型性能。该算法为大模型优化提供了新的技术路径，具有广泛的应用前景。

大模型AdamWMuonROOT训练

2025-11-27

NeurIPS 2025会议：Qwen团队门控注意力研究获最佳论文奖

在2025年神经信息处理系统大会（NeurIPS）上，阿里巴巴旗下的Qwen团队凭借其在门控注意力机制方面的创新研究荣获最佳论文奖，该成果显著提升了大模型在长序列建模中的效率与性能。与此同时，何恺明因其在计算机视觉领域的奠基性工作——Faster R-CNN，被授予时间检验奖。该论文自2015年发表以来，持续影响目标检测领域的发展，成为引用次数最高的AI论文之一。本届NeurIPS奖项的揭晓，再次凸显了中国学者与团队在全球人工智能前沿研究中的重要贡献。

NeurIPSQwen门控注意力何恺明Faster R-CNN

2025-11-27

脑机接口：构建智能桥梁的未来

脑机接口（Brain-Computer Interface, BCI）被视为连接人类智能与人工智能的“智能桥梁”，其核心在于高效、精确地解码复杂的脑信号。当前研究聚焦于提升脑信号的识别精度与实时处理能力，以实现与通用人工智能（AI）系统的无缝对接。通过融合先进的解码技术与深度学习模型，研究人员已在运动意图识别和语言重建方面取得突破，部分实验系统解码准确率超过90%。随着非侵入式与侵入式技术的协同发展，BCI有望在医疗康复、智能交互等领域推动人机融合的实质性进展。

脑机接口智能桥梁脑信号解码技术通用AI

2025-11-27

群舞技能在元宇宙数字人领域的应用与创新

随着元宇宙和数字人技术的快速发展，音乐驱动的群舞生成在虚拟娱乐、社交互动等领域需求日益增长。然而，现有技术常面临舞者间碰撞、动作不自然及长序列舞蹈稳定性差等挑战。为此，南京理工大学、清华大学与南京大学联合提出了一种端到端的新型模型TCDiff++，有效突破了多人舞蹈生成的技术瓶颈。该模型通过精细化运动控制与时空协调机制，实现了高质量、长时间且无碰撞的群体舞蹈自动生成，显著提升了舞蹈动作的自然性与时序连贯性，为元宇宙中的虚拟角色交互提供了创新解决方案。

元宇宙数字人群舞生成TCDiff++音乐驱动

2025-11-27

PartCrafter：解构与重塑3D模型的革命性突破

首个3D生成解构模型PartCrafter的问世标志着计算机图形学领域的一项重大突破。该模型在GitHub上线后迅速获得超过2000个星标，展现出广泛的技术关注与行业认可。PartCrafter能够基于单张图像生成可编辑的3D模型，突破了传统3D生成模型将整体结构视为不可分割“黑箱”的局限，首次实现对模型各组成部分的精细化解构与独立调整。这一创新为内容创作、工业设计和虚拟现实等领域提供了更高的灵活性与实用性，推动3D内容生成向更具交互性与可操作性的方向发展。

3D生成解构模型PartCrafter可编辑图形学

2025-11-27

月之暗面：揭秘强化学习训练加速新方法

月之暗面近日公开其在强化学习训练中的加速方法，显著提升了模型训练效率。该方法使训练速度提高了97%，同时将长尾延迟降低了93%，有效优化了整体训练性能。尽管在模型能力增强的同时，Rollout阶段的推理速度出现一定程度的下降，但该技术仍为大规模强化学习的高效训练提供了重要解决方案，展现出在复杂任务场景下的广泛应用潜力。

月之暗面强化学习训练加速效率提升延迟降低

2025-11-27

代码之舟：大型项目代码转换为Wiki文档的探险之旅

在面对老旧系统的项目维护难题时，自动化文档生成成为提升效率的关键手段。某技术团队成功将包含10000个代码文件的大型遗留项目，通过定制化脚本与解析工具，批量转换为结构清晰的Wiki文档。该过程显著降低了理解成本，提升了代码可维护性，解决了传统人工注释耗时长、易遗漏的问题。这一实践表明，借助代码转换与Wiki生成技术，可有效应对复杂系统中的知识传递挑战，为项目维护提供可持续支持。

代码转换Wiki生成项目维护老旧系统文档自动化

2025-11-27

Meta的重磅收购：AI芯片市场迎来新格局

Meta公司近日以数十亿美元的价格收购了谷歌的AI芯片业务，这一重大交易标志着AI芯片市场竞争格局的深刻变革。此次合作不仅强化了Meta在人工智能基础设施领域的布局，也凸显了谷歌在自研芯片技术上的战略调整。受此影响，英伟达在AI芯片市场的份额预计可能下降10%，面临前所未有的竞争压力。随着谷歌、Meta与英伟达三方在技术、资本和生态上的全面角力，AI芯片市场正逐步形成三足鼎立的竞争态势，未来产业格局或将迎来更多变数。

Meta收购AI芯片谷歌合作英伟达压力三足鼎立

2025-11-27

腾讯混元3D技术：打造三维宇宙的智能仿真前沿

腾讯AI的“混元3D”技术起源于游戏工厂，现已发展为空间智能仿真的前沿力量。依托腾讯云国际站的上线，该技术加速推进AI出海战略，构建全球化的三维宇宙。凭借高精度建模与实时渲染能力，混元3D在虚拟现实、智能制造等领域展现广泛应用前景。其全球化布局标志着腾讯在国际AI竞争中采取侧翼突围策略，强化中国模型在全球市场的影响力。

混元3D腾讯云空间智能AI出海三维宇宙

2025-11-27

小米机器人项目：招募顶尖人才推动技术革新

小米公司近期在机器人技术领域加速布局，积极招募全球顶尖人才。据悉，前特斯拉Optimus项目工程师已加入小米机器人团队，进一步强化其研发实力。灵巧手项目迎来关键进展，原团队成员卢泽宇在社交平台公开宣布加盟小米，并出任灵巧手项目负责人，引发业界关注。此次人才引进凸显小米在智能机器人领域的战略布局与长期投入，旨在推动灵巧操作技术的突破与商业化应用。

小米机器人灵巧手人才招募特斯拉卢泽宇

2025-11-27

AI眼镜革新：夸克AI眼镜系列携千问智能助手震撼上市

夸克AI眼镜系列正式发布，首次搭载千问智能助手，标志着智能穿戴设备在交互体验与影像能力上的全新突破。该系列产品支持0.6秒快速拍照和4K高清视频输出，满足用户对即时记录与高质量影像的需求。此次共推出六款型号，涵盖两大类别，覆盖多元使用场景，起售价为1899元，旨在为用户提供兼具科技感与实用性的智能生活新选择。

AI眼镜千问助手快速拍照4K视频智能穿戴

2025-11-27

Apache Doris与AI技术的融合：字节跳动引领数据处理革命

随着人工智能技术在业务流程中的深度集成，字节跳动依托Apache Doris实现了数据处理与消费方式的显著革新。通过AI驱动的智能查询优化与自动化数据分析，Doris在实时性与并发性能上提升了40%以上，支撑了字节跳动旗下多款产品每日超千亿条数据的高效处理。AI不仅加速了数据摄入与查询响应，更推动了从“被动查询”到“智能推荐”的消费模式转变，实现数据价值的主动释放。这一融合标志着AI革新在大数据架构中的核心作用，为行业提供了可复用的技术范式。

AI革新数据处理智能消费Doris字节

2025-11-27

AI赋能内容创作：姚霆博士AICon北京站演讲精华解读

智象未来联合创始人姚霆博士将出席AICon北京站，围绕多模态大模型在内容创作领域的革新性应用展开深度探讨。他将分享智象未来如何通过技术突破，使AI更深入地理解创作者意图，实现精准化、可控化的内容生成，推动内容创作从效率到质量的全面提升。此次演讲聚焦于多模态大模型如何融合文本、图像、音频等多元信息，赋能创作者在复杂场景下的表达需求，展现人工智能与创意产业深度融合的前沿实践。

智象未来姚霆博士AICon多模态内容生成

2025-11-27

快手团队NeurIPS 2025新成果：TagCF框架革新推荐系统

快手团队在NeurIPS 2025会议上展示了其最新研究成果TagCF框架。该框架由快手消费策略算法团队联合快手基础大模型与应用部及武汉大学共同提出，旨在提升推荐系统的可解释性与精准度。TagCF不仅能够识别用户偏好（“知其然”），更能深入解析偏好的成因（“知其所以然”），从而实现对用户兴趣的深层理解。这一创新为推荐系统在内容分发、用户建模等场景中的应用提供了新的技术路径，标志着快手在智能推荐领域的持续领先。

推荐系统TagCF框架用户偏好快手团队NeurIPS

2025-11-27

一探究竟：北京大学与字节跳动联合研发的3D生成解构模型PartCrafter

由北京大学、字节跳动与卡耐基梅隆大学联合研发的首个3D生成解构模型PartCrafter，近日在GitHub上发布并迅速引发关注，星标数已突破2000个，跻身GitHub热榜。该模型开创性地实现了对3D内容的智能解构与生成，为三维建模、虚拟现实和内容创作等领域提供了高效、精准的技术支持。研究团队融合深度学习与几何分析技术，显著提升了复杂3D结构的分解与重建能力。PartCrafter的开源发布不仅推动了3D生成技术的普及，也展现了中国高校与科技企业在前沿AI领域的协同创新能力。

3D生成解构模型PartCrafter北大研发GitHub热榜

2025-11-27

从杂乱无章到井井有条：10000个代码文件的高效整理历程

在极短的时间内，作者成功将包含约7500个文件的Terminal代码仓库整理为结构清晰的Wiki知识库，整体过程高效且系统化。该仓库涵盖C++、C#、JSON、XML及Markdown等多种编程语言和技术格式，总文件量接近10000个。通过自动化脚本与标准化分类策略，实现了代码文件的快速解析、归类与文档化转换，极大提升了信息检索效率与知识复用价值。此次实践展示了在复杂文件管理场景下，高效转换与知识体系构建的可能性，为开发者和内容管理者提供了可借鉴的解决方案。

代码整理知识库高效转换编程语言文件管理

2025-11-27

AI热点

2025-12-29

多端登录功能实现的优雅方案：工厂模式与策略模式的融合应用

科技热点

多端登录功能实现的优雅方案：工厂模式与策略模式的融合应用