技术博客

“星绽OS:引领开源系统内存管理新篇章 —— SOSP2025最佳论文奖解读”

在2025年SOSP会议上,关于开源操作系统“星绽OS”在高可扩展内存管理方面的研究荣获最佳论文奖。SOSP作为计算机系统领域的顶级会议,素有该领域“奥运会”之称,此次获奖凸显了“星绽OS”在系统架构创新上的国际影响力。该研究提出了一种新型内存管理机制,显著提升了大规模并发场景下的内存分配效率与系统可扩展性,为未来高性能计算与云计算平台提供了重要技术支撑。

SOSP开源系统星绽OS内存管理可扩展
2025-10-16
AI新“蜀”光:引领西部科创高地崛起

2025年10月25日,GTLC全球科技领导力大会·成都站将在成都菁蓉国际盛大启幕,聚焦“AI新‘蜀’光如何点亮西部科创高地”这一核心议题。本次大会汇聚全球科技领袖、创新企业与科研机构,共同探讨人工智能在西部地区科技创新中的关键作用。以“AI蜀光”为象征,展现成都作为国家重要科技高地的崛起之势,推动“成都智造”迈向国际化舞台。通过前沿技术分享、产业合作对接与创新成果展示,大会将为西部科创生态注入新动能,助力构建高质量发展的科技新格局。

AI蜀光西部科创GTLC大会成都智造科技高地
2025-10-16
频率动态注意力调制(FDAM):革新视觉Transformer的细节处理能力

在ICCV 2025会议上,研究者提出了一种名为FDAM(频率动态注意力调制)的创新技术,旨在解决视觉Transformer(ViT)因低通滤波特性导致的高频细节损失问题。受电路理论启发,FDAM通过反转注意力机制生成高频补偿信号,并对特征频谱进行动态调整,在几乎不增加计算负担的前提下显著提升模型性能。实验表明,该方法在图像分割、目标检测等密集预测任务中表现优异,达到与当前最佳技术(SOTA)相媲美的效果。

FDAM视觉Transformer高频补偿注意力机制图像分割
2025-10-16
深入探讨NeurIPS 2025:条件表征学习的多维信息捕捉

在NeurIPS 2025的Spotlight环节中,研究者深入探讨了条件表征学习在图像理解中的关键作用。传统表征学习方法,如基于ImageNet预训练的ResNet或Vision Transformer,通常仅能识别图像的主体内容,例如将图片分类为“大象”,却忽略了数量、背景等多维语义信息。然而,如图1所示,一张图像包含丰富的多层次信息:主体为大象、数量为两头、环境为热带稀树草原。这些维度共同构成完整的视觉语义。条件表征学习通过引入条件控制机制,能够解耦并分别建模不同语义维度,从而实现更精细、更全面的图像理解,推动图像识别从单一标签向多维语义解析演进。

表征学习多维信息条件学习图像识别NeurIPS
2025-10-16
A-MemGuard:AI防御新篇章——大型语言模型记忆保护系统解析

近期,NTU等研究机构联合开发了A-MemGuard,一种专为大型语言模型(LLM)代理记忆模块设计的新型防御系统。该系统通过引入共识验证机制与双层记忆结构,有效应对上下文依赖及自我强化错误循环等关键问题,推动AI防御从被动转向主动。在实际测试中,A-MemGuard对记忆投毒攻击的防御成功率超过95%,显著提升了LLM系统的安全性与可靠性,为AI记忆保护提供了创新解决方案。

AI防御记忆保护LLM安全共识验证投毒防护
2025-10-16
基础模型的崛起:引领科研进入第五范式

基础模型(FM)作为一种在大规模数据集上训练的人工智能系统,展现出卓越的通用性与跨领域应用潜力。香港科技大学的最新研究综述了113篇相关论文,提出基础模型有望推动科学研究迈入第五范式,实现以数据驱动和模型泛化为核心的全新科研方式。然而,研究同时指出,大型模型中存在的偏见、幻觉等问题不容忽视,需通过技术优化与伦理规范加以解决,以确保其在科学探索中的可靠性与公平性。

基础模型第五范式人工智能研究综述模型偏见
2025-10-16
智能研发新篇章:网易CodeWave开启自动化智能开发时代

网易CodeWave是一款面向企业研发领域的人工智能开发平台,致力于构建更可控、更规范、更实用的智能研发环境。该平台融合可视化操作与人工智能技术,实现开发流程的自动化,显著提升研发效率。同时,网易CodeWave保留了人工干预和细节调整的空间,确保开发过程的灵活性与精准性。通过降低技术门槛并强化流程管理,该平台为企业提供了一种高效且可靠的智能开发解决方案。

智能开发可视化自动化研发平台人工干预
2025-10-16
多模态大型语言模型在视觉任务中的突破:PaDT模型的创新与成就

近年来,多模态大型语言模型(MLLMs)在图文理解与视觉问答等任务中取得了显著进展,但在目标检测和实例分割等依赖精确空间感知的场景中仍表现不足。颜水成团队联合发布的PaDT多模态大模型,突破了传统方法对坐标猜测的依赖,首次实现了真正的多模态表征输出,显著提升了模型在空间定位任务中的准确性与鲁棒性。该模型通过深度融合视觉与语言信息,为复杂视觉理解任务提供了更可靠的解决方案,推动了多模态大模型在精细化感知领域的应用发展。

多模态大模型目标检测视觉问答空间感知
2025-10-16
RoboChallenge项目革新:全球首个真机多任务基准测试集面世

近期,RoboChallenge项目宣布推出全球首个大规模、多任务的真机基准测试集,标志着具身智能领域迈入新阶段。该测试集在真实物理环境中运行,由真实机器人执行包括抓取、导航、交互在内的多种操作任务,突破了以往依赖仿真环境的局限。这一进展被视为具身智能领域的“ImageNet时刻”,为机器人技术的性能评估与横向比较提供了统一标准,极大推动了算法优化与系统迭代。该基准集的发布不仅提升了研究透明度,也为工业界与学术界搭建了协同创新的桥梁。

Robo挑战真机测试多任务具身智能基准集
2025-10-16
阿里新动作:Qoder CLI AI编程工具革新开发体验

阿里巴巴集团近日发布了一款名为Qoder CLI的AI编程工具,旨在提升全球开发者的编码效率。该工具支持通过命令行界面实现代码生成、调试与一键部署,简化开发流程。即日起,全球用户可在任意命令行终端中访问并使用Qoder CLI,无需复杂配置即可享受人工智能辅助编程带来的高效体验。作为阿里在AI赋能软件开发领域的最新实践,Qoder CLI展现了其推动技术普惠与开发自动化的战略布局。

阿里发布AI编程QoderCLI命令行一键部署
2025-10-16
软件架构:组织沟通与决策模式的映射

软件架构不仅是技术设计的体现,更是组织内部沟通模式与决策过程的映射。系统故障往往源于激励机制不匹配、权责不清及组织结构缺陷,而非单纯的技术问题。架构师的核心任务,是构建一个支持系统持续发展的生态环境。通过引入平台思维,促进团队自主性,降低协作摩擦,从而提升整体系统的健康度与韧性。

架构映射组织沟通决策模式平台思维系统健康
2025-10-16
端侧大模型:破解AI应用的成本与隐私难题

随着大模型技术的不断进步,AI应用在体验、成本与隐私性方面面临新的挑战与机遇。将大模型部署于终端侧,可显著降低数据传输延迟、减少云端依赖,并提升用户隐私保护水平。然而,端侧部署需应对模型规模庞大与计算复杂度高的难题,当前受限于设备算力与存储资源,仍存在落地瓶颈。通过模型压缩、量化与高效推理引擎等技术手段,已在部分场景实现轻量化部署。未来,随着芯片性能提升与算法优化协同推进,端侧大模型有望在智能手机、物联网及边缘设备中广泛应用,推动AI应用向更高效、更安全的方向发展。

大模型端侧部署AI应用计算复杂隐私性
2025-10-16
中间件的演进:从云原生到智能原生技术

在分布式计算与云原生技术快速发展的背景下,中间件通过屏蔽底层复杂性、提供标准化接口,显著提升了软件开发效率。当前,AI中间件正扮演类似角色,助力开发者应对模型集成、算力调度与数据管理等挑战。文章探讨了从云原生向“智能原生”演进的技术路径,提出通过构建统一的AI中间件层,实现AI能力的高效复用与敏捷开发,从而解决AI应用开发中的碎片化、高门槛和运维复杂等核心问题。

中间件云原生智能原生AI开发分布式
2025-10-16
PlanetScale推出托管式分片PostgreSQL服务:引领数据库技术新篇章

PlanetScale公司近日宣布推出其全新的托管式分片PostgreSQL服务,旨在为运行在AWS或Google Cloud上的应用提供卓越的性能与高可靠性。该服务扩展了PlanetScale的产品生态,使其从基于Vitess构建的MySQL平台延伸至PostgreSQL用户群体,满足日益增长的多样化数据库需求。通过自动化分片架构,该服务可实现无缝水平扩展,提升查询效率并保障系统稳定性,适用于大规模、高并发的应用场景。此举标志着PlanetScale在云原生数据库领域的进一步布局,为开发者提供更灵活、可靠的数据管理解决方案。

PlanetScalePostgreSQL分片服务AWS高可靠
2025-10-16
大型语言模型的新纪元:Router-R1的突破与创新

首个多轮LLM路由系统Router-R1已正式问世,标志着大型语言模型在资源优化与智能分配领域迈出了关键一步。该技术通过“思考–路由–聚合”的创新机制,实现对问题的智能判断与模型匹配:简单任务交由轻量模型处理,复杂需求则调用高性能大模型,从而显著提升计算效率并降低运行成本。Router-R1的核心在于模型协同与动态决策,不仅增强了系统的响应能力,也为大规模LLM部署提供了可持续的解决方案。这一突破性进展有望推动人工智能服务向更高效、更经济的方向发展。

LLM路由资源优化模型协同思考路由智能分配
2025-10-16
语音技术助力方言保护:清华大学与巨人网络的开源框架解读

清华大学与巨人网络联合开发了一种创新的多方言文本到语音(TTS)框架,采用混合专家(MoE)技术,支持包括粤语、闽南话、吴语、荷兰比尔茨语方言、法国奥克语,以及非洲和南美多种地方语言在内的方言语音合成。该框架致力于应对方言濒危问题,推动语言多样性保护,缓解因语音技术覆盖不足导致的数字鸿沟与文化失声现象。为促进全球方言保护与技术普惠,项目已将数据、代码与方法全面开源,助力多方参与文化传承。

方言保护语音技术混合专家文化传承开源框架
2025-10-16