技术博客

陈丹琦新研究:RLMT强化学习法的突破与创新

陈丹琦团队提出了一种新型强化学习方法RLMT(Reinforcement Learning with Model-rewarded Thinking),融合了RLHF与RLVR的优势,通过引入模型奖励机制提升决策质量。该方法在仅8B参数的小规模模型上实现了超越GPT-4o的性能表现,并可与Claude-3.7-Sonnet相媲美,展现出高效能与可扩展性的结合。这一突破为降低大模型训练成本、推动高性能小模型发展提供了新路径。

强化学习RLMT模型奖励小模型高性能
2025-09-28
2025年人工智能计算大会:国产超节点技术引领未来

2025年人工智能计算大会(AICC2025)在北京成功举办,期间发布的《智算应用“北京方案”》引发广泛关注。该方案旨在联合超过30家机构,基于国产超节点技术共同推进“行业智能体”的产业化落地,标志着中国在人工智能基础设施与应用融合方面迈出关键一步。大会聚焦算力提升、开源生态建设及智能体规模化发展,推出FlagOS 1.5操作系统与算力补贴政策等多项创新成果,并深入探讨AI for Science、低空经济、智能驾驶等前沿应用场景。系列举措彰显中国正加速构建高效、开放且自主可控的人工智能发展体系。

智算应用国产超节点行业智能体FlagOS算力补贴
2025-09-28
人工智能赋能电商革新:京东Oxygen架构的深度解析

2025年9月25日,在京东全球科技探索者大会上,京东集团高级副总裁兼产品委员会主席胡喜正式发布电商领域全新人工智能架构体系——Oxygen。该体系由京东科技自主研发,旨在通过人工智能技术深度重构电商运营模式,推动零售创新升级。Oxygen架构融合智能推荐、自动化运营、AI客服与供应链优化等核心技术,全面提升用户体验与商业效率,标志着京东在人工智能驱动电商革新方面迈出关键一步。

人工智能电商革新Oxygen架构京东科技零售创新
2025-09-28
揭秘Snowflake有奖问卷调查:Data+AI领域从业者的声音

Snowflake诚邀Data+AI领域及海外业务从业者参与有奖问卷调查,旨在深入了解行业用户的核心需求与挑战。此次调研将聚焦数据管理、人工智能应用及跨境业务发展等关键议题,为优化产品体验提供有力支持。作为答谢,所有参与者均有机会赢取丰厚礼品,包括电子礼品卡、行业峰会门票及专业培训课程等。本次问卷预计耗时约10分钟,每一份反馈都将被严格保密并用于研究分析。目前已有超过2,000名专业人士参与,Snowflake期待更多一线从业者的宝贵意见,共同推动数据驱动创新的边界。

问卷调查DataAI从业者Snowflake有奖
2025-09-28
华为算力的'超节点+全栈开源'模式:重塑人工智能公共事业

约翰·麦卡锡曾预言计算将如电话系统般成为公共事业,如今这一愿景正随算力的普及逐步实现。华为提出的“超节点+全栈开源”模式,致力于构建开放、协同的人工智能基础设施。通过整合高性能算力资源与全栈自主技术,华为推动算力像水电一样按需供给。其“超节点”架构已实现单集群5000卡级规模互联,支持千卡任务调度效率超90%,显著提升AI训练效能。结合MindSpore等开源框架,华为加速技术普惠,降低AI开发门槛,助力产业智能化升级。该模式不仅强化了算力作为公共事业的可行性,也为人工智能的可持续发展提供了新路径。

算力华为超节点全栈开源
2025-09-28
AI技术革新:挑战3万亿美元经济领域的智能化未来

OpenAI近期开展了一项规模空前的测试,首次将人工智能技术引入44个关键行业,与人类专家展开直接竞争,覆盖经济价值高达3万亿美元的领域。通过其创新的GDPval评估体系,OpenAI模拟真实工作任务,系统衡量大型AI模型的实际应用潜力,标志着AI从实验室研究迈向现实经济场景的重大突破。随着人工通用智能(AGI)概念被逐步超越,人工超级智能(ASI)正成为引领新一轮智能革命的核心力量。此次测试不仅展现了AI在多行业中的高效能表现,也预示着人类将得以从繁复的日常事务中解放,转向更具创造性与战略性的活动,开启智能化未来的新篇章。

AI革命AGI超越ASI引领GDPval智能竞争
2025-09-28
CoF模型:揭开视频推理的新篇章

DeepMind近期提出了一种名为CoF(chain-of-frames)的新型视频模型框架,旨在提升人工智能在视频理解中的连贯思考与推理能力。该模型受CoT(chain-of-thought)思维链启发,将视频分解为多个语义连贯的“帧链”,模拟人类在时间序列中逐步推理的过程,从而实现更深层次的视频推理。CoF模型通过构建帧间逻辑关联,增强了对动态场景的理解能力,在复杂动作识别与事件预测任务中展现出显著优势。这一进展标志着AI在模拟人类认知流程方面迈出了关键一步,为未来智能视频分析系统提供了新的技术路径。

CoF模型思维链视频推理DeepMind连贯思考
2025-09-28
陈丹琦教授或加盟Thinking Machines Lab:智能领域的新篇章

近期,清华大学姚班毕业生、现任普林斯顿大学教授陈丹琦或将全职加入Thinking Machines Lab的消息引发广泛关注。据悉,她在完成为期一年的学术休假后,可能正式离开普林斯顿大学,投身于更具前沿探索性的智能研究机构。这一动向不仅反映了全球顶尖人工智能人才流动的新趋势,也凸显了Thinking Machines Lab在通用智能领域日益增强的吸引力。值得关注的是,陈丹琦团队最新研究成果成功实现了RLHF(基于人类反馈的强化学习)与RLVR(基于视频表征的强化学习)的融合,显著提升了模型的推理能力,为通向通用人工智能提供了新的技术路径。该进展标志着智能系统在理解复杂环境与人类意图方面迈出了关键一步。

陈丹琦姚班普林斯顿RLHF智能
2025-09-28
OpenAI的o3模型与UIUC的KNighter模型:引领软件漏洞检测新篇章

近期报道显示,OpenAI的o3模型成功在Linux内核中识别出一个零日漏洞,展示了人工智能在软件安全领域的潜力。更进一步,UIUC团队开发的KNighter模型通过自动生成静态分析检查器,将大模型的分析能力转化为可执行的工程逻辑规则,显著提升了对软件缺陷和漏洞的大规模检测效率。这一技术突破不仅增强了自动化漏洞挖掘的准确性,也为软件安全防护提供了新的方法论支持。

零日漏洞OpenAIKNighter静态分析软件缺陷
2025-09-28
苹果Manzano:引领AI新时代的多模态图像理解与生成模型

苹果公司正在研发一款名为Manzano的新型多模态人工智能模型,该模型集成了图像理解与图像生成两大核心功能,致力于在性能上达到与OpenAI的GPT-4o及谷歌的Nano Banana相媲美的水平。Manzano的开发标志着苹果在生成式AI领域的进一步布局,旨在提升其在智能设备与内容创作生态中的竞争力。该模型有望在未来整合至iOS、macOS等系统中,为用户提供更智能的视觉交互体验。

Manzano多模态图像理解图像生成AI模型
2025-09-28
资深开发者揭秘:25条CC实战经验与AI编程的未来

一位资深开发者在Reddit上分享了25条关于代码编写(CC)的实战经验,其中多项观点与使用大型AI模型的实际体验高度契合。例如,当上下文长度达到模型token上限的一半时,建议终止当前会话并开启新的对话,以避免因上下文压缩导致输出质量下降。此外,合理管理会话结构有助于提升AI编程代理的响应准确性和效率。文中还提及AI编程辅助工具的试用经验,显示出其在提升开发效率方面的潜力,为开发者优化工作流提供了切实可行的参考。

代码经验AI编程上下文token会话管理
2025-09-28
腾讯云Redis水平扩缩容的精湛艺术:slot原子化搬迁技术解析

腾讯云数据库DBTalk系列文章深入解析了腾讯云Redis实现水平扩缩容的核心技术——slot原子化搬迁。该技术通过精细化控制Redis集群中slot的迁移过程,确保数据在扩缩容期间的一致性与高可用性,极大提升了操作的流畅度与稳定性,实现了近乎无感的扩容体验。相比传统方式,slot原子化搬迁有效降低了迁移过程中的性能抖动,保障业务连续性,为大规模缓存架构提供了可靠支撑。

Redis扩缩容slot搬迁腾讯云
2025-09-28
《开源社区的奇迹:Redis与Valkey的技术演变之路》

从 Redis 到 Valkey 的演进,展现了开源社区在数据库技术发展中的核心推动作用。随着 Redis 原始维护者对开源理念的调整,社区为保障开放协作的持续性,于2023年发起 Valkey 项目,继承了 Redis 的高性能与灵活性,并强化了分布式架构支持。目前,Valkey 已获得包括腾讯云在内的多家主流云厂商支持,贡献者数量突破500人,代码提交超2000次,彰显了社区驱动创新的强大生命力。这一转变不仅体现了开源精神在关键技术领域的韧性,也预示着未来数据库生态将更加去中心化、协作化和可持续发展。

开源RedisValkey社区创新
2025-09-28
京东物流引领物流行业革新:具身智能技术的突破与应用

2023年9月25日,在JDD 2025京东全球科技探索者大会上,京东物流正式发布“超脑2.0”与“异狼”系列新品,标志着其在具身智能技术应用上的重大突破。通过“超脑+狼族”的软硬件一体化协同模式,京东物流实现了从模块化智能向一体化智能的升级,全面提升物流系统的自主决策与动态执行能力。该技术体系不仅强化了智能调度与机器人协作的深度融合,也推动了物流行业向更高水平的智能化迈进。

具身智能超脑2.0异狼系列软硬件一体智能协同
2025-09-28
xAI项目高管离职潮背后:马斯克的人工智能梦遭遇挑战

马斯克信任的xAI项目正面临严峻挑战,一夜之间超过500名数据标注员被解雇,引发团队剧烈震荡。伴随高管纷纷离职、实习生被赋予关键职责,项目内部士气严重受挫。此前在全员会议上作出的承诺迅速被打破,战略方向的调整与大规模团队重组令未来发展充满不确定性。尽管背靠千亿级投资,致力于实现通用人工智能的梦想,但当前的人事动荡与执行混乱为xAI的技术路径和组织稳定性敲响警钟。

xAI项目高管离职数据标注AI梦想团队重组
2025-09-28
探索 Genesis:引领多模态生成模型新篇章

本文介绍了一种名为Genesis的新型多模态生成模型,该模型在无需依赖光学字符识别(OCC)引导的情况下,实现了高质量视频与激光雷达数据的联合生成。通过引入DataCrafter工具,Genesis显著增强了生成过程中的结构化语义引导能力,涵盖场景级与实例级信息描述,提升了生成内容的语义一致性与细节精度。在nuScenes基准数据集上的大量实验表明,Genesis在视频生成与激光雷达点云生成的各项指标上均达到了当前最优水平(SOTA),展现出强大的多模态生成潜力。

Genesis多模态生成模型DataCrafterSOTA
2025-09-28