技术博客

显卡微调新突破:万亿参数AI模型在本地微调成为现实

趋境科技联合清华大学与北京航空航天大学,成功实现基于两张NVIDIA GeForce RTX 4090显卡对万亿参数级Kimi K2人工智能模型的本地微调。该技术突破大幅降低对高端算力的依赖,使消费级硬件具备处理DeepSeek 671B或Kimi K2 1TB等超大规模AI模型的能力,仅需2至4张RTX 4090即可完成微调任务,显著提升了AI模型训练的可及性与效率。

显卡微调模型算力本地
2025-11-06
RoboBrain-Memory:开启具身智能的终身记忆新篇章

智源研究院(BAAI)、Spin Matrix、乐聚机器人与新加坡南洋理工大学联合研发了RoboBrain-Memory,一项面向具身智能体的先进终身记忆系统。该技术模拟人类长期记忆机制,使机器人能够持续存储并调用过往交互经验,显著提升其在动态环境中的适应能力与人机互动的自然性。RoboBrain-Memory通过分层记忆架构实现高效信息编码与检索,支持跨任务、跨场景的知识迁移,为下一代自主智能体的发展奠定基础。

智源研究院RoboBrain终身记忆具身智能南洋理工
2025-11-06
时空推理视频模型的突破:Open-o3 Video的开源创新之路

北京大学与字节跳动联合团队近日成功开发并开源了首个具备时空推理能力的视频模型——Open-o3 Video。该模型创新性地将显式时空证据融入视频理解全过程,使AI在回答问题时不仅能生成准确结果,还能清晰标注推理过程中涉及的具体时空位置,实现了视频推理的透明化与可追溯性。这一突破显著提升了模型的可解释性与实用性,在多项基准测试中性能超越GPT-4o,标志着视频理解技术迈入可解释推理的新阶段。

时空推理视频模型开源透明化AI超越
2025-11-06
UniWorld-R1:开启视觉强化学习新纪元

在最新的研究进展中,兔展与北大Uniworld V2团队联合推出了一项突破性成果——UniWorld-R1图像编辑后期训练框架。该框架首次将强化学习(RL)策略优化技术融入统一的图像编辑模型,开创了视觉强化学习的新范式。基于此基础,团队进一步研发出升级模型UniWorld-V2,显著提升了中文语义理解能力与图像细节控制精度,表现超越当前同类模型NanoBanana,标志着图像编辑技术迈向智能化新阶段。

兔展北大团队UniWorld强化学习图像编辑
2025-11-06
人工智能降本背后的经济悖论:科技通缩与生活通胀的双重现象

过去一年中,人工智能模型的成本大幅下降,部分服务价格降幅高达数百倍,曾需10元获取的AI服务如今仅需几分钱即可获得,凸显“AI降本”趋势。与此同时,家政、育儿、心理咨询和维修等依赖人工的服务费用持续上涨,反映出人力成本的显著攀升。这一现象体现了Jevons悖论与Baumol成本病的现实影响:随着机器智能效率提升带来科技领域的通缩,人工服务因难以规模化复制而陷入供给瓶颈,导致其相对价值和成本上升。科技通缩与生活成本通胀并存,正重塑经济结构与消费模式。

AI降本人工涨价Jevons悖论Baumol病科技通缩
2025-11-06
谷歌 Earth AI:引领洪水预警新时代

谷歌公司近日推出了一项革命性技术——地球级AI智能体,标志着其在环境预测领域的重大突破。该技术融合了谷歌十余年积累的世界建模经验与Gemini强大的推理能力,并深度集成于Earth AI平台之中。凭借这一创新,谷歌已实现为全球超过20亿人提供精准的洪水预警服务,覆盖范围广泛,响应速度显著提升,部分区域甚至在一夜之间完成了系统部署与服务上线。这项基于人工智能的灾害预警解决方案,不仅展现了谷歌技术在应对气候变化挑战中的关键作用,也为全球公共安全提供了可扩展的技术范式。

地球级AI洪水预警Gemini谷歌技术智能体
2025-11-06
陶哲轩与AI协作:数学研究的新篇章

数学家陶哲轩正通过人工智能技术革新科研方法,探索AI在数学研究中的深度协作。他利用ChatGPT等AI工具,将复杂的数学论文转化为Lean语言代码,实现形式化证明的自动化辅助。AI不仅能理解论文内容并生成正确的命题陈述,还在编码过程中发挥重要作用,最终在人机协作下成功生成1125行经过验证的证明代码。这一过程体现了一种新兴的工作模式——“vibe coding”,即人类与AI基于直觉与逻辑的协同创作。尽管AI尚无法独立完成关键推理步骤,需数学家介入指导,但其在提升形式化效率、降低验证成本方面展现出巨大潜力,促使学界重新思考AI在科研中的角色。

陶哲轩AI协作形式化Leanvibe coding
2025-11-06
ICML 2026会议新规:大型语言模型禁列作者身份

ICML 2026正式宣布一系列论文提交新规,明确禁止将大型语言模型(LLM)列为论文作者,强调作者须为对研究有实质性贡献的自然人。会议同时严禁在研究过程中使用提示注入技术,一经发现将直接退稿。为进一步提升审稿效率与公正性,ICML 2026将扩大人工智能在审稿流程中的应用,涵盖初筛、匹配与质量评估等环节。论文提交截止日期为2026年1月28日,新规旨在维护学术诚信并应对生成式AI带来的挑战。

ICML26LLM禁作者禁提示注入AI审稿论文新规
2025-11-06
GPT-5引领数学革命:AI如何揭开并修复存在30年的漏洞

一项长期存在于数学界、历时30年未被察觉的漏洞,近日被GPT-5人工智能模型迅速识别并解决,引发学术界广泛关注。著名数学家陶哲轩指出,这一事件标志着AI在科研领域正扮演日益关键的角色,或将引发一场深刻的科学革命。与传统证明依赖人工审验不同,GPT-5将数学证据直接嵌入可执行代码中,极大提升了证明的透明度与可验证性。这一突破不仅凸显了AI在复杂逻辑推理中的潜力,也重新定义了数学严谨性的实现路径。随着AI技术深度融入数学研究,其在发现、验证与优化证明过程中的价值正被广泛认可。

AI数学陶哲轩GPT5漏洞可验证
2025-11-06
全模态AI模型的崛起:美团开源LongCat-Flash-Omni解析

美团近日开源了一款名为LongCat-Flash-Omni的全模态AI模型,该模型在多项性能指标上达到行业领先的闭源模型水平,并实现了开源模型中的最新最佳性能(SOTA)。LongCat-Flash-Omni具备毫秒级的实时音频与视觉交互能力,能够理解复杂的多模态输入组合,并支持低延迟的实时对话,交互体验接近人类自然交流。这一突破标志着AI在全模态感知与实时交互领域迈出了关键一步,为未来智能交互系统的发展提供了强有力的技术支撑。

全模态AI模型开源实时交互低延迟
2025-11-06
在线策略蒸馏技术:低成本实现高效学习

本文介绍了一种基于在线策略蒸馏的技术,显著提升了强化学习系统的成本效益。该方法通过学生模型在线采样与教师模型提供的密集监督信号相结合,在不依赖昂贵后训练过程的前提下,实现了与传统强化学习相当甚至更优的性能表现。相较于以往需要大规模计算资源的训练方式,在线蒸馏大幅降低了总体计算成本,使高效策略学习在资源受限环境下成为可能。实验表明,该技术能在保持模型性能的同时,减少高达70%的训练开销,为大规模模型部署提供了可行路径。

在线蒸馏成本效益策略学习教师模型学生模型
2025-11-06
空气动力引领未来:无大脑新型机器人的崛起

近日,科研团队成功研发出一款以空气为动力源的新型机器人,突破传统机器人依赖电力与复杂控制系统的局限。该机器人采用仿生设计原理,通过压缩空气驱动机械结构实现运动,无需内置“大脑”进行复杂运算,大幅降低能耗与制造成本。其运行过程零排放,符合环保科技的发展方向,为可持续智能设备提供了全新思路。该技术有望应用于环境监测、灾害救援等高风险领域,展现广阔前景。

空气动力新型机器人无大脑环保科技仿生设计
2025-11-06
绿色未来:世界互联网大会的碳中和之路

世界互联网大会连续三年实现100%绿色电力供应,标志着其在推动碳中和与可持续发展方面迈出坚实步伐。通过全面采用清洁能源,大会不仅减少了碳排放,也为全球数字峰会树立了绿色办会的典范。这一成果体现了主办方对环境保护的高度重视,以及在能源转型实践中的领先地位。

绿色电力互联网大会清洁能源碳中和可持续
2025-11-06
羲和号探测器的科技突破:揭秘太阳活动时序光谱特征

“羲和”号太阳探测器成功实现了对太阳活动的高精度时序光谱观测,首次在空间探测中获取了太阳耀斑与日冕物质抛射过程中的动态光谱特征。通过搭载的先进光谱成像仪,“羲和”号在极紫外波段实现了每0.5秒一次、分辨率高达0.05纳米的连续观测,揭示了太阳大气中等离子体温度与速度的快速演化过程。数据分析表明,在一次X级耀斑期间,日冕加热速率提升了近3倍,且非热电子加速现象与光谱线形变化存在显著相关性。该成果为理解太阳活动能量释放机制提供了关键数据支持,标志着我国在太阳物理空间探测领域迈入国际先进行列。

羲和号太阳活动光谱特征时序分析空间探测
2025-11-06
航天员延迟返回地球:空间碎片的挑战与应对

近日,原定返回地球的航天员因空间碎片的潜在威胁被迫延迟返程。据中国载人航天工程办公室消息,监测数据显示,一块高速运行的空间碎片逼近空间站轨道,为确保航天员安全,任务控制中心决定推迟返回计划。此类碎片多为废弃卫星或火箭残骸,运行速度可达每秒7至8公里,对航天器构成严重威胁。目前,航天员在轨状态良好,正配合地面进行新一轮轨道调整与安全评估。专家指出,随着近地轨道活动日益频繁,空间碎片管理已成为全球航天任务不可忽视的挑战。

航天员延迟返回空间碎片地球影响
2025-11-06
人工智能技术助力智能驾驶产业革新与发展

人工智能技术正深刻推动智能驾驶产业的快速发展。通过深度学习、计算机视觉和传感器融合等核心技术,人工智能显著提升了自动驾驶系统的感知、决策与控制能力。据相关数据显示,2023年全球搭载高级驾驶辅助系统(ADAS)的新车渗透率已超过65%,预计到2030年,L4级自动驾驶车辆将在特定场景中实现规模化商用。车载系统的智能化升级,使得车辆能够实时处理海量数据,实现更安全、高效的行驶。技术革新不仅加速了整车厂与科技企业的深度融合,也重塑了交通出行生态。

人工智能智能驾驶自动驾驶技术革新车载系统
2025-11-06