快手通过解密其“AI印钞机”技术,首次提出生成式强化学习出价技术,成功推动平台广告收入提升超过3%。该技术依托出价基座大模型与持续演进的推理能力,不仅强化了AI在数字广告中的核心作用,也标志着快手从技术竞赛的领先者转变为业务增长的驱动者。通过深度融合生成式学习与强化出价机制,快手为自身商业生态构建了清晰的增长路径,同时为内容社区与数字广告行业的智能化发展提供了创新范本。
庞若鸣和苹果的研究论文提出了一种基于SBP方法的优化策略,旨在应对高质量训练数据稀缺对预训练语言模型发展的制约。该方法聚焦于从现有数据中深度挖掘潜在价值,而非依赖大规模数据扩充,有效提升了模型训练效率与性能表现。研究表明,SBP方法通过结构化数据处理与语义增强机制,在减少数据冗余的同时增强了语言模型的理解能力,为大型语言模型的可持续发展提供了可行路径。
本研究针对视觉-语言-动作(VLA)模型中存在的视觉冗余问题,提出了一种创新的无参数可微分视觉token剪枝框架——LightVLA。该框架通过引入可微分机制,在不增加额外参数的前提下实现高效token剪枝,显著提升了模型的推理效率与性能表现。与传统免训练剪枝方法相比,LightVLA突破了其在优化灵活性和精度保持方面的局限,实现了端到端的动态冗余消除。实验结果表明,该方法在多个基准任务中均展现出优越的压缩效率与模型保持能力,为VLA模型的轻量化部署提供了新的解决方案。
浙江大学与香港大学联合研究团队近日发布了一项名为“Prior Depth Anything”的创新技术,该技术通过融合稀疏深度传感器数据与先进AI算法,显著优化深度图质量。该方法可自动填补深度图中的空白区域、降低噪声并提升分辨率,适用于手机、车载系统及AR眼镜等设备,实现高精度实时三维视觉感知。值得注意的是,“Prior Depth Anything”无需额外训练即可兼容VGGT等主流3D模型,并在零样本学习框架下,刷新了深度补全、超分辨率与修复任务的多项性能记录,为三维视觉技术的广泛应用提供了高效解决方案。
在QCon上海会议上,Qoder展示了其创新的Context Engineering实践,成功为Coding Agent构建了智能上下文系统。该系统通过精准的上下文管理与优化,实现了高达90%的延迟降低,并在实际运行中达成了5%至20%的成本压缩。这一技术突破显著提升了编码任务的完成效率与执行效果,为自动化编程领域树立了新的性能标杆。
西湖大学AGI实验室的研究团队近日推出一项突破性技术——WorldForge,该框架无需预训练即可直接应用于视频生成任务。通过创新的即插即用推理引导机制,WorldForge在不修改视频扩散模型任何参数的前提下,赋予模型类似导演的智能决策能力。该技术实现了从单张图像到360度全景世界的生成,并能重构电影级视频轨迹与再现复杂镜头运动,显著提升了动态场景生成的真实性与可控性。这一进展为虚拟现实、影视制作等领域提供了高效、灵活的新工具。
《心理学增强AI智能体》提出,提升AI智能体的心理理解能力是优化其任务执行效率的关键。研究表明,通过强化AI对人类心理状态、意图和情感的识别与推理能力,可显著降低对复杂提示工程、思维链或精细指令的依赖。这种心理学驱动的方法使AI在无需冗长引导的情况下,更自然、准确地理解任务背景与用户需求,从而实现任务简化与响应优化。该路径不仅提升了AI智能体的自主性与适应性,也为未来人机交互提供了更高效、人性化的解决方案。
在探索突破人工智能训练瓶颈的路径中,Meta超级智能实验室联合牛津大学等机构的研究团队提出了一种创新方法——CaT(Compute as Teacher)。该方法挑战传统监督学习对人工标注数据的依赖,提出利用推理过程中的额外计算作为教师信号,为大型模型提供有效监督。即使在缺乏人工标注或可验证答案的场景下,CaT仍能推动模型持续学习与优化,显著降低对人力标注的依赖,为未来大规模模型训练提供了可持续、高效的新范式。
腾讯公司依托其在人工智能领域的深厚积累,推出专为3D内容创作打造的AI工作台——混元3D Studio,标志着美术制作流程的全面革新。该平台集成建模、UV展开与贴图生成等多项核心功能,首次实现全流程一体化操作,显著减少设计师在不同软件间切换的时间成本,大幅提升工作效率。作为面向3D设计师、游戏开发者及建模师的专业级工具,混元3D Studio通过AI驱动的内容生成能力,优化创作精度与响应速度,推动数字内容生产进入智能化新阶段。
近期,人工智能专家Yann LeCun推荐了一种名为JEPA(Joint-Embedding Predictive Architecture)的新方法,该技术正被应用于大型语言模型(LLM)的训练中。与传统依赖输入空间进行预测(如下一个词预测)的方式不同,JEPA借鉴计算机视觉领域的思路,转而在嵌入空间中进行训练。这种方法通过捕捉更高层次的语义结构,显著提升了模型的性能与鲁棒性。研究表明,在嵌入空间中建模有助于减少噪声干扰,并增强模型对语义变化的适应能力,为LLM训练提供了更具前景的技术路径。
根据Sensor Tower发布的《2025年AI应用市场调查报告》,2025年上半年移动端AI产品的内购收入(IAP)环比增长达100%,显示出强劲的商业化潜力。然而,全球IAP收入排名前十的AI应用全部为聊天机器人(ChatBot)类应用,反映出当前移动端高收入AI原生产品类型仍高度集中。相较于Web端多样化的AI应用场景,移动端在应用类型丰富度上存在明显短板,产品形态单一成为制约其生态扩展的关键因素。
Cloudflare近日宣布在其无服务器计算平台Cloudflare Workers中引入对Node.js HTTP客户端和服务器API的原生支持。这一更新使开发者能够更便捷地将现有的Node.js应用程序迁移至Workers环境,无需进行大规模代码重构。借助对标准Node.js HTTP API的支持,主流框架如Express.js和Koa.js现已可在Workers上运行,显著提升了开发灵活性与部署效率。此举标志着Cloudflare在兼容性与开发者体验方面的重要进展,进一步推动无服务器架构的普及。
xAI最新推出的AI模型Grok 4 Fast在性能与Grok 4持平的基础上,成功减少了约40%的token使用量。根据Artificial Analysis的客观研究,该模型在保持相同性能水平的同时,运行成本显著降低98%,展现出极高的性价比优势。这一突破使Grok 4 Fast在高效能与低成本之间实现了理想平衡,尤其适用于大规模部署和实时应用场景。此外,该模型在限定范围内支持免费使用,进一步降低了用户接入门槛,推动AI技术的普及化。
Meta公司近日宣布,将在其Facebook Dating约会服务中引入全新的人工智能助手,旨在通过智能化分析用户偏好与行为模式,提升伴侣匹配的精准度。该AI助手将利用先进的机器学习算法,为用户提供个性化的约会建议,优化互动体验。此举标志着Meta在社交科技与人工智能融合领域迈出了关键一步,进一步强化其在在线约会市场的竞争力。该功能预计将在未来几个月内逐步向全球用户推出。
WebWeaver是一种创新的人工智能研究助手,采用“动态大纲+分层写作”模式,模拟人类思维过程以实现深度内容生成。该系统通过Planner与Writer两个智能体协同工作,Planner负责构建和迭代动态大纲,Writer则基于大纲进行分层写作,确保论证逻辑严密、证据整合紧密。WebWeaver不仅提升了自动化写作的结构性与可追溯性,还通过开源框架和包含3000个高质量研究样本的WebWeaver-3k数据集,为下一代AI研究助手的发展提供了重要支持。
北京大学与字节跳动团队联合提出了一种新型树形强化学习算法——BranchGRPO。该方法在扩散反演过程中引入分叉与剪枝机制,允许多条轨迹在早期共享执行路径,并在后续阶段逐步分离,从而减少冗余计算。相较于顺序执行的DanceGRPO算法,BranchGRPO通过逐层奖励整合策略实现密集反馈,显著提升了学习效率与模型收敛速度。这一创新为复杂序列决策任务提供了更高效的强化学习框架。