技术博客

大型语言模型的高效推理技术:Token预算感知与Chain-of-Thought策略

在ACL 2025会议上,一种针对大型语言模型(LLM)的高效推理技术被提出。该技术以Token预算感知为核心,结合Chain-of-Thought(CoT)等推理增强方法,显著提升了模型解决数学题、逻辑问答等复杂任务的能力。通过引导模型逐步思考,CoT方法不仅优化了资源利用效率,还大幅提高了模型的准确率。

大型语言模型高效推理技术Token预算感知Chain-of-Thought复杂任务解决
2025-06-05
异步强化学习新篇章:AReaL-boba²系统的突破与进展

清华大学与蚂蚁集团联合开发的AReaL-boba²全异步强化学习训练系统,通过解耦模型生成与训练流程,显著提升了GPU利用率。该系统在14B规模模型下,于多个代码基准测试中达到SOTA性能,其表现接近235B规模模型,展现了异步强化学习领域的重大突破。

异步强化学习AReaL-boba²系统GPU利用率代码基准测试模型性能提升
2025-06-05
大型语言模型的知识更新策略:华为盘古DeepDiver的应用解析

大型语言模型(LLM)在处理复杂知识密集型问题时,需具备实时更新知识库的能力。华为盘古DeepDiver作为一款先进的人工智能搜索代理,能够提供开域信息获取的新解法。其性能与7B规模的语言模型相当,甚至可与满血版R1模型竞争。文章探讨了如何让模型自主制定信息获取策略,以应对需要外部知识的问题,为未来LLM的发展提供了新方向。

大型语言模型知识更新华为盘古DeepDiver信息获取策略
2025-06-05
大模型推理在垂直领域的挑战与机遇

大模型推理作为科技领域的热点,其结构化推理能力在通用领域表现出色,但在垂直领域的应用仍面临挑战。最新发布的法律AI评估标准中,抱抱脸评测集凭借其精准性和趋势性位列第一,展现了垂直领域AI发展的新方向。这一进展不仅推动了法律行业的智能化进程,也为其他专业领域提供了借鉴意义。

大模型推理法律AI抱抱脸评测垂直领域科技趋势
2025-06-05
《圣经》成书时间新说:AI重构《死海古卷》之谜

最新研究表明,《圣经》的成书时间可能比传统认知更早。通过AI技术分析《死海古卷》,科学家重建了其时间线,发现部分文献如《但以理书》和《传道书》的古卷成书于耶稣时代之前。AI模型“Enoch”结合碳14定年技术和笔迹分析,开发出一种更精确的AI定年方法,为研究《圣经》作者身份提供了新视角。这一突破性进展在学术界引发广泛关注。

圣经成书时间死海古卷AI定年方法但以理书传道书
2025-06-05
探索前沿:谷歌设备端GenAI API的革新之路

谷歌近期推出了一项创新技术——设备端GenAI API,并将其整合至ML Kit中。通过这一技术,开发者可在Android应用中利用Gemini Nano实现本地机器学习推理。该技术支持文本总结、校对、改写及图像描述等功能,为用户提供了更高效、便捷的使用体验。

设备端GenAI APIML KitGemini Nano文本总结图像描述
2025-06-05
OpenAI迈出重要一步:Codex CLI的Rust语言重写之路

OpenAI近期宣布将Codex CLI从原先的Node.js和TypeScript技术栈重写为Rust语言。这一调整旨在显著提升系统的安全性和性能,同时优化开发者体验。通过采用Rust语言,OpenAI期望解决原有技术栈中的潜在漏洞,并为开发者提供更高效、稳定的工具支持。

OpenAI重写Codex CLIRust语言系统安全开发者体验
2025-06-05
AICon北京会议亮点:杨志明详解端侧多模态大模型创新实践

在即将召开的AICon北京会议上,深思考人工智能公司首席执行官兼人工智能算法科学家杨志明将发表重要演讲。他将围绕端侧多模态大模型的创新实践展开分享,重点探讨超小型端侧多模态大模型的实践经验及其最新进展。此次演讲将为业界提供宝贵的参考,推动人工智能技术的进一步发展。

端侧多模态大模型创新超小型模型AICon北京杨志明演讲
2025-06-05
腾讯云出海服务解决方案:中国企业国际化之路

腾讯云提供的出海服务解决方案手册,旨在助力中国企业快速拓展国际市场。通过技术支持、市场分析与本地化策略等关键要素,腾讯云为企业提供全方位的服务支持,帮助企业在全球范围内高效运营并取得竞争优势。

腾讯云出海国际市场技术支持市场分析本地化策略
2025-06-05
百度地图智能体的能力构建与挑战分析

百度地图智能体在实际应用中不断探索与优化,通过构建核心能力提升用户体验。其子Agent处理机制有效分解复杂任务,结合多样工具应用实践,显著提高服务效率。同时,面对系统稳定性挑战,团队积累丰富实践经验,确保平台高效运行,为用户提供更智能、便捷的地图服务。

百度地图智能体用户体验改进子Agent处理工具应用实践系统稳定性
2025-06-05
AutoRefine框架:引领检索增强型LLM的技术革新

AutoRefine是一种基于强化学习的后训练框架,创新性地提出了“检索-提炼-思考”范式。通过知识提炼步骤与特定检索奖励机制,该框架显著提升了大型语言模型(LLM)的信息检索精度、关键内容提炼效率及外部知识利用能力。这一方法优化了RAG模型的推理性能,为构建更精准可靠的检索增强型LLM开辟了新路径。

AutoRefine框架强化学习知识提炼检索奖励RAG模型
2025-06-05
DAPO算法:引领LLM强化学习开源新纪元

字节跳动与清华大学联合开发的DAPO算法,作为LLM强化学习领域的新开源力量,在2024年AIME竞赛中以50分的成绩脱颖而出。相比之前的先进模型,DAPO算法仅用50%的训练步骤便实现了更优表现,展现出卓越的训练效率与效果。其完全开源的特性为全球研究者和开发者提供了宝贵资源,进一步推动了LLM强化学习技术的发展。

DAPO算法开源力量LLM强化学习训练效率AIME竞赛
2025-06-05
探秘AReaL:异步强化学习训练系统的革新之路

AReaL系统作为首个全异步强化学习训练系统,显著提升了同步强化学习框架的效率。通过该系统,推理大模型的训练速度可提升2.77倍,性能更强、速度更快且使用更便捷。对于希望训练高性能推理模型但受制于传统框架低效与高门槛的用户,AReaL无疑是一个理想选择。

AReaL系统异步强化学习训练效率提升高性能推理开源项目
2025-06-05
普林斯顿大学Alita智能体:极简理念下的自我进化之路

普林斯顿大学人工智能实验室近期推出了一款名为Alita的通用智能体。该智能体以“极简即复杂”为核心设计理念,通过减少预设功能,强化自我进化能力,实现了独立思考、搜索及创造MCP工具的目标。这一创新突破为人工智能领域提供了全新的研究方向,展现了极简设计与强大功能并存的可能性。

Alita智能体普林斯顿大学极简理念自我进化MCP工具
2025-06-05
人机协作下的软件发展:用户界面的演变与挑战

Andrej Karpathy提出,在人机协作日益紧密的趋势下,未来软件的发展将更倾向于支持脚本化操作和透明数据格式的产品。那些依赖复杂用户界面(UI)、过多滑块与菜单,且基于不透明二进制格式构建的软件可能面临淘汰风险。这一观点强调了软件设计中灵活性与可编程性的重要性,为开发者指明了新的方向。

人机协作用户界面脚本化操作二进制格式软件发展
2025-06-05
开源革命:谷歌Gemini级别AI的白菜化之路

谷歌开源Gemini级别的人工智能研究能力,标志着高端技术的普及化时代来临。通过将复杂的技术转化为人人可及的资源,用户能够借助开源项目自行构建AI系统。这一举措不仅降低了技术门槛,还为全球开发者提供了无限可能,推动了人工智能领域的快速发展。

谷歌开源Gemini技术AI系统构建技术普及化开源项目
2025-06-05