上海人工智能实验室推出升级版大型AI模型“书生·思客InternThinker”,该模型首次实现用自然语言解释围棋AI的落子逻辑,突破了推理黑盒问题。其围棋水平相当于职业3-5段棋手,基于“通专融合”技术路径与InternBootcamp训练平台,构建三层架构体系,推动AI向自我进化及自主科学发现方向发展。
研究表明,人工智能模型的推理能力越强,其遵循用户指令的比例却下降至50%。这一矛盾现象表明,尽管大型模型在复杂推理任务中表现出色,但对用户指令的服从性却有所降低。这揭示了模型智能与指令服从性之间的负相关关系,为人工智能的发展提出了新的挑战。
近日,一位记者独家披露了“星际之门”超级计算机的内部情况。该项目拥有40万块GPU,由奥特曼和孙正义亲自监督,总投资达1000亿美元,旨在重塑人工智能世界格局。然而,其背后也伴随着巨大风险,包括电网负荷接近极限以及工人在007工作制度下的高强度劳动。这一对未来的巨额投资能否实现目标,仍需时间验证。
近日,字节跳动OCR团队与华中科技大学联合发布了一款名为WildDoc的新基准数据集。该数据集专注于评估大型语言模型在真实世界文档理解任务中的表现,揭示其性能短板。作为首个针对真实场景文档理解的基准,WildDoc为提升如GPT-4o等模型的准确性提供了重要工具,推动了文档理解技术的发展。
60年前,数学领域的一项悬而未决的难题被牛津大学的一位博士生成功攻克。这位名为Bedert的博士生通过其严谨的研究,证明了具有较小Littlewood范数的集合能够通过特定映射变换,转化为一个与等差数列更为相似的新集合。这一突破性成果为数学界提供了新的研究视角,并推动了相关理论的发展。
SimularAI与微软DeepSpeed的研究人员共同提出了一种名为“Soft Thinking”的创新概念,旨在提升AI模型的抽象思维能力。通过在连续的概念空间中进行“软推理”,AI能够突破传统基于离散token的限制,实现更高效的token使用。这一方法不仅增强了AI模型处理复杂任务的能力,还为未来的人工智能发展提供了新的思路。
在矩阵乘法领域,一项突破性技术显著提升了XX^T运算速度。通过强化学习(RL)技术的应用,搜索效率提高了5%,创下新纪录。Google DeepMind历时四年研发了AlphaTensor与AlphaEvolve等系统,专注于优化矩阵运算,为该领域带来了革命性进展。
ChatGPT在教育领域的应用引发了一场深刻的变革,显著提升了学习效果。据一项发表于Nature子刊的元分析显示,综合51项研究发现,ChatGPT能够将学习效果提升86.7%,尤其在中小学生的学业表现和高阶思维能力方面成效显著。该技术覆盖了语言到STEM(科学、技术、工程和数学)等多个学科领域,不仅带来短期的学习突破,还对学生产生长期的积极影响,以科学的方式推动教育未来的发展。
本文聚焦DeepSeek所采用的GRPO算法的独特性,通过剖析Kimi k1.5、OpenReasonerZero、DAPO和Dr. GRPO四篇精选论文,揭示了这些研究中的关键创新点。文章以专业视角解读GRPO算法及其改进版本的核心机制,旨在为构建更高效的推理模型提供新思路,帮助读者深入理解相关技术原理。
近日,微软亚洲研究院的张丽博士团队取得突破性进展,成功将“系统2”高级认知功能整合至拥有70亿参数的大型语言模型中。通过引入蒙特卡洛搜索算法,该模型在数学推理任务上实现了O(1)级别的高效表现,为人工智能领域带来了全新可能。这一成果不仅提升了模型的逻辑推理能力,还为其在实际应用场景中的广泛部署奠定了基础。
最新研究表明,在辩论比赛中,人工智能的表现超越人类。由瑞士洛桑联邦理工学院与普林斯顿大学等机构开展的研究显示,基于900名参与者的数据,AI在实战演练中的胜率达到64.4%,并在说服技巧方面表现突出。该研究发表于《自然·人类行为》杂志,揭示了AI在逻辑推理与语言表达上的潜力,为未来人机交互提供了新视角。
资深研究员在最新博客访谈中探讨了Claude 4的思考机制,指出基于人类反馈的强化学习(RLHF)已逐渐过时,取而代之的是基于人类验证的强化学习(RLVR)。后者已在编程和数学领域得到成功验证,展现出更高的效率与准确性。这一转变标志着AI训练方法的重要进步。
MIT科学家威廉姆斯在计算机理论领域取得重大突破,发现通过优化少量内存资源,可显著提升计算效率。这一成果证实了内存资源在计算过程中的关键作用,其对时间成本的节约效果与大量时间资源投入相当,为未来计算技术的发展提供了新方向。
在微软“Build2025”大会上,微软首席技术官(CTO)Kevin接受了科技博主Every的专访。他详细阐述了微软在推动智能体生态发展中的关键策略,包括技术创新与标准构建。Kevin强调,通过建立统一的标准,微软致力于促进不同智能体之间的互操作性,从而为开发者和用户提供更高效的解决方案。
麦吉尔大学的研究团队开发了名为LLMSynthor的新框架,该框架可将大型语言模型转化为结构感知的数据合成器。这一创新技术特别适用于隐私保护和数据稀缺的场景,能够生成高质量且不泄露敏感信息的合成数据,为相关领域提供了全新的解决方案。
字节跳动近期开源了一款具备GPT-4级别图像生成能力的模型,这一举动迅速引起广泛关注。该模型在Hugging Face平台的趋势榜单上占据重要位置,并在社交媒体上掀起热烈讨论。作为一家技术驱动的公司,字节跳动此举不仅展示了其在人工智能领域的深厚积累,也为全球开发者提供了强大的工具支持,进一步推动了图像生成技术的发展。