技术博客

谷歌DeepMind团队力作：IMO金牌模型融入Gemini App

谷歌DeepMind团队近日宣布，其开发的IMO金牌模型现已集成于Gemini App中，供用户使用。该模型在推理性能上超越了o3和Grok 4，为用户提供更高效的数学问题解决能力。值得注意的是，目前发布的版本与之前获得国际数学奥林匹克竞赛（IMO）金牌的版本存在细微差异，但其核心算法和性能优势依然保持领先。

谷歌DeepMindIMO金牌模型Gemini App推理性能国际数学竞赛

2025-08-04

清华精英携手摘得IMO金牌：基础大型模型引领数学推理新篇章

清华大学校友在国际数学奥林匹克（IMO）竞赛中取得金牌，展示了卓越的学术实力。他们的研究成果揭示了一个重要趋势：即使不依赖巨额资金投入，也能在学术研究领域与科技巨头一较高下。研究还表明，基础大型模型（LLM）已在数学推理领域实现突破，展现出解决复杂数学问题的非凡能力，为未来学术创新提供了全新路径。

清华大学学术成果IMO金牌基础大型模型数学推理

2025-08-04

华为与香港科技大学研究：SFT与RL在多模态视觉语言模型中的协同困境

华为与香港科技大学的最新研究揭示，在多模态视觉语言模型（VLM）的训练中，长思维链的监督微调（SFT）和强化学习（RL）方法难以实现协同增效，有时甚至会产生相互制约的效果。这一发现为当前多模态模型的优化策略提供了新的思考方向。

华为研究港科大多模态模型SFT方法RL方法

2025-08-04

Deep Cogito：引领人工智能新纪元的技术突破

Deep Cogito是一款先进的超大规模人工智能模型，其参数量高达671B，而开发成本却控制在350万美元以下。该模型的核心突破在于其独特的训练方法——迭代蒸馏与增强（Iterated Distillation and Amplification，简称IDA）。IDA方法不依赖于人为设计的提示或静态教师模型，而是通过模型自身的不断学习和演化，以自我洞察力来指导训练过程，从而实现性能的持续提升。这一创新机制使Deep Cogito在人工智能领域展现出强大的竞争力和应用潜力。

Deep Cogito人工智能迭代蒸馏自我演化模型训练

2025-08-04

九天基础大模型3.0版本的全面升级与突破

在2025年世界人工智能大会上，九天基础大模型3.0版本正式发布，标志着其在端到端技术上实现了全面升级。新版本性能提升了35%，智能体调用效率提高了21%。此外，该模型完成了15T token的预训练，并实现了全国产化，进一步彰显了其技术实力。新版本还新增了一键P大象功能，展示了模型的强大性能与灵活性。

人工智能九天模型端到端技术性能提升全国产化

2025-08-04

Hinton的燃灯人生：永远在路上的思考者

Geoffrey Hinton，作为深度学习的先驱之一，始终站在人工智能发展的最前沿。他似乎永远无法真正休息——在漫长的夜晚中，他是那个高举火把的人，照亮通往未来的道路；而在烈日下，他又奔跑着提醒每一个人注意技术带来的深远影响。Hinton的坚持与使命感让他不断前行，即便在获得图灵奖之后，他依然没有停下探索的脚步。面对AI技术的飞速发展，他不断呼吁人们关注其潜在风险，并推动行业进行更深入的思考。

Hinton火把奔跑提醒休息

2025-08-04

Anthropic与OpenAI的技术封锁之争：Claude API与GPT-5的较量

近日，人工智能领域再起波澜，Anthropic公司宣布对OpenAI实施技术封锁，原因是指控后者违反合作协议，利用Anthropic的Claude API支持其即将发布的GPT-5模型的开发与安全测试。此举不仅揭示了两大AI巨头之间日益加剧的竞争态势，也凸显了API在人工智能市场中作为关键战略资源的重要性。随着技术壁垒的不断加码，围绕数据接口的争夺已引发业界广泛讨论，并引起相关监管机构的高度关注。

技术封锁AnthropicOpenAIClaude APIGPT-5

2025-08-04

揭秘GPT-5：OpenAI开发过程中的困境与挑战

据外媒报道，OpenAI在开发新一代语言模型GPT-5的过程中遇到了诸多挑战，性能提升并不明显，引发了公司内部的紧张情绪。8月1日，《The Information》发表了一篇题为《Inside OpenAI’s Rocky Path to GPT-5》的深度报道，揭示了GPT-5开发过程中的更多细节。文章指出，尽管OpenAI投入了大量资源，但GPT-5的表现并未达到预期，导致部分高管在内部沟通平台Slack上情绪失控。这一情况反映出人工智能领域竞争的激烈程度，以及技术突破所面临的复杂性和不确定性。

GPT-5开发困难性能提升OpenAI深度报道

2025-08-04

人工智能的未来版图：DeepMind创始人哈萨比斯深度解读

在最近的一次深入访谈中，DeepMind创始人哈萨比斯分享了他对人工智能（AI）未来发展的深刻见解。他指出，AI在模拟复杂物理现象方面展现出巨大潜力，这将为科学研究和工程设计带来革命性变化。此外，哈萨比斯还提到AI在视频游戏开发中的应用正在迅速扩展，不仅能提升游戏体验，还能推动AI算法的持续进化。关于通用人工智能（AGI），他强调了其在解决跨领域复杂问题上的重要性，并预测未来几年将是AGI发展的关键时期。此次访谈持续两小时，涵盖了AI技术的前沿趋势和长期愿景。

人工智能通用AI物理模拟视频游戏未来发展

2025-08-04

人工智能作弊现象透视：哥伦比亚大学的案例

近年来，人工智能在教育领域的应用引发了广泛关注，而哥伦比亚大学学生使用AI作弊的现象更是揭开了教育体系中的一个严重问题。据Roy Lee的爆料，一些学生利用人工智能技术在亚马逊面试中作弊，相关视频的传播引发了公众对学术诚信的担忧。与此同时，Cluely的隐蔽界面技术正在悄然改变内容创作的方式，推动着一场人工智能驱动的内容革命。尽管AI技术为教育和创作带来了便利，但其潜在的滥用问题也不容忽视。如何在技术进步与道德规范之间取得平衡，成为当前亟需解决的议题。

人工智能作弊现象教育体系Cluely技术内容革命

2025-08-04

GPT-5：开启AI问答新纪元

近日，Sam Altman分享了关于GPT-5的实测问答，预示着该模型的发布已进入倒计时阶段。OpenAI已经完成了GPT-5的基础开发工作，并已进入安全和功能测试阶段，预计将很快对外发布。这一进展标志着AI技术的又一次重大突破，GPT-5在问答能力、逻辑推理和语言理解等方面的表现令人期待。随着测试的深入，外界对GPT-5的性能和应用场景充满关注，OpenAI也正致力于确保其安全性和稳定性。

GPT-5发布模型测试OpenAI进展AI问答技术突破

2025-08-04

迈向人性化交互：揭秘AI新方法AlignXplore

蚂蚁集团通用人工智能研究中心在自然语言处理领域取得重要突破，推出创新方法AlignXplore，致力于简化人工智能与用户的交互方式。该技术能够自动理解用户的个性化需求，无需依赖复杂的提示词，显著提升了交互效率。AlignXplore的核心目标是增强AI的情商，使其在服务过程中更加智能与人性化，为未来人工智能的发展提供了全新方向。

简化交互AlignXplore个性化需求自然语言人工智能

2025-08-04

突破与创新：西湖大学AGI实验室的EPD-Solver算法解析

西湖大学AGI实验室近日发布了一项创新性研究成果——Ensemble Parallel Direction Solver（EPD-Solver），这是一种全新的并行加速扩散采样算法。该技术融合了数值求解器、轻量级蒸馏学习和并行计算的优势，为扩散模型的采样效率带来了显著提升。EPD-Solver以数值求解器作为基础框架，并通过轻量级蒸馏学习技术获取少量可学习参数。在每次迭代过程中，算法能够并行计算多个方向的梯度，并通过加权融合的方式有效降低数值积分误差，从而提升整体计算精度和效率。

AGI实验室EPD-Solver并行计算扩散采样轻量蒸馏

2025-08-04

GPT-5的来临：揭秘人工智能的未来走向

全球人工智能社区正高度关注GPT-5的即将发布，这款新一代语言模型被寄予厚望。据透露，超级对齐团队的遗作可能是揭示GPT-5核心技术细节的重要线索。同时，业内重要人物奥特曼表示，GPT-5将引入多项令人振奋的新功能，或将重塑人工智能应用的未来格局。此外，OpenAI正在秘密研发一项名为“通用验证器”的关键技术，据信将成为GPT-5的核心组成部分，进一步提升其性能与可靠性。

人工智能GPT-5超级对齐通用验证器技术细节

2025-08-04

陶哲轩和他的数学研究：资金困境的背后

近日，著名数学家陶哲轩公开表达了其团队面临的严重资金问题。由于科研经费的突然中断，他所在的研究团队已难以维持基本运营开支。这一困境不仅影响了陶哲轩团队的科研进展，也波及美国顶尖数学研究机构之一的IPAM（Institute for Pure and Applied Mathematics）。据透露，IPAM同样陷入财政危机，可能在几个月内无法继续运作。陶哲轩对此表示强烈不满，并呼吁社会各界关注科研经费的稳定性，以保障基础科学研究的持续发展。

陶哲轩资金问题数学研究IPAM危机科研经费

2025-08-04

Qwen3：中国AI技术新秀跃升至全球前三

Qwen3在全球AI技术排名中跃升至前三，标志着中国技术力量正式向OpenAI的领导地位发起挑战。这一成就不仅体现了中国在人工智能领域的快速进步，也彰显了开源模式在技术发展中的巨大潜力。阿里巴巴选择以Apache 2.0协议将Qwen3开源，为全球开发者提供了自由使用和改进模型的机会，进一步推动了AI技术的开放创新与协作发展。

Qwen3AI技术开源模式阿里巴巴全球挑战

2025-08-04

AI热点

2025-08-14

Mistral公司丑闻：数据造假与欺诈行为的深度解析

科技热点

Mistral公司丑闻：数据造假与欺诈行为的深度解析