清华大学博士生余天予将出席AICon北京站活动,并发表关于多模态大模型高效构建的专题演讲。他将系统探讨在模型结构设计、数据处理流程与训练优化策略方面的前沿解决方案,旨在突破当前多模态大型人工智能模型在计算效率与资源消耗上的瓶颈。通过创新的结构设计与高效的训练机制,余天予的研究为提升大模型整体运行效率提供了可行路径,推动AI技术在实际场景中的广泛应用。
在软件工程领域,“无人测试”正逐步演变为行业发展的新趋势。这一变革不仅体现为测试工具的自动化升级,更标志着测试范式的根本性重构。借助人工智能技术,AI测试系统能够实现高度自动化的测试流程与自修复能力,显著提升软件质量与交付效率。据相关研究显示,采用AI驱动的测试方案可将缺陷检测效率提升达60%,同时减少约45%的人工干预成本。未来,“无人测试”将推动软件测试从辅助手段转向智能化主导,构建更加稳定、高效的开发运维生态。
谷歌新一代AI产品Gemini 3 Pro的详细规格参数近日提前曝光,引发AI领域广泛关注。该模型具备百万级别的超长上下文窗口能力,被视为谷歌今年推出的最强大王牌AI产品。尽管目前尚不清楚其信息泄露是源于内部测试,还是谷歌有意释放信号以收集开发者的早期反馈,但其性能表现已引起高度期待。Gemini 3 Pro与Google Cloud旗下的Vertex AI平台之间的关联也备受关注。作为谷歌统一的机器学习平台,Vertex AI在模型开发、部署与管理中扮演核心角色,或将为Gemini 3 Pro提供关键支持,进一步强化谷歌在云端AI生态的布局。
在科研领域,AI科学家以其惊人的工作效率引发广泛关注。他们能够连续工作12小时,短时间内完成1500篇学术论文的阅读,并编写高达42000行代码。凭借强大的数据处理与学习能力,AI科学家仅用半天时间便完成了相当于传统科研人员6个月的工作量。这种前所未有的高效率不仅提升了科研进度,也重新定义了科研工作的边界。在竞争激烈的科研圈中,AI科学家因其卓越表现被誉为“卷王”,成为推动科技进步的重要力量。
根据Scale AI与Center for AI Safety的最新研究,尽管人工智能技术快速发展,其在实际应用中的自动化能力仍存在显著局限。研究指出,AI在白领岗位中的自动化率仅为3%,远低于公众预期。该研究由Scale AI及安全领域专家团队共同完成,Alexandr Wang在任职Scale AI期间亦对此项目作出重要贡献。结果显示,尽管AI在特定任务中展现出潜力,但在复杂决策、创造性思维和跨领域协调等方面,仍难以替代人类角色。当前多数白领工作依然依赖人类参与,凸显出技术落地过程中面临的现实挑战。
Kimi K2 Thinking 作为一款具备卓越推理能力的智能体,自发布以来引发了广泛关注。其性能表现被认为已超越GPT-5,在复杂逻辑推理与多步任务处理方面展现出显著优势。此次Kimi K2 Thinking不仅正式上线,更宣布全面开源,此举大幅缩小了开源与闭源人工智能技术之间的差距,推动全球开发者共同参与模型迭代与优化。凭借其强大的架构设计与开放共享的理念,Kimi K2为下一代AI内容创作与认知计算提供了全新可能。
AI领域专家刘威创立的公司近期成功完成5000万美元融资,引发行业广泛关注。本轮融资将主要用于技术研发与团队扩展,支持其即将于12月推出的全新AI模型。据悉,该模型在生成能力与运算效率上均有显著突破,定位为高性价比的商业化解决方案,月订阅费用将低于Google旗下的Veo服务,进一步降低企业与个人用户的使用门槛。此举被视为对现有AI服务平台的一次有力挑战,也彰显了刘威团队在人工智能领域的创新实力与市场竞争力。
AI科学家的兴起正深刻改变科研领域的工作模式。据报导,AI科学家在12小时内完成的工作量相当于人类科学家半年的成果,并已取得7项重大科学突破。奥特曼预测,GPT-6或将实现AI自主创造新科学的愿景。其中,名为Kosmos的AI科学家在12小时内阅读了1500篇文献,执行4.2万行代码,生成可追溯的研究报告,并在材料科学等领域提出新发现。凭借持续记忆与自主规划能力,Kosmos正从工具演变为科研合作者。然而,约20%的结论仍需人类科学家验证,受限于数据来源与复现性。人机协作正推动科研范式加速演进,未来科研生态充满期待。
Kimi近期宣布开源其先进的人工智能工具K2 Thinking,该工具支持高达300次的连续自主调用,在性能表现上展现出显著优势。在HLE(Human Language Evaluation)测试中,K2 Thinking得分为44.9%,在BrowseComp测试中得分达60.2%,均超越GPT-5与Claude Sonnet 4.5(Thinking)的表现,标志着其在AI推理与语言理解能力上的重要突破。此次开源举措有望推动AI工具的广泛应用与技术迭代。
在高达95%的企业AI项目未能成功落地的背景下,仅有5%的CIO正在分享其成功的实践经验。这些领先企业的首席信息官们强调,明确的业务目标、跨部门协作、数据治理优化以及持续的人才投入是AI成功实施的核心驱动力。他们不仅将技术视为工具,更注重组织文化与战略对齐,通过小规模试点逐步扩展应用场景,确保AI真正融入企业运营。本文深入剖析这5%成功者的策略路径,揭示企业AI落地的关键实施秘籍,为更多组织提供可复制的经验参考。
在大型语言模型(LLM)快速发展的背景下,软件研发正迎来智能化转型的新阶段。AICon会议聚焦LLM在软件开发中的实践应用,深入探讨其在代码生成、测试优化、流程自动化及智能研发体系构建等方面的关键作用。通过LLM技术,开发者可实现高效代码自动生成,显著提升开发速度;优化测试用例设计,增强测试覆盖率与质量;推动研发流程的端到端自动化,减少人工干预;并逐步构建以LLM为核心的智能研发体系。会议同时展望未来软件研发范式的演进方向,揭示LLM驱动下的创新路径与发展前景。
PyTorch的创始人之一近日宣布从Meta离职,结束了其在公司长达十一年的职业生涯。作为人工智能领域最具影响力的开源框架之一,PyTorch在其主导下发展成为全球研究人员和开发者广泛使用的工具,极大地推动了AI技术的进步。该创始人表示,离职的原因并非复杂,而是希望突破个人局限,不再仅被定义为“PyTorch的创建者”,并期待在人工智能及其他技术领域探索新的可能性。他的离开标志着一个时代的结束,同时也引发业界对PyTorch未来发展方向的关注。
近期,Perplexity公司陷入“模型疑云”争议,多位用户在评论区公开质疑其存在“偷换模型”行为。用户指出,平台宣传中声称使用的Claude Sonnet 4.5模型,实际调用的可能并非该版本。通过分析请求数据(payload),用户发现模型名称可在代码层面直接追踪,并与Perplexity内部命名规则一致。例如,“Gemini 2.5 Pro”在系统中被标记为“gemini2flash”,这一证据进一步强化了对模型替换的怀疑。目前,用户呼吁公司公开透明的技术说明,以澄清实际所用模型架构与宣传是否一致。
在3D视觉领域,从二维图像恢复三维世界是计算机视觉与图形学的核心挑战之一。随着技术进步,该领域经历了从传统方法到深度学习驱动模型的演进。早期的结构从运动(Structure-from-Motion, SfM)通过多视角几何实现稀疏重建,奠定了三维重建的基础。随后,神经辐射场(Neural Radiance Fields, NeRF)利用隐式神经网络表征实现了高质量的新视图合成,显著提升了重建精度。最新的三维高斯喷涂(3D Gaussian Splatting, 3DGS)则结合显式表示与可微渲染,在保持高保真度的同时实现了实时渲染,推动了通用三维理解的发展。这些技术的演进标志着三维重建正朝着更高效、更精确和更实用的方向迈进。
RLinf近期推出的在线强化学习技术πRL,包含π0和π0.5两种模型,基于流匹配的VLA架构,由Physical Intelligence公司开发,在机器人领域引发广泛关注。该技术利用流匹配方法模拟多峰分布,有效简化模型结构,能够生成高维且连续平滑的动作序列,在复杂操控任务中展现出显著优势。πRL通过优化策略学习过程,提升了机器人在动态环境中的适应能力与执行精度,成为当前强化学习与机器人控制融合研究的重要方向。
大型语言模型(LLMs)在金融、交通等专业领域的决策支持中展现出巨大潜力,但其通用智能在面对高风险、高专业化任务时仍显不足。为提升LLMs在特定领域中的表现,提示词技术的自动优化成为关键研究方向。EGO-Prompt(Efficient Goal-Oriented Prompting)作为一种新型提示优化框架,旨在通过自动化机制动态调整提示结构与内容,以适应复杂任务需求。该技术在NeurIPS 2025被重点提出,展示了在多领域任务中显著提升模型准确率与鲁棒性的能力,为LLMs在专业场景下的可靠部署提供了新路径。




