近日,加州大学伯克利分校的华人团队与Together AI携手,成功开源了参数规模为14B的代码推理模型“o3-mini”。该模型在参数规模较小的情况下,性能可媲美OpenAI的o1/o3-mini级别模型。同时,项目还发布了“DeepCoder-14B-Preview”,包含代码及相关数据集,供公众免费使用。这一成果不仅推动了代码生成与推理技术的发展,也为全球开发者提供了宝贵的资源。
李飞飞团队近期提出了一项全球性的模型基准测试,旨在通过统一评估不同模型的“世界生成”能力,推动世界模型领域的发展。该测试覆盖3D、4D及视频模型,提供一个全球性平台以实现跨模型的比较与竞争。这一进展为模型的能力评测提供了标准化参考,标志着“世界生成”技术迈入新阶段。
谷歌Deep Research通过集成Gemini 2.5 Pro模型,实现了技术突破。该系统可在5分钟内生成46页学术论文,并将复杂报告转化为10分钟播客节目。与OpenAI相比,其性能提升40%,成本仅为十分之一,展现出低成本AI的巨大潜力。
继OpenAI之后,谷歌的Gemini模型也将支持由Anthropic公司开发的MCP协议。MCP(Model Context Protocol)是一种开源协议,旨在实现大型语言模型与外部数据源和工具的安全双向集成。这一协议为大模型与数据源之间的协作提供了新标准,推动了人工智能技术的进一步发展。
谷歌公司近期宣布推出Gemini 2.5 Flash AI模型,并计划将其整合至Vertex AI平台。此模型具备动态且可控的计算能力,可根据查询请求的复杂性灵活调整处理时间,在保证效率的同时优化成本效益,为开发者提供更灵活的AI解决方案。
掩码自编码器(MAE)由恺明大神提出,是一种高效的自监督学习方法。该技术通过在图像中进行大量随机掩码操作,有效减少了图像空间的冗余,使模型能够超越低级图像统计,学习到更高级和有效的特征。这一突破性进展显著提升了计算机视觉领域的图像理解能力,并缩小了其与自然语言处理在自监督学习方面的差距。
北京大学陈宝权教授团队开发的RainyGS技术,实现了动态雨效的高质量仿真。该技术结合物理模拟与3D高斯泼溅渲染框架,可逼真呈现降雨、洪涝及风速影响,突破传统工具限制,通过Real2Sim2Real流程实现真实与仿真场景的无缝转换,达到以假乱真的效果。
近日,由中国科学技术大学与华为诺亚实验室联合开展的一项研究在ICLR2025会议上发表。该研究通过结合图神经网络(GNN)和蒙特卡洛树搜索(MCTS)技术,成功将芯片设计中的逻辑优化(LO)效率提升了2.5倍。逻辑优化作为芯片设计流程中的核心环节,其性能直接影响芯片的整体表现,此项突破为芯片设计领域带来了显著进步。
字节跳动近期推出的人像视频生成模型DreamActor-M1,在推特上已吸引超百万关注。作为继Omnihuman-1后的又一力作,该模型可通过一张照片与一段视频,生成电影级画质的内容,支持多种画风,并精准迁移人物的表情与动作,为数字人技术带来全新突破。
Lowy 是一款基于 Java 语言开发的人工智能基础平台,主要面向企业(ToB)提供服务。与字节跳动的 Coze、腾讯的元宝以及 Dify 等产品竞争的同时,Lowy 更加专注于提升企业的智能化能力。值得一提的是,Lowy 的 AIFlowy 组件遵循 Apache 许可协议,为用户提供了灵活且开源的选择,助力企业在人工智能领域的快速发展。
本文聚焦于Python基础语法中的十个常见易错点,为读者提供实用的避坑指南。通过学习这些内容,用户可以在日常工作中更高效地运用Python,例如批量发送个性化邮件,从而提升工作效率与准确性。
OpenAI近期启动了名为“先锋计划”的项目,旨在重新构建人工智能模型的评分系统。该项目强调开发特定领域的评估指标,以更精准地反映模型在实际应用场景中的表现。通过这些指标,团队能够在高风险的真实环境中更好地评估模型性能,从而推动人工智能技术的安全与高效发展。
在ICLR 2025会议上,中国科学技术大学等机构提出了一种全新的无监督学习方法,用于优化整数规划求解器的训练过程。该方法通过梯度下降算法,构建了求解整数规划问题的无监督训练新范式,显著提升了求解效率与精度。这一创新性研究为复杂优化问题提供了新的解决思路,并有望推动人工智能与运筹学领域的深度融合。
首个统一多模态模型评测标准已发布,DeepSeek Janus在开源模型中表现突出,展现出卓越的理解能力。然而,与闭源模型相比仍存在差距。当前,GPT-4o和Gemini-2.0-flash等模型通过强大的跨模态输入处理能力,能够生成高质量的图像或文本内容,推动了统一多模态大模型(U-MLLMs)领域的快速发展。
在Agent时代,谷歌推出的A2A(Agent to Agent)开源协议正成为HTTP协议的潜在替代者。该协议旨在解决智能体跨平台协作难题,推动企业间无缝沟通与合作。尽管OpenAI体系未参与竞争,A2A已获超50家行业巨头支持,为智能体间的交流提供了新标准,有望打破企业间智能体协作障碍。
在2025年的Google Next大会上,谷歌宣布了两项重大技术突破。首先,TPU性能实现了10倍的提升,大幅增强AI处理能力。其次,开源项目A2A为智能体间的交互提供了全新解决方案,彻底颠覆传统沟通模式。这两项创新将推动人工智能领域迈向新高度。