近日,浙江大学范鹤鹤、杨易与吴飞,联合新加坡国立大学Mohan Kankanhalli共同提出一种新型神经网络基础操作架构——Translution。该架构创新性地融合卷积与自注意力机制,旨在提升神经网络在多样化数据环境下的建模能力。研究团队指出,神经网络的核心在于高效处理和建模特定类型的数据,而Translution通过结合卷积的局部特征提取能力与自注意力的全局依赖捕捉优势,实现了对复杂数据结构更精准的表达。这一突破为未来神经网络架构的设计提供了新的技术路径与理论支持。
学术展示视频在科研交流中发挥着关键作用,但其传统制作方式依赖人工完成幻灯片设计、逐页录制与后期剪辑,流程繁琐、效率低下且成本较高。随着科研产出的快速增长,对高效、标准化视频制作的需求日益迫切。实现学术视频的自动化生成,不仅可大幅提升制作效率,降低时间与人力成本,还能推动科研成果的广泛传播与可视化交流。因此,发展基于智能算法的学术视频自动生成技术,已成为提升科研协作效率的重要方向。
在SIGGRAPH Asia 2025会议上,香港中文大学与快手可灵团队联合发布了CamCloneMaster技术,为视频创作者带来革命性的电影级运镜解决方案。该技术通过AI生成手段,精准复现复杂镜头运动,如《盗梦空间》中的旋转走廊镜头或《泰坦尼克号》船头追踪镜头,大幅降低专业运镜的实现门槛。CamCloneMaster结合了深度学习与三维场景建模,使创作者仅需简单输入即可生成流畅、符合电影美学的镜头轨迹,推动视频创作向更高视觉水准迈进。
在X平台上,已有63万人关注一种无需训练的GRPO技术,该技术将Group Relative Policy Optimization(GRPO)算法应用于上下文空间学习,显著提升了大模型在复杂任务中的表现。年初,随着DeepSeek-R1模型的发布,大模型强化学习(RL)迎来发展热潮。GRPO凭借其高效稳定的优化机制,迅速成为数学推理、工具调用与多智能体协作等场景中最常用的强化学习算法之一,推动了大模型在实际应用中的广泛落地。
智源开源的EditScore项目利用在线强化学习技术,为指令引导的图像编辑带来了突破性进展。尽管当前多模态大型模型在图像编辑领域已取得一定成果,但在处理复杂、精细文本指令时仍难以实现一次性精准编辑,用户常需反复尝试与手动筛选。EditScore通过引入强化学习机制,显著提升了模型对细粒度指令的理解与执行能力,优化了编辑结果的稳定性和质量,降低了人工干预需求,推动图像编辑向高效、精准的方向发展。
近日,《Nature》杂志对哈佛大学与麻省理工学院联合推出的ToolUniverse平台给予高度评价。该平台突破性地使人工智能能够通过自然语言操作超过600个科学工具,显著提升了科研自动化水平。这一创新不仅降低了技术使用门槛,还加速了实验设计与数据分析流程,预示着科学发现正迈向以AI深度参与为核心的新范式。ToolUniverse的诞生标志着人工智能在科学研究中的角色从辅助支持向主动参与的重要转变。
近期,Node包管理器(npm)生态系统接连遭遇两起基于人工智能技术的供应链攻击,影响范围波及数百个开源软件包。攻击者利用AI生成高度仿真的恶意代码和账户凭证窃取脚本,伪装成合法开发工具发布至平台,导致大量开发者面临数据泄露风险。这些事件暴露了AI技术被滥用于破坏开源依赖链的新型威胁模式,凸显了当前npm在包审核与身份验证机制上的安全短板。随着攻击手段不断演化,开源社区亟需加强自动化检测与人工审查结合的防御体系。
IBM Cloud Code Engine作为IBM推出的全托管无服务器计算平台,现已支持配备GPU的Serverless Fleets,标志着其在高性能计算领域的重大进展。该升级使平台能够高效执行企业级AI、生成式AI、机器学习及复杂仿真等计算密集型任务。通过集成GPU资源,IBM实现了无服务器架构下对并行计算和人工智能工作负载的优化支持,在保持按需付费灵活性的同时,显著提升了处理大规模计算任务的能力。这一创新简化了高性能应用的部署流程,助力开发者更高效地构建和运行AI驱动的应用。
谷歌即将发布重大更新,推出结合“神级模型”Gemini 3.0的创新氛围编程工具,旨在彻底革新前端开发领域。该工具通过深度整合AI能力与开发环境,提升代码生成效率与智能交互体验,标志着前端编程迈向智能化新阶段。官方宣布在即,业界广泛关注这一技术突破如何重塑开发流程。
现代数据建模并非旨在取代传统数据模型,而是通过增强其结构与逻辑基础,赋予其更高的适应性与智能性。在保留传统模型严谨性的前提下,现代方法引入了协作智能与语义理解的新维度,推动技术架构与人文关怀的深度融合。这一演进不仅优化了数据的组织方式,更强调数据背后的意义与使用者的需求,使数据系统更具可解释性与人性化特征。未来,数据建模将不再仅服务于技术实现,而是成为连接人与信息、逻辑与价值的桥梁。
近日,Meta公司对其人工智能部门进行了一次大规模人员调整,裁撤约600名员工。此次裁员主要涉及AI基础设施建设、基础人工智能研究以及与产品相关的核心技术岗位,其中不乏长期投身于AI技术研发的资深专业人员。尽管此次调整波及多个关键领域,但新成立的超级智能实验室未受影响,仍保持正常运作。这一举措反映出Meta在人工智能战略布局上的重新聚焦,旨在优化资源配置,提升研发效率。
最新研究表明,人工智能系统在长期接触低质量网络数据后,可能出现认知能力下降现象,类似于人类大脑退化。康奈尔大学的研究显示,大型语言模型(LLM)在持续暴露于劣质内容时,其理解力、推理能力和伦理一致性均显著降低。这一发现印证了OpenAI创始人奥尔特曼所提出的“死网论”担忧,即网络环境的恶化可能对AI造成长期负面影响,引发AI退化与LLM衰退的风险。
近日,800多位全球知名人士联合发起一项倡议,呼吁对超级智能技术的发展实施全球禁令。该联盟涵盖人工智能领域的先驱杰弗里·辛顿(Geoffrey Hinton)、百度前总裁张亚勤,以及政治家史蒂夫·班农(Steve Bannon)、社会活动家梅根·马克尔(Meghan Markle)和演员斯蒂芬·弗莱(Stephen Fry)等各界代表。他们共同表达了对高级人工智能系统潜在风险的深切担忧,强调若缺乏有效监管,超级智能可能对人类社会、安全与伦理构成重大威胁。此次倡议旨在推动国际社会采取协同措施,防止技术失控,确保人工智能发展始终服务于人类福祉。
面对零售行业日益激烈的竞争与客流压力,塔吉特公司正通过人工智能技术加速业务转型。该公司推出名为“Target Trend Brain”的生成式AI平台,显著提升了市场趋势洞察与产品开发效率。该平台能够在数小时内分析全球消费数据、社交媒体动态和时尚潮流,将原本需要数周的决策过程缩短至几小时,极大增强了响应速度。同时,塔吉特利用AI赋能设计师,激发创意潜能,推动产品创新。通过AI驱动的趋势预测与设计支持,塔吉特不仅优化了商品组合,还加快了从概念到上架的周期,巩固其在零售市场的竞争力。
Pixnapping是一种新兴的安卓平台攻击手段,利用系统侧信道漏洞实现跨应用像素窃取。攻击者通过恶意应用读取屏幕渲染数据,从而非法获取其他应用界面中的敏感信息,如密码、验证码及个人消息。研究表明,包括Signal、Google Authenticator和Venmo在内的主流安全与金融类应用均可能受此威胁。该漏洞源于安卓图形子系统的权限管理缺陷,使得非特权应用也能间接访问像素级显示内容,形成严重的隐私泄露风险。
斯坦福大学的研究团队近期开发出一项创新技术,可将传统的科研论文转化为具备交互功能的AI智能体。该技术利用自然语言处理与知识图谱构建,使用户能与论文内容进行实时对话,快速获取研究细节、方法论及数据解读,显著提升信息获取效率。实验数据显示,使用该交互系统的研究员在理解复杂论文时的效率提升了40%。这一进展有望重塑科研工作流程,减轻研究人员的信息筛选负担,增强跨学科合作的可行性。随着AI智能体在学术场景中的深入应用,未来科研论文或将从静态文本演变为动态、可交互的知识载体。




