在360商业化业务线面临核心挑战的背景下,向量技术的应用显著提升了AI化效率,实现了80%的加速。作为360集团的核心业务,商业化业务线不仅承担着推进公司商业化发展的重任,还致力于探索市场新机遇。通过向量技术的支持,360商业化在激烈的市场竞争中获得了更强的技术助力。
华为公司近日宣布了一项重大的开源项目,将其先进的人工智能技术向全球开发者和研究人员开放。此次开源包括两个核心人工智能模型:盘古和盘古Pro。其中,盘古是一个拥有70亿参数的稠密型模型,而盘古Pro则是一个具有720亿参数的混合专家模型(MoE)。此外,华为还公开了基于昇腾AI处理器的模型推理技术。这一举措不仅展示了华为在人工智能领域的深厚技术实力,也为全球人工智能研究和应用提供了重要支持,进一步推动了该领域的发展。
随着大型语言模型(LLM)的快速发展,智能体技术正逐步改变数据处理与应用的方式。ClickHouse MCP集成方案应运而生,旨在为智能体打造高效、灵活的数据体验。通过这一集成,软件工程师能够更轻松地应对复杂的数据任务,而数据工程师则得以深入参与开发流程,提升协作效率。这种跨领域的融合趋势,不仅降低了技术门槛,也推动了数据驱动决策的普及。未来,随着LLM模型能力的不断增强,智能体将在更多行业中发挥关键作用,重塑数据工程与开发的协作模式。
Black Forest Labs近日宣布开源其旗舰图像模型FLUX.1 Kontext[dev],这一突破性进展为图像编辑和生成领域注入了全新活力。该模型拥有12B参数,在性能上可与GTP-4o媲美,专为图像编辑而设计,能够在短短5秒内快速生成图像,并且支持在消费级硬件上轻松运行。此次开源不仅降低了专业级别图像处理技术的门槛,也让普通用户能够便捷地享受到高质量的图像创作体验。
微软近期推出了一款深度视频探索智能体,在多个长视频理解基准测试中表现优异,标志着视频分析技术的进一步突破。尽管大型语言模型(LLMs)和大型视觉-语言模型(VLMs)在处理视频内容和长文本上下文方面取得了显著进展,但在面对信息高度密集、时长达到数小时的视频时,这些模型仍存在一定的局限性。微软的这一新智能体通过更高效的算法和优化架构,有效提升了对长时间视频内容的理解能力,为未来视频内容分析与应用提供了新的可能性。
2025年6月23日,由GMI Cloud与InfoQ联合主办的“2025 AI应用出海年中洞察暨GMI Cloud新品发布会”在线成功举办。本次会议围绕AI应用的全球化趋势、技术实践及推广策略展开深入探讨,旨在加速AI技术在全球范围内的落地与应用。活动吸引了来自多个国家的技术专家、企业代表及行业观察者参与,共同分享AI出海的挑战与机遇。会上,GMI Cloud正式发布了多款面向AI全球化的新产品,涵盖智能算力支持、跨语言模型优化及本地化部署解决方案,为AI应用走向全球提供坚实支撑。
近日,亚马逊云服务(AWS)推出了一项备受期待的新功能——用户可导出公共SSL/TLS证书。这一更新极大满足了用户在多环境部署中的实际需求,使他们能够将从AWS申请的证书及其私钥灵活运用于非AWS托管的服务中。长期以来,社区对导出功能的呼声不断,此次发布不仅提升了用户体验,也进一步强化了AWS在网络安全领域的服务能力。
10周前,一位00后创业者首次编写代码,如今他的公司Cluely已在9个行业中引起变革。Cluely员工平均拥有10万粉丝,展现出强大的影响力和号召力。在最近与a16z合伙人Erik Torenberg和Bryan Kim的深度对话中,Cluely联合创始人兼首席执行官Roy Lee首次公开了公司快速增长的秘诀和团队工作流程,并讨论了人工智能时代下产品留存的变化。通过技术革新与高效的团队管理,Cluely正以前所未有的速度推动行业变革。
百度近日宣布,其最新的文心大模型4.5系列正式对外界开源,并提供API服务。此次开源,百度共推出了10款模型,覆盖了多个应用场景,展现了公司在自主研发方面的高比例投入。这些模型在类型多样性、参数丰富性、开源政策的宽松性以及模型可靠性等关键方面,均体现了百度的诚意与技术实力。通过这一举措,百度旨在推动人工智能技术的发展,为开发者和企业提供更多创新的可能性。
硅谷财富管理巨头Iconiq Capital近日发布了一份名为《2025年AI现状报告》的深度调研,该报告在业界引发了广泛关注。这份长达67页的研究深入分析了全球人工智能领域的发展现状,特别聚焦于大型语言模型(LLM)的竞争格局。通过对300家AI公司的实地考察,报告详细探讨了AI技术在实际应用中的落地路径,涵盖了成本结构、技术选择以及人才队伍建设等多个关键方面。此外,报告还揭示了AI技术从理论走向实践过程中需要解决的七个核心问题,为行业的未来发展提供了宝贵的参考和指导。
近日,香港大学黄超教授领导的团队发布了一项名为“RAG-Anything”的开源项目,该项目是一种先进的多模态知识图谱框架。与传统RAG技术不同,RAG-Anything突破了数据类型处理的限制,实现了对多种模态数据的高效整合和应用,使得“万物皆可RAG”成为可能。这一创新为知识图谱的应用开辟了更广阔的空间,也为人工智能领域的发展注入了新的活力。
谷歌在AI编程领域取得了一项重大突破,工程师们惊讶地发现,AI能够自行编写代码,并在GPU内核算法方面超越了人类性能的21%。这一成就主要归功于AlphaEvolve项目的研究进展。基于AlphaEvolve的开源实现OpenEvolve,AI通过自学实现了代码编写,并在苹果芯片上达到了比人类更快21%的GPU核函数性能。这一成果标志着自动化编程历史上的一个重要里程碑,开启了“AI为AI编程”的新时代,表明自动化编程的奇点似乎已经到来。
ChatGPT正逐渐成为生活操作系统的化身,标志着人工智能在日常生活中的深度融入。OpenAI的CEO奥特曼透露,尽管O3模型的运行成本达到上周的五倍,但整体成本仍在持续下降,未来API的成本预计将大幅降低,这为更广泛的应用铺平了道路。与此同时,开源模型的兴起被视为推动技术普及的重要力量。ChatGPT的记忆功能也备受关注,其能力已超越传统硬件限制,朝着“AI伴侣”的方向迈进,展现出更强的互动性与个性化服务潜力。
微软公司近期推出了一款名为Deep Video Discovery(DVD)的先进智能体,该技术通过将长视频切割成较短片段,并将其视为一个可交互的环境,利用大型语言模型(LLM)的强大推理能力进行问题分析与自主规划。DVD智能体不仅能够理解视频内容,还能根据具体问题选择合适的工具,并依据工具参数逐步从环境中提取关键信息,以实现精准的问题回答。这项创新为视频分析领域带来了全新的解决方案,展示了人工智能在多媒体处理方面的巨大潜力。
本文围绕视觉任务中注意力机制的“局部性”特征展开探讨,并提出了一种系统性的分析框架。研究指出,视觉生成任务中注意力优化的主要挑战在于注意力模式的“多样性和分散性”。进一步分析发现,这些多样且分散的注意力模式可以统一为体现“局部聚合”特性的块状模式。基于此,清华大学与字节跳动联合提出了一种名为Token Reorder的方法,通过利用视觉注意力的局部性特点,成功实现了无损的5倍稀疏化和4比特量化,为视觉任务中的注意力优化提供了全新的思路。
经营一家便利店对人工智能(AI)而言是一项极具挑战性的任务,其复杂性远远超过自动售货机的运作。AI需要全面管理库存维护、价格设定、客户沟通以及避免财务危机等各个环节。在库存管理方面,AI必须精准预测商品需求并及时补货;在价格设定上,它需结合市场趋势和消费者行为动态调整;同时,与顾客的有效沟通也是提升体验和忠诚度的关键。此外,AI还需实时监控财务状况,防止潜在风险影响便利店的盈利能力。通过整合这些任务,AI才能真正胜任经营便利店这一复杂的综合管理角色。