前Coinbase首席技术官对人工通用智能(AGI)的可行性提出质疑,认为其是一个不切实际的概念。他预测,未来将进入一个被称为“多神AI”的时代,即多个专业化AI系统并存、协作的格局。在这一趋势中,无人机的应用可能比聊天机器人更具破坏性,尤其在工业、物流和军事领域。此外,他指出将AI的概率性思维(系统1,类似人类直觉)与传统计算的确定性逻辑思维(系统2)结合,是未来发展的关键方向,但目前仍是一个未解的科研难题。在实现这一目标之前,认清AI的局限性和潜力,有助于我们更有效地利用现有技术,推动社会与产业的智能化转型。
本文对当前主流的六个开源多模态大模型进行了系统性对比评测,涵盖智谱科技于2024年7月开源的GLM-4.1V-9B-Thinking、昆仑万维的Skywork-R1V3、阶跃科技推出的Step3,以及此前已开源的千问科技Qwen2.5-VL-72B、书生科技InternVL3-78B和百度ERNIE-4.5-VL-424B-A47B。评测内容不仅包括模型架构、参数规模与推理能力等核心指标,还结合13个实际应用场景,深入分析了各模型在图像识别、自然语言理解、跨模态生成等任务中的表现。通过本次评测,旨在为研究者与开发者提供全面、客观的参考依据,助力多模态人工智能技术的进一步发展。
在8月5日的AI Day开放日活动中,百度智能云宣布推出全球首批AI数字员工,标志着企业在智能化转型中的重要突破。这些AI数字员工将广泛应用于多个核心业务职能,包括营销经理、还款助理、汽车销售、促销专员、产品经理、课程顾问和招聘专员等角色。通过打造企业级Agent的最佳实践,百度智能云旨在为企业提供更高效、智能的运营解决方案,推动人工智能技术在各行业的深度应用。
近日,通义模型系列再添新成员——Qwen-Image,这是一个专注于图像生成的基础模型,拥有200亿参数,采用了先进的MMDiT架构。该项目显著提升了AI生成图像中的文字质量,达到了当前最佳水平(SOTA),成为通义千问系列中首个专注于图像生成的大型模型。Qwen-Image的发布标志着通义实验室在多模态领域迈出了重要一步,为图像生成技术的发展注入了新的活力。
AGICamp 第006周的AI应用榜单正式发布,展示了当前人工智能领域的创新成果与应用趋势。本次榜单涵盖了多个引人注目的应用程序,其中包括Deep Innovation、小鹿光年回忆录和才聚宝盒等。这些应用不仅体现了AI技术的快速发展,也展现了其在不同行业中的广泛应用潜力。
随着第六代移动通信系统(6G)研究的不断推进,环境感知通信技术逐渐成为6G的核心能力之一。为满足6G在复杂三维空间中的部署需求,西安电子科技大学、香港中文大学(深圳)和加拿大滑铁卢大学的研究团队合作开发了一个名为UrbanRadio3D的高分辨率多模态三维无线电图谱数据集。该数据集为6G通信环境下的无线电传播特性研究提供了重要支持。同时,研究团队还构建了一个基于扩散模型的三维无线电图生成框架,命名为RadioDiff-3D,旨在进一步提升6G环境下的通信效率与感知能力。这一系列研究成果为未来6G系统的智能化和高精度环境感知奠定了技术基础。
全球首个专为人形机器人设计的通用视觉感知系统——Humanoid Occupancy正式问世,为人形机器人更好地融入人类环境提供了全新的技术基础。该系统通过多模态环境理解的新范式,显著提升了机器人对周围环境的全面感知与精确解析能力。作为最具潜力的通用型机器人,人形机器人依赖类人化的结构设计和运动模式,其核心任务包括操作、移动和导航,而这些任务的高效执行离不开对环境的精准理解。Humanoid Occupancy的推出,标志着人形机器人技术迈出了关键一步,为人形机器人在复杂环境中的广泛应用奠定了坚实基础。
近日,南京大学周志华教授团队发布了一项突破性研究,提出了一种新型在线学习算法,旨在提升人工智能模型在动态环境中的适应能力。该算法能够持续更新和优化自身,以应对不断变化的应用场景。为了评估在线学习算法的性能,团队引入了一个全新指标——适应性遗憾值,用于衡量算法在任意时间区间内与静态最优解之间的最大性能差距。这一指标有效反映了算法在动态环境中的适应性和稳定性,为未来AI模型的在线学习能力提供了重要参考。
星尘智能推出的Astribot Suite是一项突破性的技术方案,旨在打造真正通用的家务助手机器人。该方案以“Aspera”为象征,寓意“穿越艰难,抵达星辰”,致力于解决机器人开发中的三大核心挑战,其中本体设计尤为关键。通过优化设计,Astribot实现了既安全又具备人类级别灵活性、力量和活动范围的机器人身体,为智能机器人迈向实用化奠定了坚实基础。
本文围绕时间的相对性与技术的人文关怀展开探讨,强调每一个“现在”都具有不可替代的珍贵价值。技术的真正意义并不在于解决所有现实问题,而在于激发那些看似遥不可及的梦想,使其如种子般在梦想的土壤中悄然生根,最终指向如火星探索般的宏伟目标。通过重新理解时间与技术的关系,我们能够更深刻地把握当下,为未来播下希望的种子。
随着人工智能技术的不断发展,具身智能技术在工程机械领域的应用逐渐成为研究热点,尤其在挖掘机远程控制和端到端自动装车模型方面展现出巨大潜力。矿山环境复杂且危险,为具身智能技术的验证与优化提供了理想实践场景。通过结合感知、决策与执行模块,远程控制系统能够实现对挖掘机的精准操控,而自动装车模型则有效提升了作业效率与安全性。实践表明,具身智能技术的引入不仅提高了工程机械的智能化水平,也为矿山作业的无人化、高效化发展提供了可靠支撑。
本文探讨了爱的本质,强调其作为一种被看见的永恒追求,在情感表达中展现出不可复制的真实性。尽管机器能够解析语言的逻辑结构,但它们无法还原人在心跳加速时那种语无伦次的情感流露。这种不完美的真实情感,正是人类独有的、机器难以模仿的核心体验。文章通过分析人类情感与机器逻辑之间的差异,突出了爱在人类文明中的独特价值。
在创意表达日益多元的今天,技术与工具的限制逐渐成为创作者实现灵感的障碍。文章主张将“创造”回归其本质,即每个创意都能直接实现而不受工具限制,打破传统规则,实现真正的创意自由。通过想象驱动的方式,创作者可以摆脱技术束缚,专注于内容本身的价值与表达。这种理念不仅适用于写作,也涵盖艺术、设计、音乐等多个领域。文章呼吁建立一个更加开放、包容的创作环境,让想象力成为推动创意的核心动力,而非被技术门槛所限制。只有打破固有规则,才能释放无限可能,让创作真正回归初心。
RAG(Retrieval-Augmented Generation)系统是一种融合检索与生成能力的人工智能技术,能够高效处理多源异构的知识问题。面对用户提出的直接问题,RAG系统通过智能推理和深度思考,提供详尽且准确的答案,显著提升了信息获取的效率和质量。这种技术在知识密集型任务中展现出强大的应用潜力。
Cloudflare在其Zero Trust产品套件的工程团队发表的文章中详细阐述了为何选择TimescaleDB而非ClickHouse来扩展其内部平台的分析和报告功能。文章指出,TimescaleDB在存储分析数据与配置数据方面提供了极大的便捷性,同时在性能上实现了与专用OLAP系统的出色平衡。这种优势使得Cloudflare能够以每秒100,000行的速度进行高效的数据分析,满足其日益增长的业务需求。
Apache Doris 在系统稳定性方面采取了多层次的技术优化措施,以确保数据在采集、传输、存储和计算处理各环节的稳定运行。在数据采集阶段,Apache Doris 通过高效的日志采集机制和容错设计,保障了数据的完整性与实时性。数据传输过程中,采用了加密传输技术和校验机制,确保传输安全。在存储层面,Apache Doris 利用了列式存储结构和数据压缩算法,显著提升了 I/O 效率并降低了存储成本。同时,其分布式架构支持横向扩展,有效应对数据量增长带来的压力。在计算处理方面,系统通过向量化执行引擎和智能查询优化技术,提高了查询性能并降低了资源消耗。这些技术手段共同保障了 Apache Doris 的系统稳定性。