技术博客

企业Agent评测方案中README.md与AGENTS.md的分合之道

在基于Harness构建企业级Agent评测方案的过程中，README.md与AGENTS.md的职责边界引发关键架构决策。当前AGENTS.md作为独立指令文件，旨在弥补LLM在上下文窗口有限、推理能力不完美等现实约束下的能力缺口；它本质上是一种过渡性脚手架技术。随着LLM演进，模型将逐步具备直接理解完整代码库（含README、源码、注释及设计文档）的能力，届时专用指令文件的必要性将显著降低甚至消失。该趋势提示：评测体系设计需兼顾当下实用性与未来可演进性。

Agent评测HarnessAGENTS.md上下文窗口LLM演进

2026-06-09

大型语言模型的架构演进：从Transformer优化到长文本处理突破

近期，以Gemma 4、DeepSeek V4为代表的多个大型语言模型（LLM）迎来关键架构演进。这些模型聚焦Transformer架构内部的深度优化，在保持性能的同时显著降低长文本处理所需的计算与存储成本。通过稀疏注意力机制、分层上下文压缩及动态KV缓存等创新设计，模型在千级至万级token序列上的推理效率提升达30%–50%，内存占用减少约40%。此类架构创新不仅拓展了LLM在文档分析、代码生成与长程对话等场景的应用边界，也为资源受限环境下的部署提供了新可能。

LLM演进Transformer优化长文本处理计算成本架构创新

2026-05-19

DeepSeek DualPath技术：Agentic推理如何重塑存储I/O优化

DeepSeek推出的DualPath技术依托Agentic推理范式，显著优化了存储I/O性能，实测吞吐量提升达1.96倍。该突破标志着大型语言模型（LLM）正加速从传统单轮对话式ChatBot，向具备自主规划、工具调用与多轮交互能力的智能体系统演进。DualPath不仅强化了模型在复杂系统任务中的决策效率，也为LLM深度融入底层基础设施优化提供了新路径。

DualPathAgentic推理I/O优化LLM演进智能体系统

2026-02-27

从大型语言模型到人工智能智能体：AGI边界的新探索

过去两年中，大型语言模型（LLM）正加速向人工智能智能体（AI Agents）演进。这些基于基础模型构建的智能体，已在深度研究、软件工程、科学发现及多智能体协作等关键领域展现出突破性能力，持续拓展人工通用智能（AGI）的边界。相较于传统LLM的单轮响应范式，AI智能体具备目标导向、工具调用与自主规划能力，显著提升任务完成的深度与广度。多智能体协同架构更推动系统级智能涌现，成为通向AGI的重要路径。

LLM演进AI智能体AGI边界多智能体基础模型

2026-01-27

AI热点

2026-06-29

BrowserBC技术：实现网页操作的通用化革命

科技热点

BrowserBC技术：实现网页操作的通用化革命