技术博客

InfoTok：信息论引领的视频分词革命

在ICLR 2026的口头报告中，一支由斯坦福大学、NVIDIA Cosmos团队与新加坡国立大学联合组成的研究团队正式发布了创新视频分词技术InfoTok。该技术基于信息论原理，首次实现面向视频内容的自适应分词——能依据帧间信息熵动态调整token粒度，在保障语义完整性的同时显著提升处理效率。InfoTok突破了传统固定分辨率或均匀采样范式的局限，为长时序视频理解、高效压缩与多模态对齐提供了新范式。

InfoTok视频分词信息论ICLR2026自适应

2026-03-31

AI热点

2026-06-26

剧本杀视角下的Agentic AI：沉浸式交互体验的新维度

科技热点

剧本杀视角下的Agentic AI：沉浸式交互体验的新维度