技术博客

ViT³：开创视觉序列建模的新纪元

本文介绍一种新型视觉模型ViT³，其完全基于TTT（Tree-structured Transformer Tokenization）架构设计，专用于高效视觉序列建模。区别于传统Transformer的平方级计算复杂度，ViT³实现线性复杂度，在图像分类、目标检测与语义分割等主流视觉任务中展现出强竞争力，为轻量级、可扩展的视觉模型提供了新的基准范式。

ViT³TTT架构视觉模型序列建模线性复杂度

2026-05-18

AI热点

2026-06-25

机器人精细操作：从视觉识别到动态预测的技术演进

科技热点

机器人精细操作：从视觉识别到动态预测的技术演进