在ICLR'26会议上,研究者提出了一种名为MAGE(Multi-scale Autoregressive Generation)的新型离线强化学习算法。该算法通过多尺度自回归生成机制,有效实现从局部描述到全局布局的渐进式建模,显著提升了策略学习的样本效率与泛化能力。MAGE不依赖在线环境交互,仅利用静态数据集即可完成高质量决策策略的训练,在机器人控制、自动驾驶等高风险场景中展现出重要应用潜力。
客服热线请拨打
400-998-8033