近期,人工智能专家Yann LeCun推荐了一种名为JEPA(Joint-Embedding Predictive Architecture)的新方法,该技术正被应用于大型语言模型(LLM)的训练中。与传统依赖输入空间进行预测(如下一个词预测)的方式不同,JEPA借鉴计算机视觉领域的思路,转而在嵌入空间中进行训练。这种方法通过捕捉更高层次的语义结构,显著提升了模型的性能与鲁棒性。研究表明,在嵌入空间中建模有助于减少噪声干扰,并增强模型对语义变化的适应能力,为LLM训练提供了更具前景的技术路径。
客服热线请拨打
400-998-8033