上海交通大学与SII合作开发的电脑智能体通过312条轨迹训练,性能提升了241%,超越了Anthropic公司的Claude 3.7。这一成果借助强化学习(RL)算法,显著增强了智能体的能力,吸引了全球关注,展示了RL在人工智能领域的巨大潜力。
客服热线请拨打
400-998-8033