北京大学宋国杰教授团队发表了一篇关于大语言模型(LLM)心理测量学的综述论文。这篇63页的论文引用了500篇文献,首次系统性地探讨了科学评估LLM心智特征的方法,包括价值观、性格和社交智能。研究指出,随着LLM能力的迅速发展,传统评估方法已难以满足需求,亟需建立更全面、更可靠的AI评估体系。
客服热线请拨打
400-998-8033