本文介绍了一种完全透明且开源的共情语音对话模型,该模型通过三个阶段的训练和四个核心模块实现了端到端的对话能力。尽管GPT-4o和Gemini等顶级语音模型展示了卓越的共情对话技能,但它们的技术细节并未公开。此模型的设计目标是提供一个开放的平台,使研究者和开发者能够深入了解并改进共情对话技术。
客服热线请拨打
400-998-8033