阿里巴巴通义实验室近日发布了一款名为FunAudio-ASR的端到端语音识别大模型,该模型引入了创新的Context模块,有效解决了语音识别中的“幻觉”和“串语种”问题。通过这一技术突破,FunAudio-ASR在嘈杂环境下的表现尤为突出,将幻觉率从78.5%大幅降低至10.7%,降幅接近70%,显著提升了语音识别的准确性和可靠性。
客服热线请拨打
400-998-8033