Kimi-Audio:开启语音技术新纪元
昨日,一款名为Kimi-Audio的全新全能音频模型正式发布。该模型经过1300万小时以上的数据训练,集成了多项前沿语音技术,包括语音识别(ASR)、音频问答(AQA)、音频字幕(AAC)、语音情感识别(SER)、声音事件/场景分类(SEC/ASC)、文本到语音(TTS)、语音转换(VC)以及端到端语音对话功能。Kimi-Audio致力于实现语音技术的全面整合,为用户提供更智能、更高效的音频处理解决方案。
Kimi-Audio音频模型语音技术情感识别文本到语音
2025-04-28
Kimi-Audio:开源音频基础模型的性能突破
Kimi-Audio作为一款开源音频基础模型,在多项基准测试中展现了卓越的性能,总体表现稳居榜首。该模型在音频处理领域几乎没有明显的性能缺陷,为用户提供了高效、稳定的解决方案,成为行业关注的焦点。
Kimi-Audio开源音频基准测试性能卓越总体性能
2025-04-27
AI热点
1
2025-05-11
AI提示词精粹:解锁AI输出的高效路径