Voice Isolator API

ElevenLabs的Voice Isolator API可以将带有背景噪音的音频转换为清晰的语音,智能去除干扰,提升语音质量。

本页面仅提供API测试,调用的API服务由 ElevenLabs 提供,用量购买及管理请前往其官网。浏览器直调API,易源不做代理转发。
Voice Isolator API 音频隔离技术

音频隔离功能

密钥仅在浏览器端存储,易源不做转发

音频背景噪音移除

或拖放文件

支持MP3、WAV、FLAC等常见音频格式

功能示例

办公室会议录音

输入

音频场景:办公室会议录音(背景含键盘敲击声、空调运行噪音)

音频格式:mp3

输出

成功提取6位参会者语音,背景噪音消除率达98%,语音清晰度提升至专业会议记录标准

街头采访录音

输入

音频场景:街头采访录音(背景含汽车鸣笛声、人群喧闹声)

音频格式:wav

输出

受访者语音清晰可辨,背景噪音降低90%,适合直接用于新闻报道剪辑

在线教学视频

输入

音频场景:在线教学视频(讲师声音混杂鼠标点击声、学生交谈声)

音频格式:mp4(视频文件)

输出

精准分离讲师人声,鼠标操作声、学生交谈声完全去除,可直接用于精品课程制作

客服通话录音

输入

音频场景:客服通话录音(背景含办公室背景音乐、同事电话交谈声)

音频格式:aac

输出

客服与客户对话语音清晰分离,背景噪音消除率92%,可直接用于服务质量评估存档

播客录音

输入

音频场景:播客录音(主播声音混杂电脑风扇声、窗外雨声)

音频格式:flac

输出

主播人声纯净度提升至广播级标准,干扰噪音完全过滤,无需二次后期调整

家庭聚会录像

输入

音频场景:家庭生日聚会录像(主角讲话背景含生日歌、餐具碰撞声)

音频格式:mov(视频文件)

输出

成功提取生日祝福语音,生日歌音量减弱至不影响语音理解,保留温馨氛围的同时确保语音清晰可存档

使用场景

会议记录整理

自动清除会议录音中的背景噪音,提高语音转文字准确率,轻松生成会议纪要

媒体内容制作

提升采访、播客等内容的音频质量,减少后期制作时间,降低专业录音设备要求

远程教育优化

改善在线课程音频质量,消除环境干扰,提升学生听课体验和学习效果

客服质量监控

清晰分离客服通话中的人声,便于质量检查和培训分析,提升客户服务水平

法律证据处理

增强录音证据的语音清晰度,确保关键信息不被背景噪音掩盖,提高证据可用性

个人语音存档

优化家庭聚会、口述回忆等珍贵语音资料,去除杂音干扰,长久保存清晰记忆

价格信息

价格由API服务商设定,详细的定价方案和计费标准请参考ElevenLabs官方网站。

查看官方定价

常见问题

Voice Isolator API支持哪些音频格式?

API支持多种音频和视频格式,包括mp3、wav、aac、flac等音频格式,以及mp4、mov等视频文件。对于特殊格式如'pcm_s16le_16',要求输入音频必须是16位PCM,16kHz采样率,单声道(mono),小端字节序。

API处理音频的大小和时长有限制吗?

是的,API对单次处理的音频文件大小有限制,最大支持10MB的音频文件。对于较长的音频,建议分段处理后再合并结果。处理时间取决于音频长度和服务器负载,通常几秒钟到几分钟不等。

如何获取API密钥进行调用?

要获取API密钥,您需要在ElevenLabs官网注册账号并创建API密钥。注册后,在账户设置的API部分可以找到您的xi-api-key。请妥善保管您的API密钥,不要在客户端代码中暴露密钥。

API能处理多个人声的音频吗?

是的,Voice Isolator API能够处理包含多个人声的音频,如会议录音中的多个发言人。API会保留所有清晰的人声,同时去除背景噪音,而不会区分或分离不同的人声。

处理后的音频质量如何?会影响原始语音吗?

API采用先进的AI算法,在去除背景噪音的同时最大限度保留原始语音质量。处理后的语音清晰度显著提升,而不会引入明显的失真或 artifacts。对于大多数应用场景,处理后的音频无需进一步编辑即可直接使用。

如果对处理结果不满意,有什么调整方法吗?

目前API提供标准的噪音消除处理,不支持自定义参数调整。如果对结果不满意,可以尝试调整输入音频的音量或格式后重新提交处理。对于特殊需求,建议在API处理后使用音频编辑软件进行二次调整。