ElevenLabs
Audio Native API

Audio Native API

通过POST请求,用户可以创建一个音频原生项目,并上传相关文件。API支持多种编程语言调用,如Python、TypeScript、Go等。创建成功后,将返回项目ID和HTML片段,便于嵌入到网页中。

ElevenLabs
ElevenLabs
1214
Speech to Text API

Speech to Text API

该API使用先进的Scribe v1模型,提供高精度的语音转文本服务,支持多语言、多说话者识别,并能处理非语音音频事件。适用于需要高精度转录而非实时转录的场景。

ElevenLabs
ElevenLabs
1923
Text to Dialogue API

Text to Dialogue API

该API使用Eleven v3模型,能够从文本生成自然、富有表现力的对话。它支持多种语言和音频格式,适用于视频游戏、播客和有声书等场景。API支持通过文本中的情感描述和音频标签来调整对话的情感表达。

ElevenLabs
ElevenLabs
1146
Voice Changer API

Voice Changer API

该API能够捕捉原始音频中的情感、口音和细微差别,实现高度逼真的声音转换。支持29种语言,适用于多语言和跨录音会话的字符声音一致性。

ElevenLabs
ElevenLabs
1421
Voice Isolator API

Voice Isolator API

该API能够从音频和视频文件中提取语音,去除背景噪音、音乐和其他干扰声音。支持多种音频和视频文件格式,适用于在嘈杂环境中录制的音频处理。

ElevenLabs
ElevenLabs
1456
Dubbing API

Dubbing API

该API通过分离每个说话者的对话与背景音,允许在另一种语言中重现原始表达。支持多语言输出、保留原始声音、保持背景音频等功能,适用于大规模或自动化工作流程。

ElevenLabs
ElevenLabs
1260
ElevenLabs Voices API

ElevenLabs Voices API

ElevenLabs Voices API 允许用户通过文本提示创建和定制语音,支持多种语言和语音类型。用户可以从社区语音库中选择语音,或通过克隆和设计工具创建自定义语音。API 还提供了语音管理功能,方便用户搜索、过滤和组织语音。

ElevenLabs
ElevenLabs
1374
Forced Alignment API

Forced Alignment API

Forced Alignment API用于将语音音频与文本对齐,生成时间对齐的转录本。适用于需要为转录本中的每个单词或短语提供精确时间戳的场景,如视频字幕匹配或电子书的有声读物录制。支持29种语言,最大音频文件大小为3GB,最长音频时长为10小时。

ElevenLabs
ElevenLabs
2054
Eleven Music API

Eleven Music API

Eleven Music API 允许用户通过自然语言提示生成各种风格和类型的音乐,支持多语言和多种音频格式,适用于多种商业用途。

ElevenLabs
ElevenLabs
1223
Text to Speech API

Text to Speech API

ElevenLabs的Text to Speech API能够将文本转换为具有细腻语调、节奏和情感意识的语音音频。该API支持32种语言,适用于全球媒体广告、多语言有声书制作以及实时音频流等场景。

ElevenLabs
ElevenLabs
1673
ElevenLabs sound effects API

ElevenLabs sound effects API

该API通过文本描述生成高质量音效,支持精确控制时长、风格和复杂度。适用于电影音效设计、游戏自定义音效和视频内容的Foley音效。

ElevenLabs
ElevenLabs
1742