ElevenLabs AI语音合成与深度学习声音生成技术 - 厂商专题

首页

API市场

大模型广场 AI应用创作提示词即图片 API导航产品价格

市场|导航

控制台

ElevenLabs

Audio Native API

通过POST请求，用户可以创建一个音频原生项目，并上传相关文件。API支持多种编程语言调用，如Python、TypeScript、Go等。创建成功后，将返回项目ID和HTML片段，便于嵌入到网页中。

ElevenLabs

2720

Speech to Text API

该API使用先进的Scribe v1模型，提供高精度的语音转文本服务，支持多语言、多说话者识别，并能处理非语音音频事件。适用于需要高精度转录而非实时转录的场景。

ElevenLabs

3173

Text to Dialogue API

该API使用Eleven v3模型，能够从文本生成自然、富有表现力的对话。它支持多种语言和音频格式，适用于视频游戏、播客和有声书等场景。API支持通过文本中的情感描述和音频标签来调整对话的情感表达。

ElevenLabs

2207

Voice Changer API

该API能够捕捉原始音频中的情感、口音和细微差别，实现高度逼真的声音转换。支持29种语言，适用于多语言和跨录音会话的字符声音一致性。

ElevenLabs

2394

Voice Isolator API

该API能够从音频和视频文件中提取语音，去除背景噪音、音乐和其他干扰声音。支持多种音频和视频文件格式，适用于在嘈杂环境中录制的音频处理。

ElevenLabs

4018

Dubbing API

该API通过分离每个说话者的对话与背景音，允许在另一种语言中重现原始表达。支持多语言输出、保留原始声音、保持背景音频等功能，适用于大规模或自动化工作流程。

ElevenLabs

3129

ElevenLabs Voices API

ElevenLabs Voices API 允许用户通过文本提示创建和定制语音，支持多种语言和语音类型。用户可以从社区语音库中选择语音，或通过克隆和设计工具创建自定义语音。API 还提供了语音管理功能，方便用户搜索、过滤和组织语音。

ElevenLabs

3309

Forced Alignment API

Forced Alignment API用于将语音音频与文本对齐，生成时间对齐的转录本。适用于需要为转录本中的每个单词或短语提供精确时间戳的场景，如视频字幕匹配或电子书的有声读物录制。支持29种语言，最大音频文件大小为3GB，最长音频时长为10小时。

ElevenLabs

4468

Eleven Music API

Eleven Music API 允许用户通过自然语言提示生成各种风格和类型的音乐，支持多语言和多种音频格式，适用于多种商业用途。

ElevenLabs

2008

Text to Speech API

ElevenLabs的Text to Speech API能够将文本转换为具有细腻语调、节奏和情感意识的语音音频。该API支持32种语言，适用于全球媒体广告、多语言有声书制作以及实时音频流等场景。

ElevenLabs

3005

ElevenLabs sound effects API

该API通过文本描述生成高质量音效，支持精确控制时长、风格和复杂度。适用于电影音效设计、游戏自定义音效和视频内容的Foley音效。

ElevenLabs

3457