安全声明:本测试功能完全绿色免费,调用时直连对方服务器,本站不做任何转发且不存储您的任何Token,请放心使用!
基础配置
API密钥,用于鉴权
选择接入点:
POST
接入点文档:查看
Run: Ctrl+
接入点描述:从文本生成语音,并包含精确的字符级时间信息,用于音频-文本同步。
请求参数
voice_id*
用于生成语音的Voice ID,可以通过https://api.elevenlabs.io/v1/voices获取所有可用的Voice ID。
text*
将被转换为语音的文本。
model_id
将使用的模型标识符,可以通过GET /v1/models查询。模型需要支持文本到语音,可以通过can_do_text_to_speech属性检查。
language_code
用于强制模型使用特定语言的语言代码(ISO 639-1)。目前仅Turbo v2.5和Flash v2.5支持语言强制。对于其他模型,如果提供了语言代码,将返回错误。
voice_settings.similarity_boost
确定AI在尝试复制原始声音时应遵循的紧密程度。
voice_settings.speed
调整语音的速度。值为1.0是默认速度,小于1.0的值会减慢语速,大于1.0的值会加快语速。
voice_settings.stability
控制语音的稳定性和生成之间的随机性。较低的值会为声音引入更广泛的情感范围。较高的值可能导致声音单调且情感有限。
voice_settings.style
确定语音的风格夸张程度。此设置尝试放大原始说话者的风格。它会消耗额外的计算资源,并且如果设置为0以外的值,可能会增加延迟。
voice_settings.use_speaker_boost
此设置增强了与原始说话者的相似性。使用此设置需要稍高的计算负载,从而会增加延迟。
apply_text_normalization
此参数控制文本规范化,有三种模式:‘auto’,‘on’,和‘off’。当设置为‘auto’时,系统将自动决定是否应用文本规范化(例如,拼写数字)。‘on’时,文本规范化将始终应用,而‘off’时,将跳过文本规范化。对于‘eleven_turbo_v2_5’和‘eleven_flash_v2_5’模型,文本规范化仅在企业计划中启用。
apply_language_text_normalization
此参数控制语言文本规范化。这有助于在某些支持的语言中正确发音文本。警告:此参数可能会显著增加请求的延迟。目前仅支持日语。
pronunciation_dictionary_locators[0].pronunciation_dictionary_id*
发音字典的ID
pronunciation_dictionary_locators[0].version_id*
发音字典的版本ID
previous_request_ids
在此生成之前生成的样本的request_id列表。可用于在将大任务拆分为多个请求时改善语音的连续性。当使用相同模型时,结果最佳。如果同时发送previous_text和previous_request_ids,previous_text将被忽略。最多可以发送3个request_id。
next_request_ids
在此生成之后生成的样本的request_id列表。next_request_ids在重新生成具有某些音频质量问题的样本时特别有用,以保持语音的连续性。例如,如果您生成了3个语音片段,并且您想改进片段2,将片段3的request_id作为next_request_id(以及片段1的request_id作为previous_request_id)将有助于在组合语音中保持自然流畅。当使用相同模型时,结果最佳。如果同时发送next_text和next_request_ids,next_text将被忽略。最多可以发送3个request_id。
previous_text
当前请求文本之前的文本。可用于在将多个生成拼接在一起时改善语音的连续性,或在当前生成中影响语音的连续性。
next_text
当前请求文本之后的文本。可用于在将多个生成拼接在一起时改善语音的连续性,或在当前生成中影响语音的连续性。
seed
如果指定,我们的系统将尽力进行确定性采样,使得具有相同种子和参数的重复请求应返回相同的结果。确定性不保证。必须是0到4294967295之间的整数。
output_format
生成音频的输出格式。格式为codec_sample_rate_bitrate。例如,22.05kHz采样率的32kbps MP3表示为mp3_22050_32。192kbps的MP3需要订阅Creator层级或更高。44.1kHz采样率的PCM需要订阅Pro层级或更高。
enable_logging
当enable_logging设置为false时,将使用零保留模式处理请求。这意味着历史记录功能将不可用,包括请求拼接。零保留模式仅适用于企业客户。
返回结果
当前为示例返回
更多接入点测试
使用其他软件测试API
您可以拷贝Curl语句,直接导入Postman进行测试