
需两次购买:①订购原厂商接口 ②订购易源会员包代理转发;为开发者提供语音转文字服务的最佳体验,开放实时语音识别、一句话识别和录音文件识别三种服务形式,满足不同类型开发者需求,具备识别准确率高、接入便捷、性能稳定等特点。
腾讯云语音合成技术(TTS)可以将任意文本转化为语音,实现让机器和应用张口说话。 腾讯TTS技术可以应用到很多场景,比如,移动APP语音播报新闻;智能设备语音提醒;依靠网上现有节目或少量录音,快速合成明星语音,降低邀约成本;支持车载导航语音合成的个性化语音播报。原接口订购地址:https://cloud.tencent.com/product/tts
| 参数名称 | 类型 | 示例值 | 必须 | 描述 |
|---|---|---|---|---|
| content-type | String | application/x-www-form-urlencoded | 否 |
| 参数名称 | 类型 | 示例值 | 必须 | 描述 |
|---|---|---|---|---|
| ds_id | String | - | 是 | 数据源 |
| Text | String | 我爱你,中国 | 是 | 合成语音的源文本,按UTF-8编码统一计算。 中文最大支持150个汉字(全角标点符号算一个汉字);英文最大支持500个字母(半角标点符号算一个字母)。 |
| SessionId | String | 001 | 是 | 一次请求对应一个SessionId,会原样返回,建议传入类似于uuid的字符串防止重复。 |
| Volume | Number | 0 | 否 | 音量大小,范围:[0,10],分别对应11个等级的音量,默认为0,代表正常音量。没有静音选项。 |
| Speed | Number | 0 | 否 | 语速,范围:[-2,6],分别对应不同语速: -2代表0.6倍 -1代表0.8倍 0代表1.0倍(默认) 1代表1.2倍 2代表1.5倍 6代表2.5倍 如果需要更细化的语速,可以保留小数点后一位,例如0.5 1.1 1.8等。 |
| ProjectId | Number | 0 | 否 | 项目id,用户自定义,默认为0。 |
| ModelType | Number | 1 | 否 | 模型类型,1-默认模型。 |
| VoiceType | Number | 0 | 否 | 音色 ID,包括标准音色与精品音色,精品音色拟真度更高,价格不同于标准音色,请参见购买指南。完整的音色 ID 列表请参见音色列表。 购买指南:https://cloud.tencent.com/document/product/1073/34112 音色列表:https://cloud.tencent.com/document/product/1073/92668 |
| PrimaryLanguage | Number | 1 | 否 | 主语言类型: 1-中文(默认) 2-英文 |
| SampleRate | Number | 16000 | 否 | 音频采样率: 16000:16k(默认) 8000:8k |
| Codec | String | wav | 否 | 返回音频格式,可取值:wav(默认),mp3,pcm |
| EnableSubtitle | Boolean | false | 否 | 是否开启时间戳功能,默认为false。 |
| SegmentRate | Number | 0 | 否 | 断句敏感阈值,默认值为:0,取值范围:[0,1,2]。该值越大越不容易断句,模型会更倾向于仅按照标点符号断句。此参数建议不要随意调整,可能会影响合成效果。 |
| EmotionCategory | String | - | 否 | 控制合成音频的情感,仅支持多情感音色使用。取值: neutral(中性)、sad(悲伤)、happy(高兴)、angry(生气)、fear(恐惧)、news(新闻)、story(故事)、radio(广播)、poetry(诗歌)、call(客服) |
| EmotionIntensity | Number | 100 | 否 | 控制合成音频情感程度,取值范围为[50,200],默认为100;只有EmotionCategory不为空时生效; |
showapi_res_body 系统封装,业务数据均位于该对象内;系统级字段见。