语音合成 API

多版本语音合成服务,支持高清/极速文本转语音、长文本异步合成及语音克隆功能。

本页面仅提供API测试,调用的API服务由 Novita AI 提供,用量购买及管理请前往其官网。浏览器直调API,易源不做代理转发。

Novita AI 语音合成

密钥仅在浏览器端存储,易源不做转发

MiniMax Speech-2.5-hd-preview TTS

生成结果

功能示例

生日祝福

输入:

"生日快乐!愿你每天都充满阳光和欢笑,所有梦想都能实现!"

输出:

28秒MP3音频,"友好男声"音色,情感生动自然

儿童故事

输入:

"小兔子蹦蹦跳跳地来到森林里,遇到了正在摘苹果的小松鼠..."

输出:

42秒MP3音频,"甜美女生"音色,情感温柔亲切

产品推广

输入:

"全新智能手表,24小时心率监测,超长续航14天,现在下单立减200元!"

输出:

35秒MP3音频,"热情主播"音色,情感饱满有力

英语教学

输入:

"Hello, everyone! Today we will learn a new word: 'serendipity'..."

输出:

58秒MP3音频,"清晰英音"音色,发音标准

订单通知

输入:

"您的订单已发货,快递单号:SF123456789,预计明天14:00前送达"

输出:

32秒MP3音频,"专业客服"音色,语调平稳清晰

游戏配音

输入:

"勇士们,拿起武器!黑暗军团即将入侵,为了家园,战斗到底!"

输出:

22秒MP3音频,"低沉战士"音色,情感激昂有力

使用场景

移动应用开发

为各类移动应用添加语音交互功能,提升用户体验

视频内容创作

快速生成视频配音,适用于短视频、广告和教程制作

在线教育

生成教学音频内容,支持多语言学习材料制作

电商服务

自动化订单通知、产品介绍语音,提升购物体验

音频内容制作

生成播客、有声书等音频内容,支持自定义声音

游戏开发

为游戏角色生成语音,支持多种情感和风格

价格信息

价格由API服务商设定,详细的定价信息和套餐选项请访问官方文档查看。

查看官方定价

常见问题

支持哪些音频格式输出?

支持mp3、pcm、flac和wav等多种音频格式,可根据需求在API请求中指定输出格式。

最长支持多少文本长度?

API支持最长10,000字符的文本输入,对于更长的文本,可以使用长文本异步合成功能。

可以自定义语音的哪些参数?

支持自定义音量、音调、语速等参数,还可以选择不同的音色ID和情感风格,打造个性化语音效果。

是否支持语音克隆功能?

是的,API提供语音克隆功能,可以通过上传音频文件快速克隆指定声音,并用于后续的文本转语音。

如何处理长文本合成需求?

对于超过限制长度的文本,可以使用异步合成接口,系统将在后台处理并通过回调返回结果。

支持哪些语言的语音合成?

支持中文、英文、日文、韩文等多种语言,可通过language_boost参数增强特定语言的识别效果。