文本转语音API

此API利用TTS模型将文本转换为音频,支持多种音色和音频格式。

本页面仅提供API测试,调用的API服务由 阶跃星辰 提供,用量购买及管理请前往其官网。浏览器直调API,易源不做代理转发。

阶跃星辰音频服务

高效准确的音频处理API,支持音频转文本、音色复刻、音色查询和音频生成功能

密钥仅在浏览器端存储,易源不做转发

音频文件转文本

上传音频文件,获取对应的文本内容。支持多种音频格式,准确高效。

支持格式: flac, mp3, mp4, mpeg, mpga, m4a, ogg, wav, webm, aac, opus,文件大小限制:小于 100MB

转换结果

上传音频文件并点击"转换音频"按钮获取文本结果

功能示例

基础文本转男声语音

输入:

  • 文本内容:欢迎使用阶跃星辰语音服务
  • 选择音色:标准男声
  • 语音模型:标准版

输出:

  • 音色名称:标准男声
  • 音频格式:mp3
  • 时长:18秒
  • 效果:发音清晰,语速适中

情感文本转女声语音

输入:

  • 文本内容:今天是个好日子,阳光明媚
  • 选择音色:温柔女声
  • 情感风格:高兴
  • 语音模型:增强版

输出:

  • 音色名称:温柔女声(高兴)
  • 音频格式:mp3
  • 时长:22秒
  • 效果:语调轻快,充满喜悦感

儿童故事转儿童声语音

输入:

  • 文本内容:小兔子蹦蹦跳跳来到森林里
  • 选择音色:可爱儿童声
  • 语速:慢速
  • 语音模型:儿童专用版

输出:

  • 音色名称:可爱儿童声
  • 音频格式:wav
  • 时长:35秒
  • 效果:语速舒缓,发音稚嫩

复刻个人专属音色

输入:

  • 个人录音文件ID:file-789AbcXyZ
  • 录音对应文本:大家好,我是小明
  • 试听文本:欢迎使用我的专属语音

输出:

  • 音色名称:小明专属音色
  • 音色ID:voice-xm123
  • 状态:复刻成功
  • 效果:与原录音声音相似度95%

查询系统可用官方音色

输入:

  • 查询条件:显示前5个音色
  • 排序方式:按最新排序

输出:

  • 1. 标准男声(voice-standard-male)
  • 2. 温柔女声(voice-gentle-female)
  • 3. 可爱儿童声(voice-kid-cute)
  • 4. 沉稳男声(voice-calm-male)
  • 5. 甜美女声(voice-sweet-female)

粤语文本转语音

输入:

  • 文本内容:早晨,食咗早餐未啊?
  • 选择音色:粤语女声
  • 语音模型:多语言版

输出:

  • 音色名称:粤语女声
  • 音频格式:mp3
  • 时长:20秒
  • 效果:粤语发音标准,自然流畅

使用场景

有声读物制作

将小说、文章等文本内容转换为高质量音频,制作有声读物,满足用户在多种场景下的聆听需求。

教育内容音频化

将教学材料、儿童故事等文本转换为生动的语音内容,提升学习趣味性和理解效果。

语音助手开发

为智能设备或应用程序开发语音交互功能,提供自然流畅的语音反馈,提升用户体验。

广告配音制作

快速生成广告、宣传材料的配音内容,支持多种风格和情感表达,降低制作成本。

无障碍服务

为视障人士提供文本转语音服务,帮助他们获取信息,提高信息获取的便利性。

游戏角色配音

为游戏角色生成对话语音,支持多种角色特点和情感表达,丰富游戏体验。

价格说明

价格由API服务商设定,请到服务商官网查看详细定价信息

查看官方定价

常见问题

支持哪些音频格式输出?

API支持多种音频格式输出,包括mp3、wav、flac和opus等常用格式,可根据实际需求选择合适的格式。

一次请求最多可以转换多少文本?

目前API支持单次请求转换最长1000个字符的文本内容,如果需要转换更长的文本,可以拆分为多个请求进行处理。

如何复刻个人专属音色?

复刻个人专属音色需要上传清晰的个人录音文件(支持mp3、wav格式),并提供对应的文本内容,系统会自动进行音色复刻,通常在几分钟内完成。

API是否支持多语言转换?

是的,API支持多种语言的文本转语音,包括中文(普通话、粤语等方言)、英语、日语等,可通过选择对应语言的音色来实现多语言转换。

如何获取API调用的鉴权Token?

鉴权Token需要在阶跃星辰官方平台注册账号并创建API密钥,获取后按照文档要求在请求头中添加Authorization字段,格式为"Bearer {STEP_API_KEY}"。