阶跃星辰文本转语音API

阶跃星辰音频服务

高效准确的音频处理API，支持音频转文本、音色复刻、音色查询和音频生成功能

API密钥

密钥仅在浏览器端存储，易源不做转发

音频文件转文本

上传音频文件，获取对应的文本内容。支持多种音频格式，准确高效。

音频文件

支持格式: flac, mp3, mp4, mpeg, mpga, m4a, ogg, wav, webm, aac, opus，文件大小限制：小于 100MB

输出格式

模型

转换结果

上传音频文件并点击"转换音频"按钮获取文本结果

功能示例

基础文本转男声语音

输入：

文本内容：欢迎使用阶跃星辰语音服务
选择音色：标准男声
语音模型：标准版

输出：

音色名称：标准男声
音频格式：mp3
时长：18秒
效果：发音清晰，语速适中

情感文本转女声语音

输入：

文本内容：今天是个好日子，阳光明媚
选择音色：温柔女声
情感风格：高兴
语音模型：增强版

输出：

音色名称：温柔女声（高兴）
音频格式：mp3
时长：22秒
效果：语调轻快，充满喜悦感

儿童故事转儿童声语音

输入：

文本内容：小兔子蹦蹦跳跳来到森林里
选择音色：可爱儿童声
语速：慢速
语音模型：儿童专用版

输出：

音色名称：可爱儿童声
音频格式：wav
时长：35秒
效果：语速舒缓，发音稚嫩

复刻个人专属音色

输入：

个人录音文件ID：file-789AbcXyZ
录音对应文本：大家好，我是小明
试听文本：欢迎使用我的专属语音

输出：

音色名称：小明专属音色
音色ID：voice-xm123
状态：复刻成功
效果：与原录音声音相似度95%

查询系统可用官方音色

输入：

查询条件：显示前5个音色
排序方式：按最新排序

输出：

1. 标准男声（voice-standard-male）
2. 温柔女声（voice-gentle-female）
3. 可爱儿童声（voice-kid-cute）
4. 沉稳男声（voice-calm-male）
5. 甜美女声（voice-sweet-female）

粤语文本转语音

输入：

文本内容：早晨，食咗早餐未啊？
选择音色：粤语女声
语音模型：多语言版

输出：

音色名称：粤语女声
音频格式：mp3
时长：20秒
效果：粤语发音标准，自然流畅

使用场景

有声读物制作

将小说、文章等文本内容转换为高质量音频，制作有声读物，满足用户在多种场景下的聆听需求。

教育内容音频化

将教学材料、儿童故事等文本转换为生动的语音内容，提升学习趣味性和理解效果。

语音助手开发

为智能设备或应用程序开发语音交互功能，提供自然流畅的语音反馈，提升用户体验。

广告配音制作

快速生成广告、宣传材料的配音内容，支持多种风格和情感表达，降低制作成本。

无障碍服务

为视障人士提供文本转语音服务，帮助他们获取信息，提高信息获取的便利性。

游戏角色配音

为游戏角色生成对话语音，支持多种角色特点和情感表达，丰富游戏体验。

常见问题

支持哪些音频格式输出？

API支持多种音频格式输出，包括mp3、wav、flac和opus等常用格式，可根据实际需求选择合适的格式。

一次请求最多可以转换多少文本？

目前API支持单次请求转换最长1000个字符的文本内容，如果需要转换更长的文本，可以拆分为多个请求进行处理。

如何复刻个人专属音色？

复刻个人专属音色需要上传清晰的个人录音文件（支持mp3、wav格式），并提供对应的文本内容，系统会自动进行音色复刻，通常在几分钟内完成。

API是否支持多语言转换？

是的，API支持多种语言的文本转语音，包括中文（普通话、粤语等方言）、英语、日语等，可通过选择对应语言的音色来实现多语言转换。

如何获取API调用的鉴权Token？

鉴权Token需要在阶跃星辰官方平台注册账号并创建API密钥，获取后按照文档要求在请求头中添加Authorization字段，格式为"Bearer {STEP_API_KEY}"。

文本转语音API

阶跃星辰音频服务

音频文件转文本

转换结果

复刻音色

复刻结果

查询可用音色

可用音色列表

生成音频

生成的音频

功能示例

基础文本转男声语音

情感文本转女声语音

儿童故事转儿童声语音

复刻个人专属音色

查询系统可用官方音色

粤语文本转语音

使用场景

有声读物制作

教育内容音频化

语音助手开发

广告配音制作

无障碍服务

游戏角色配音

价格说明

常见问题

支持哪些音频格式输出？

一次请求最多可以转换多少文本？

如何复刻个人专属音色？

API是否支持多语言转换？

如何获取API调用的鉴权Token？