高效准确的音频处理API,支持音频转文本、音色复刻、音色查询和音频生成功能
上传音频文件,获取对应的文本内容。支持多种音频格式,准确高效。
支持格式: flac, mp3, mp4, mpeg, mpga, m4a, ogg, wav, webm, aac, opus,文件大小限制:小于 100MB
上传音频文件并点击"转换音频"按钮获取文本结果
输入:
输出:
输入:
输出:
输入:
输出:
输入:
输出:
输入:
输出:
输入:
输出:
将小说、文章等文本内容转换为高质量音频,制作有声读物,满足用户在多种场景下的聆听需求。
将教学材料、儿童故事等文本转换为生动的语音内容,提升学习趣味性和理解效果。
为智能设备或应用程序开发语音交互功能,提供自然流畅的语音反馈,提升用户体验。
快速生成广告、宣传材料的配音内容,支持多种风格和情感表达,降低制作成本。
为视障人士提供文本转语音服务,帮助他们获取信息,提高信息获取的便利性。
为游戏角色生成对话语音,支持多种角色特点和情感表达,丰富游戏体验。
价格由API服务商设定,请到服务商官网查看详细定价信息
查看官方定价API支持多种音频格式输出,包括mp3、wav、flac和opus等常用格式,可根据实际需求选择合适的格式。
目前API支持单次请求转换最长1000个字符的文本内容,如果需要转换更长的文本,可以拆分为多个请求进行处理。
复刻个人专属音色需要上传清晰的个人录音文件(支持mp3、wav格式),并提供对应的文本内容,系统会自动进行音色复刻,通常在几分钟内完成。
是的,API支持多种语言的文本转语音,包括中文(普通话、粤语等方言)、英语、日语等,可通过选择对应语言的音色来实现多语言转换。
鉴权Token需要在阶跃星辰官方平台注册账号并创建API密钥,获取后按照文档要求在请求头中添加Authorization字段,格式为"Bearer {STEP_API_KEY}"。