上传用于训练模型的声音文件
模型封面图片,如果模型是公开的则必填
模型ID
模型标题
创建状态
完整响应
快速将小说、文章等文本转换为高质量有声内容,降低制作门槛。
创建企业专属客服声音模型,提升自动语音应答的品牌识别度。
生成亲和力强的儿童语音,用于故事朗读、单词发音等教育场景。
快速生成多种风格的广告配音,满足不同产品宣传需求。
为游戏角色创建独特声音,丰富游戏体验和角色个性。
将新闻文本快速转换为专业播报语音,实现自动化新闻播报。
价格由API服务商设定,请到服务商官网查看详细定价方案
查看官方价格Fish Audio支持多种语音模型,包括speech-1.5、speech-1.6和s1等。输出格式包括wav、pcm、mp3和opus,您可以根据实际需求选择合适的格式。
创建声音模型只需上传30秒以上的声音样本,选择训练模式并填写基本信息即可。采用"fast"快速训练模式通常在几分钟内即可完成模型创建,生成高质量的语音模型。
Fish Audio采用先进的语音合成技术,生成的语音自然流畅,接近真人发音。目前主要支持中文语音合成,未来将逐步扩展更多语言支持。您可以通过API参数设置调整语音的语速、音调等参数。
您可以通过设置latency参数调整延迟模式,选择"normal"平衡模式或低延迟模式。同时,合理设置chunk_length参数控制语音片段长度,以及选择合适的输出格式(如opus格式体积更小)都可以优化性能。
Fish Audio提供三种可见性选项:public(公开可见,任何人可搜索使用)、unlist(不公开列出,但知道ID的人可使用)和private(仅自己可见和使用)。公开模型需要上传封面图片,适合分享和展示您的创作。
您需要访问302 AI官网注册账号,在控制台创建应用并获取API密钥。获得密钥后,您可以在请求头中添加Authorization: Bearer {YOUR_API_KEY}即可开始调用API。