Fish Audio

Fish Audio 音频处理

密钥仅在浏览器端存储，易源不做转发

创建声音模型

模型标题或名称 *

训练模式 *

模型类型 *

模型可见性

声音文件 *

上传用于训练模型的声音文件

对应文本

封面图片

模型封面图片，如果模型是公开的则必填

模型描述

增强音频质量

是否

模型标签

功能示例

创建个人专属语音模型

输入

模型标题：我的日常语音助手
声音样本：个人日常说话录音（30秒）
训练模式：快速训练
可见性：仅自己可见

输出

模型ID：voice-20240512-001
状态：训练完成（98分音质）
用途：私人语音备忘录、消息播报

获取企业客服语音库详情

输入

模型ID：kf-202403-public

输出

模型名称：企业标准客服语音
描述：专业女声，适用于电话自动应答
语言：中文（普通话）
使用量：已被12家企业接入

筛选儿童故事语音模板

输入

语言：中文
标签：儿童故事
页码：1（每页10条）

输出

童话公主音（甜美少女声）
睡前故事大叔音（温和低音）
卡通动物语音包（多角色变声）

生成产品介绍语音

输入

参考模型：专业讲师模型（ID：lecturer-pro-007）
文本内容："欢迎使用Fish Audio，3步即可生成自然流畅的专属语音..."
语音格式：mp3

输出

生成结果：成功
语音信息：2分15秒 mp3音频，清晰无杂音
适用场景：产品官网自动播放

更新公开语音模型信息

输入

模型ID：news-anchor-public-01
新标题：央视风格新闻播音员
新标签：新闻播报、正式、央视腔
可见性：公开

输出

更新结果：信息已同步
当前状态：公开可用（累计被调用5000+次）
最新标签：新闻播报,正式,央视腔,2024更新

清理过期测试语音模型

输入

模型ID：test-cartoon-202402

输出

删除结果：成功
清理信息：过期测试模型"卡通角色测试音"已移除
提示：释放存储空间12MB，不影响其他正式模型

使用场景

有声内容创作

快速将小说、文章等文本转换为高质量有声内容，降低制作门槛。

智能客服系统

创建企业专属客服声音模型，提升自动语音应答的品牌识别度。

儿童教育产品

生成亲和力强的儿童语音，用于故事朗读、单词发音等教育场景。

广告配音制作

快速生成多种风格的广告配音，满足不同产品宣传需求。

游戏角色配音

为游戏角色创建独特声音，丰富游戏体验和角色个性。

新闻播报系统

将新闻文本快速转换为专业播报语音，实现自动化新闻播报。

常见问题

Fish Audio支持哪些语音模型和输出格式？

Fish Audio支持多种语音模型，包括speech-1.5、speech-1.6和s1等。输出格式包括wav、pcm、mp3和opus，您可以根据实际需求选择合适的格式。

如何创建自己的声音模型？需要多长时间？

创建声音模型只需上传30秒以上的声音样本，选择训练模式并填写基本信息即可。采用"fast"快速训练模式通常在几分钟内即可完成模型创建，生成高质量的语音模型。

语音合成的质量如何？是否支持多语言？

Fish Audio采用先进的语音合成技术，生成的语音自然流畅，接近真人发音。目前主要支持中文语音合成，未来将逐步扩展更多语言支持。您可以通过API参数设置调整语音的语速、音调等参数。

如何优化API调用性能和响应速度？

您可以通过设置latency参数调整延迟模式，选择"normal"平衡模式或低延迟模式。同时，合理设置chunk_length参数控制语音片段长度，以及选择合适的输出格式（如opus格式体积更小）都可以优化性能。

模型的可见性设置有什么区别？

Fish Audio提供三种可见性选项：public（公开可见，任何人可搜索使用）、unlist（不公开列出，但知道ID的人可使用）和private（仅自己可见和使用）。公开模型需要上传封面图片，适合分享和展示您的创作。

如何获取API密钥并开始使用？

您需要访问302 AI官网注册账号，在控制台创建应用并获取API密钥。获得密钥后，您可以在请求头中添加Authorization: Bearer {YOUR_API_KEY}即可开始调用API。

Fish Audio 音频处理

创建声音模型

创建结果

获取声音列表

声音列表

获取声音模型

模型详情

基本信息