Google Text-to-Speech API

Google文本转语音服务,支持Gemini-2.5系列模型,通过POST请求调用。

本页面仅提供API测试,调用的API服务由 302 AI 提供,用量购买及管理请前往其官网。浏览器直调API,易源不做代理转发。

Google Text-to-Speech API

Google 音频处理 API

密钥仅在浏览器端存储,易源不做转发

语音合成参数

功能示例

智能客服语音

输入:

文本内容:"欢迎使用智能客服系统,我是您的专属助手小艾,很高兴为您服务!"
语音类型:中文女声(清晰自然型)
语速:正常(1.0倍)

输出:

生成自然流畅的中文女声语音,发音清晰,语气亲切,适合智能客服自动应答场景,语音时长约25秒

会议开场致辞

输入:

文本内容:"Good morning everyone! Welcome to the 2024 Tech Innovation Conference."
语音类型:英文男声(活力热情型)
语速:稍快(1.2倍)

输出:

生成热情有力的英文男声语音,节奏明快,适合国际会议开场致辞,语音时长约20秒

儿童故事语音

输入:

文本内容:"小兔子蹦蹦跳跳来到森林里,看见小熊在摘苹果..."
语音类型:儿童童声(甜美活泼型)
语速:较慢(0.8倍)

输出:

生成活泼甜美的儿童语音,语调轻快,充满童趣,适合儿童故事音频录制,语音时长约40秒

日语旅游导览

输入:

文本内容:"こんにちは!京都の観光ガイドです。次は清水寺へご案内いたします。"
语音类型:日语女声(标准柔和型)
音调:柔和(+0.5)

输出:

生成清晰柔和的日语女声语音,发音标准,适合旅游APP景点语音导览,语音时长约35秒

多语言新闻播报

输入:

文本内容:"科技快讯:今日,AI语音合成技术迎来新突破,支持200+语言实时转换..."
语音类型:新闻风格男声(沉稳清晰型)
语速:清晰(0.9倍)

输出:

生成沉稳专业的多语言男声语音,中英双语切换自然,适合新闻客户端语音播报,语音时长约45秒

企业培训语音

输入:

文本内容:"员工培训要点:1. 客户接待需使用礼貌用语;2. 产品介绍需突出核心功能..."
语音类型:企业男声(沉稳专业型)
语速:适中(1.0倍)

输出:

生成专业沉稳的男声语音,语调平稳有力,适合企业内部培训视频配音,语音时长约50秒

使用场景

智能客服系统

为客服系统提供自然流畅的语音应答,提升客户服务体验,降低人工成本。

有声内容创作

快速将文章、小说等文本内容转换为高质量有声读物,拓展内容传播渠道。

在线教育平台

为教学内容提供多语言语音支持,帮助学生更好地理解和吸收知识。

旅游导览服务

为旅游APP提供多语言景点介绍,让游客获得沉浸式的语音导览体验。

新闻资讯播报

将新闻内容转换为专业新闻播报语音,方便用户在通勤等场景下收听。

企业语音通知

为企业提供员工培训、会议通知等场景的语音合成服务,提升信息传达效率。

价格信息

价格由API服务商设定,详细的价格信息请访问服务商官网查看。

查看详细价格

常见问题

支持哪些语音模型?

Google Text-to-Speech API支持Gemini-2.5系列模型,包括gemini-2.5-pro-preview-tts和gemini-2.5-flash-preview-tts等多种模型选择,满足不同场景需求。

如何调用API?

API通过POST请求调用,需要在请求头中包含Authorization认证信息,请求体中指定文本内容、语音模型、生成配置等参数。详细调用方式可参考API文档。

支持哪些语言和声音类型?

支持多种语言和声音类型,包括中文、英文、日语等多种语言,提供男声、女声、童声等不同声音类型,可根据需要选择合适的语音配置。

如何处理API调用错误?

API调用错误通常会返回相应的错误代码和描述信息。常见错误包括认证失败、参数错误、请求频率超限等。建议根据错误信息检查请求参数或参考文档中的错误处理指南。

是否提供免费试用?

关于免费试用政策,请参考API服务商的具体说明。通常API服务商会提供一定额度的免费调用次数或试用期,供用户测试和评估服务效果。