谷歌推出云文本转语音服务,人声发音更好更自然
另外,Google还表示,云端文字转语音使用了高传真人声合成技术WaveNet,让电脑发音更像真正的人声。开发者现在可以将云端文字转语音服务用在语音回应系统,像是呼叫中心(IVRs),也能在电视、汽车或是机器人等物联网装置,建置语音回应功能,或是在以文字为主的媒体上,将文章与书转成音讯。...
谷歌的文本转语音(Text-To-Speech)功能最初用于Google Assistant或Google Map等服务。 现在谷歌推出了云文本转语音服务,开发者也可以在他们的应用程序中添加语音功能。 此外,谷歌还表示,云文本转语音采用高保真人声合成技术WaveNet,使计算机发音更像真实的人声。
谷歌表示,很多开发者向他们反映,也想在自己的应用程序中使用文本转语音功能,因此他们把这个功能放到了谷歌云平台上,推出了云文本转语音服务。
开发人员现在可以在呼叫中心 (IVR) 等语音应答系统中使用云文本转语音服务,还可以在电视、汽车或机器人等物联网设备中构建语音应答功能,或使用文本作为转换在主媒体上将文章和书籍转化为音频。
Google Cloud Text-to-Speech 使用 WaveNet谷歌推出云文本转语音服务学英语,人声发音更好更自然,这是 DeepMind 创建的声音生成模型。 这种高保真人声合成技术可以使计算机合成的语音更加自然。
WaveNet是DeepMind在2016年发布的一项技术,但如今已经取得了长足的进步。 在速度方面,WaveNet 现在在 Google 的云 TPU 基础设施上运行。 它生成原始波形的速度比原始波形快一千倍在线英语转语音,生成 1 秒语音仅需 50 毫秒。
除了速度提升千倍之外学英语,生成语音的保真度也得到了大幅提升。 WaveNet 可以每秒 24,000 个样本创建高保真波形,并且采样分辨率从原来的 8 位提高到 16 位,因此生成的人声质量更好、更自然。
谷歌表示在线英语转语音,人们对 WaveNet 合成的语音的接受度高于市场上的计算机语音。 在语音测试中英语培训,WaveNet合成的新美式英语语音平均得分为4.1,比标准语音好20%,比与真实人类语音的差距小70%。
云文字转语音功能现已支持32种语音、12种语言。 开发人员可以自定义音调、语速和音量增益,并可以将其保存为各种音频格式在线英语转语音在线英语转语音,例如 MP3 或 WAV。
猜你喜欢
发表评论
评论列表