2017-12-29 美国 来源:Techweb 领域:信息
关键词:
据Techweb网站12月28日消息,谷歌近日发布语音合成系统Tacotron 2,其生成的声音与真人声音几乎无法区分。该系统包含两个深层神经网络,第一个深度神经网络负责将文本转换成频谱图并将频谱图载入到第二个深度神经网络WaveNet,Wavenet负责读取频谱图并生成相似的音频元素。据悉,Tacotron 2可以根据语境来发音,如在读到大写单词时加重语气。
http://www.cnbeta.com/articles/tech/684171.htm