借助Google DeepMind分支創(chuàng)建的新的語音合成系統(tǒng)WaveNet,Google Assistant將聽起來更加自然。
WaveNet與傳統(tǒng)的連續(xù)式TTS(語音合成)不同,傳統(tǒng)的連續(xù)式TTS使用單個語音演員大量的預(yù)錄制語音,而參量式TTS使用計算機(jī)生成的語音,可以使用每秒16,000個樣本創(chuàng)建單個波形。
WaveNet使用了大量的語音樣本數(shù)據(jù),已經(jīng)訓(xùn)練超過12個月來識別哪些音調(diào)相互依存,以及什么波形是真實(shí)的。
WaveNet將暫時使用在美國英語和日語中,但之后可能會運(yùn)用到其它語言中,點(diǎn)擊此鏈接(需梯子)可以收聽使用WaveNet前后的谷歌Assistant聲音區(qū)別。