借助Google DeepMind分支創(chuàng)建的新的語(yǔ)音合成系統(tǒng)WaveNet,Google Assistant將聽(tīng)起來(lái)更加自然。
WaveNet與傳統(tǒng)的連續(xù)式TTS(語(yǔ)音合成)不同,傳統(tǒng)的連續(xù)式TTS使用單個(gè)語(yǔ)音演員大量的預(yù)錄制語(yǔ)音,而參量式TTS使用計(jì)算機(jī)生成的語(yǔ)音,可以使用每秒16,000個(gè)樣本創(chuàng)建單個(gè)波形。
WaveNet使用了大量的語(yǔ)音樣本數(shù)據(jù),已經(jīng)訓(xùn)練超過(guò)12個(gè)月來(lái)識(shí)別哪些音調(diào)相互依存,以及什么波形是真實(shí)的。
WaveNet將暫時(shí)使用在美國(guó)英語(yǔ)和日語(yǔ)中,但之后可能會(huì)運(yùn)用到其它語(yǔ)言中,點(diǎn)擊此鏈接(需梯子)可以收聽(tīng)使用WaveNet前后的谷歌Assistant聲音區(qū)別。