WaveNet系統(tǒng)發(fā)威:谷歌Assistant說(shuō)話更自然

責(zé)任編輯:editor004

作者:遠(yuǎn)洋

2017-10-10 11:06:39

摘自:IT之家

WaveNet與傳統(tǒng)的連續(xù)式TTS(語(yǔ)音合成)不同,傳統(tǒng)的連續(xù)式TTS使用單個(gè)語(yǔ)音演員大量的預(yù)錄制語(yǔ)音,而參量式TTS使用計(jì)算機(jī)生成的語(yǔ)音,可以使用每秒16,000個(gè)樣本創(chuàng)建單個(gè)波形。

借助Google DeepMind分支創(chuàng)建的新的語(yǔ)音合成系統(tǒng)WaveNet,Google Assistant將聽(tīng)起來(lái)更加自然。

WaveNet與傳統(tǒng)的連續(xù)式TTS(語(yǔ)音合成)不同,傳統(tǒng)的連續(xù)式TTS使用單個(gè)語(yǔ)音演員大量的預(yù)錄制語(yǔ)音,而參量式TTS使用計(jì)算機(jī)生成的語(yǔ)音,可以使用每秒16,000個(gè)樣本創(chuàng)建單個(gè)波形。

WaveNet使用了大量的語(yǔ)音樣本數(shù)據(jù),已經(jīng)訓(xùn)練超過(guò)12個(gè)月來(lái)識(shí)別哪些音調(diào)相互依存,以及什么波形是真實(shí)的。

WaveNet將暫時(shí)使用在美國(guó)英語(yǔ)和日語(yǔ)中,但之后可能會(huì)運(yùn)用到其它語(yǔ)言中,點(diǎn)擊此鏈接(需梯子)可以收聽(tīng)使用WaveNet前后的谷歌Assistant聲音區(qū)別。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號(hào)-6京公網(wǎng)安備 11010502049343號(hào)