WaveNet系統(tǒng)發(fā)威:谷歌Assistant說話更自然

責(zé)任編輯:editor004

2017-10-10 10:40:09

摘自:IT之家

WaveNet與傳統(tǒng)的連續(xù)式TTS(語音合成)不同,傳統(tǒng)的連續(xù)式TTS使用單個語音演員大量的預(yù)錄制語音,而參量式TTS使用計算機(jī)生成的語音,可以使用每秒16,000個樣本創(chuàng)建單個波形。

 借助Google DeepMind分支創(chuàng)建的新的語音合成系統(tǒng)WaveNet,Google Assistant將聽起來更加自然。

WaveNet與傳統(tǒng)的連續(xù)式TTS(語音合成)不同,傳統(tǒng)的連續(xù)式TTS使用單個語音演員大量的預(yù)錄制語音,而參量式TTS使用計算機(jī)生成的語音,可以使用每秒16,000個樣本創(chuàng)建單個波形。

WaveNet使用了大量的語音樣本數(shù)據(jù),已經(jīng)訓(xùn)練超過12個月來識別哪些音調(diào)相互依存,以及什么波形是真實(shí)的。

WaveNet將暫時使用在美國英語和日語中,但之后可能會運(yùn)用到其它語言中,點(diǎn)擊此鏈接(需梯子)可以收聽使用WaveNet前后的谷歌Assistant聲音區(qū)別。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號-6京公網(wǎng)安備 11010502049343號