谷歌Transformer解決了機(jī)器翻譯中的一個難題

責(zé)任編輯:editor004

作者:斯眉

2017-09-01 10:56:51

摘自:新浪科技

北京時間9月1日上午消息,機(jī)器學(xué)習(xí)已經(jīng)成為一種非常有用的翻譯工具,但它還存在一些弱點(diǎn),翻譯模式傾向于逐詞翻譯是其中之一,可導(dǎo)致嚴(yán)重錯誤。當(dāng)翻譯句子被構(gòu)建時,關(guān)注機(jī)制將每個詞與其他詞進(jìn)行比較,就像下面GIF所演示的那樣。

北京時間9月1日上午消息,機(jī)器學(xué)習(xí)已經(jīng)成為一種非常有用的翻譯工具,但它還存在一些弱點(diǎn),翻譯模式傾向于逐詞翻譯是其中之一,可導(dǎo)致嚴(yán)重錯誤。谷歌在iResearch博客上發(fā)表了一篇有趣的帖子,詳細(xì)說明了這個問題的性質(zhì)以及解決方案。

該公司自然語言處理部門雅克布·烏茲考瑞特(Jakob Uszkoreit)給出了很好的解釋。請思考以下兩個句子:

我過了馬路就到了銀行(bank)。

我過了河就到了岸邊(bank)。

顯然,每句話中的“bank”指代不同的東西,但是,逐字翻譯的算法可能很可能挑選錯誤的含義——因?yàn)樗恢滥囊粋€“bank”是正確的,除非它能看到句子結(jié)尾。你稍加留意就能發(fā)現(xiàn),這種歧義隨處可見。

我會改寫句子,當(dāng)然,翻譯系統(tǒng)不會選擇這樣走。如果為了這種簡單的句子而修改神經(jīng)網(wǎng)絡(luò),那將是非常低效的。

谷歌的解決方案是所謂的關(guān)注機(jī)制(attention mechanism),也就是說在翻譯軟件中內(nèi)置一個名為“變壓器”(Transformaer)的系統(tǒng)。它將句子中的單詞逐一進(jìn)行比較,以確定它們之間是否以某種關(guān)鍵方式相互影響——例如,看“他”或“她”是否在說話,或者像“銀行”這樣的詞是否以特定的方式表示。

當(dāng)翻譯句子被構(gòu)建時,關(guān)注機(jī)制將每個詞與其他詞進(jìn)行比較,就像下面GIF所演示的那樣。

如果這一切聽起來很熟悉,那可能是因?yàn)楸局茉缧r候你讀過一篇報道:谷歌翻譯的競爭對手DeepL也在使用一種關(guān)注機(jī)制。該公司的聯(lián)合創(chuàng)始人提到了這個問題,他們正在為此而努力工作,他甚至提到那篇報道谷歌的文章,但顯而易見,他們的產(chǎn)品與谷歌有所區(qū)別,非常有效,甚至好于后者的版本。

有趣的是,谷歌的方法讓人們有機(jī)會看到系統(tǒng)的運(yùn)作原理,因?yàn)門ransformer給每個詞提供一個與其他單詞相關(guān)程度的得分,你可以看到它認(rèn)為是相關(guān)的詞,或者潛在的相關(guān)詞:

很酷,對吧?嗯,我想是的。但也存在另一種類型的歧義,因?yàn)樵谟⑽睦铮?ldquo;它”可以指代街道或動物,必須看到最后一個字才能確定bank的含義。人腦可以自動計算和分辨,但機(jī)器仍然必須有人教

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號-6京公網(wǎng)安備 11010502049343號