機(jī)器翻譯的最新進(jìn)展與瓶頸所在

責(zé)任編輯:sjia

2012-02-09 10:28:11

摘自:中國(guó)網(wǎng)

機(jī)器翻譯是一個(gè)充滿挑戰(zhàn)的研究領(lǐng)域,正因?yàn)殡y度很大,它被列為21世紀(jì)世界十大科技難題之首。

你想過和異國(guó)人說話不需要再有翻譯,只需隨身攜帶一個(gè)輕巧的數(shù)碼機(jī)器嗎?目前來看這仍是奢望。不過,或許某一天,我們終于可以不再學(xué)習(xí)頭疼的外語(yǔ)就能實(shí)現(xiàn)和外國(guó)人的無縫交流。

機(jī)器翻譯是一個(gè)充滿挑戰(zhàn)的研究領(lǐng)域,正因?yàn)殡y度很大,它被列為21世紀(jì)世界十大科技難題之首。一路走來,機(jī)譯經(jīng)歷了艱難而曲折的發(fā)展歷程,既有成功和興奮,也有挫折和困惑。

然而,需求永遠(yuǎn)走在應(yīng)用的前方。由于近年來全球化進(jìn)程的加速以及國(guó)際交流的日趨頻繁,人們對(duì)于翻譯的需求空前增長(zhǎng)。而互聯(lián)網(wǎng)的普遍應(yīng)用則使在線翻譯成了當(dāng)今機(jī)譯的重頭戲。

在這一領(lǐng)域,競(jìng)爭(zhēng)正變得空前激烈。如今功能較強(qiáng)、方便易用的在線翻譯工具有谷歌翻譯、必應(yīng)翻譯、臉譜翻譯、寶貝魚翻譯、巴比倫翻譯等,其中后起之秀的谷歌翻譯最具特色,同時(shí)最具代表性。

谷歌翻譯目前可提供63種主要語(yǔ)言之間的實(shí)時(shí)翻譯;它可以提供所支持的任意兩種語(yǔ)言之間的互譯,包括字詞、句子、文本和網(wǎng)頁(yè)翻譯。另外它還可以幫助用戶閱讀搜索結(jié)果、網(wǎng)頁(yè)、電子郵件、YouTube視頻字幕以及其它信息,用戶甚至還能在Gmail內(nèi)進(jìn)行實(shí)時(shí)的多語(yǔ)言對(duì)話。

谷歌翻譯主要是采用統(tǒng)計(jì)翻譯模型,往計(jì)算器內(nèi)輸入大量的文字文本,包括源語(yǔ)言的文本,以及對(duì)應(yīng)目標(biāo)語(yǔ)言人工翻譯的文本,通過海量統(tǒng)計(jì)數(shù)據(jù)來提高翻譯精確度。

之所以采用統(tǒng)計(jì)翻譯模型,一個(gè)重要原因是,谷歌翻譯采用了云計(jì)算架構(gòu)。該架構(gòu)擁有谷歌研發(fā)的分布式計(jì)算系統(tǒng)(MapReduce)和分布式存儲(chǔ)系統(tǒng)(BigTable);而這兩個(gè)系統(tǒng)很有創(chuàng)造性,而且有極大的擴(kuò)展性,使得谷歌在系統(tǒng)吞吐量上有很大的競(jìng)爭(zhēng)力。

機(jī)譯更激動(dòng)人心的應(yīng)用,在于日常對(duì)話中的實(shí)時(shí)翻譯。這一領(lǐng)域同樣是谷歌領(lǐng)先;它擁有較強(qiáng)的語(yǔ)音識(shí)別技術(shù),可以通過聲音實(shí)現(xiàn)自動(dòng)檢索,再將語(yǔ)音識(shí)別和機(jī)譯結(jié)合在一起。

2011年11月,谷歌最新推出了一款手機(jī)翻譯軟件;該軟件支持包括漢語(yǔ)普通話在內(nèi)的14個(gè)語(yǔ)種。對(duì)著谷歌Android智能手機(jī)講話的用戶,幾乎能實(shí)時(shí)聽到他們的源語(yǔ)言被翻譯成目標(biāo)語(yǔ)言;而通話對(duì)方的語(yǔ)言也會(huì)被翻譯成該用戶的母語(yǔ)。

谷歌董事長(zhǎng)埃里克施密特稱,這種手機(jī)翻譯服務(wù)將會(huì)得到極大改善,甚至可能進(jìn)行“同聲傳譯”;其前景是令人樂觀的。

谷歌的首席科學(xué)家阿施斯維努戈帕爾稱,谷歌的最終目的是研發(fā)出能夠翻譯全球至少10億人所說的300種語(yǔ)言的手機(jī)軟件。

除了傳統(tǒng)的翻譯思路,一種被稱為解碼外語(yǔ)的新方法也小荷露出尖尖角。

這項(xiàng)由南加州大學(xué)的科學(xué)家們提出的全新機(jī)譯方法把英語(yǔ)視為一種初始語(yǔ)言,而需要翻譯的外語(yǔ)類似一種加密后的高級(jí)文字,通過譯碼破譯,把外語(yǔ)「破解」,變成英語(yǔ)。

不過,現(xiàn)實(shí)是骨感的。目前,這種翻譯方法只能翻譯一些短句或電影字幕,尚未運(yùn)用到長(zhǎng)句或片段翻譯中,但它卻給機(jī)譯研究打開了一條新的思路,且可以運(yùn)用到任何一種語(yǔ)言中??茖W(xué)家們稱,因?yàn)椴恍枰魏渭扔械奈谋緸榛A(chǔ),這種翻譯方法今后甚至可以對(duì)“海豚音”或“外星人語(yǔ)言”進(jìn)行破譯。

事實(shí)上,不論哪種方法,影響機(jī)譯發(fā)展的最大因素在于譯文的質(zhì)量。就已有的成就來看,機(jī)譯的質(zhì)量離終極目標(biāo)仍相差甚遠(yuǎn)。

中國(guó)數(shù)學(xué)家、語(yǔ)言學(xué)家周海中曾在論文《機(jī)器翻譯五十年》中指出:要提高機(jī)譯的質(zhì)量,首先要解決的是語(yǔ)言本身問題而不是程序設(shè)計(jì)問題;單靠若干程序來做機(jī)譯系統(tǒng),肯定是無法提高機(jī)譯質(zhì)量的。

同時(shí),他還指出:在人類尚未明了“人腦是如何進(jìn)行語(yǔ)言的模糊識(shí)別和邏輯判斷”的情況下,機(jī)譯要想達(dá)到“信、達(dá)、雅”的程度是不可能的。這也是制約機(jī)譯質(zhì)量提高的一大瓶頸。

值得一提的是,美國(guó)發(fā)明家、未來學(xué)家雷科茲威爾最近在接受《赫芬頓郵報(bào)》采訪時(shí)預(yù)言,到2029年機(jī)譯的質(zhì)量將達(dá)到人工翻譯的水平。對(duì)于這一論斷,學(xué)術(shù)界還存在很多爭(zhēng)議。

不論怎樣,目前是人們對(duì)機(jī)譯最為看好的時(shí)期,這種關(guān)注是建立在一個(gè)客觀認(rèn)識(shí)和理性思考的基礎(chǔ)上的。我們也有理由相信:在計(jì)算器專家、語(yǔ)言學(xué)家、心理學(xué)家、邏輯學(xué)家和數(shù)學(xué)家的共同努力下,機(jī)譯的瓶頸問題將會(huì)得以解決。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號(hào)-6京公網(wǎng)安備 11010502049343號(hào)