1947年,美國(guó)科學(xué)家韋弗(W. Weaver)博士和英國(guó)工程師布斯(A. D. Booth)博士提出了利用計(jì)算機(jī)進(jìn)行語(yǔ)言自動(dòng)翻譯的設(shè)想,機(jī)器翻譯(Machine Translation,英文簡(jiǎn)稱(chēng)MT,中文簡(jiǎn)稱(chēng)“機(jī)譯”)從此步入歷史舞臺(tái),并走過(guò)了一條曲折而漫長(zhǎng)的發(fā)展道路。
從上世紀(jì)50年代到60年代前半期,機(jī)譯研究呈不斷上升趨勢(shì),并從理論走向?qū)嶒?yàn)。美國(guó)和前蘇聯(lián)兩個(gè)超級(jí)大國(guó)出于政治、軍事、經(jīng)濟(jì)目的,均對(duì)機(jī)譯項(xiàng)目提供了大量的資金支持,而歐洲國(guó)家由于地緣政治和經(jīng)濟(jì)的需要也對(duì)機(jī)譯研究給予了相當(dāng)大的重視;此時(shí)的中國(guó)和日本也開(kāi)始了這項(xiàng)研究,機(jī)譯一時(shí)出現(xiàn)熱潮。這個(gè)時(shí)期的機(jī)譯雖然剛剛處于開(kāi)創(chuàng)階段,但已進(jìn)入了最初的繁榮期。
1966年,由美國(guó)科學(xué)院成立的語(yǔ)言自動(dòng)處理咨詢(xún)委員會(huì)(ALPAC)公布了一個(gè)題為《語(yǔ)言與機(jī)器》的報(bào)告;該報(bào)告全面否定了機(jī)譯的可行性和實(shí)用性,并建議停止對(duì)機(jī)譯項(xiàng)目的資金支持。這一報(bào)告的發(fā)表給了正在蓬勃發(fā)展的機(jī)譯當(dāng)頭一棒,美加英法德意等國(guó)的相關(guān)研究陷入了近乎停滯的僵局。無(wú)獨(dú)有偶,當(dāng)時(shí)的中國(guó)爆發(fā)了“文革”動(dòng)亂,基本上這些研究也停滯了。這個(gè)時(shí)期的機(jī)譯研究步入了蕭條期。
進(jìn)入70年代后,隨著科學(xué)技術(shù)尤其計(jì)算機(jī)技術(shù)的發(fā)展和國(guó)際交流的日趨頻繁,從技術(shù)層面和社會(huì)需求推動(dòng)了機(jī)譯研究的復(fù)蘇,機(jī)譯項(xiàng)目又開(kāi)始發(fā)展起來(lái),各種實(shí)用的以及實(shí)驗(yàn)的系統(tǒng)被先后推出。而中國(guó)的機(jī)譯研究在“文革”結(jié)束后也重新振作起來(lái),80年代中期以后,其機(jī)譯研究發(fā)展進(jìn)一步加快,并取得了長(zhǎng)足的進(jìn)步和可喜的成績(jī)。
從80年代中期開(kāi)始,基于語(yǔ)料和多引擎機(jī)譯方法的廣泛運(yùn)用,機(jī)譯系統(tǒng)的性能和效率有了明顯提高,各式各樣的翻譯軟件如雨后春筍般問(wèn)世,并走進(jìn)了市場(chǎng)。
到了本世紀(jì),由于互聯(lián)網(wǎng)技術(shù)的普遍應(yīng)用,機(jī)譯又迎來(lái)了一個(gè)全新的發(fā)展機(jī)遇。如今基于搜索引擎的在線(xiàn)翻譯已成為了一個(gè)必不可少的工具。其中谷歌翻譯目前已實(shí)現(xiàn)了對(duì)100種語(yǔ)言的支持,每日用戶(hù)超過(guò)2億。
為提高在線(xiàn)翻譯質(zhì)量,谷歌公司的幾名工程師提出了一種嶄新的機(jī)譯方法——將語(yǔ)言翻譯變成向量空間數(shù)學(xué)問(wèn)題,利用數(shù)據(jù)挖掘技術(shù)建模一種語(yǔ)言的結(jié)構(gòu),然后與另一種語(yǔ)言的結(jié)構(gòu)進(jìn)行對(duì)比,從而擴(kuò)充和完善雙語(yǔ)平行語(yǔ)料庫(kù)。他們聲稱(chēng):在翻譯英語(yǔ)和西班牙語(yǔ)之間的單詞和短語(yǔ)時(shí),準(zhǔn)確率可以達(dá)到幾乎90%。此外,為了進(jìn)一步提高在線(xiàn)翻譯質(zhì)量,谷歌建立了人工翻譯社區(qū),面向所有用戶(hù)開(kāi)放。在這個(gè)社區(qū)里,語(yǔ)言專(zhuān)家和專(zhuān)業(yè)譯者可以對(duì)原有的譯文進(jìn)行比較、評(píng)分,同時(shí)也可以提交新的譯文。
2011年開(kāi)始,伴隨著語(yǔ)音識(shí)別、機(jī)譯技術(shù)的快速發(fā)展和經(jīng)濟(jì)全球化的需求,即時(shí)口譯研究已成為當(dāng)今信息處理領(lǐng)域新的研究熱點(diǎn)。例如,谷歌公司新推出的翻譯手機(jī)軟件就具有即時(shí)語(yǔ)音翻譯功能;除了語(yǔ)音翻譯功能之外,該軟件還能讓使用者用手機(jī)的攝像頭即時(shí)翻譯圖像內(nèi)的文本。
前不久,微軟公司推出了具有即時(shí)口譯功能的“Skype Translator”,它可以自動(dòng)翻譯不同語(yǔ)言的語(yǔ)音通話(huà)和即時(shí)通信消息,當(dāng)前支持的語(yǔ)言包括英語(yǔ)、西班牙語(yǔ)、意大利語(yǔ)和漢語(yǔ)普通話(huà)。除了實(shí)時(shí)語(yǔ)音翻譯之外,Skype Translator的即時(shí)通信消息翻譯已支持50種語(yǔ)言,包括法語(yǔ)、日語(yǔ)、阿拉伯語(yǔ)、威爾士語(yǔ)等。由于這款翻譯工具集成了機(jī)譯、大數(shù)據(jù)、語(yǔ)音識(shí)別、機(jī)器學(xué)習(xí)等先進(jìn)技術(shù),因此被廣泛看好。
機(jī)譯是涉及數(shù)學(xué)、語(yǔ)言學(xué)、邏輯學(xué)、人工智能和語(yǔ)音技術(shù)等多種學(xué)科和技術(shù)的綜合性研究課題。它消除了不同文字和語(yǔ)言間的隔閡,堪稱(chēng)高科技造福人類(lèi)之舉。美國(guó)發(fā)明家和企業(yè)家?guī)炱澩枺≧. Kurzweil)博士在接受著名網(wǎng)絡(luò)媒體《赫芬頓郵報(bào)》采訪(fǎng)時(shí)曾預(yù)言,“到2029年機(jī)譯的譯文質(zhì)量將達(dá)到人工翻譯的水準(zhǔn)。”這一預(yù)言未免過(guò)于樂(lè)觀。但遺憾的是,至今機(jī)譯的若干理論難題(如深層次語(yǔ)義)都沒(méi)有從根本上得到解決;某些方法和技術(shù)也沒(méi)有實(shí)質(zhì)性的改進(jìn);機(jī)譯系統(tǒng)的性能(在消歧和調(diào)序方面)還不盡如人意,尤其是譯文質(zhì)量,離理想目標(biāo)仍相差甚遠(yuǎn)。
眾所周知,人工翻譯的過(guò)程是人工譯者集理解、分析、選擇及再創(chuàng)造為一體的綜合過(guò)程,是大腦思維活動(dòng)的過(guò)程。因此,機(jī)譯的譯文質(zhì)量要達(dá)到人工翻譯的水準(zhǔn),就必須解開(kāi)大腦處理語(yǔ)言信息之謎。正如中國(guó)數(shù)學(xué)家和語(yǔ)言學(xué)家周海中教授所言:在人類(lèi)尚未明了大腦是如何進(jìn)行語(yǔ)言的模糊識(shí)別和邏輯判斷的情況下,機(jī)譯要想達(dá)到“信、達(dá)、雅”的程度是不可能的。這一觀點(diǎn)精辟到位,道出了制約譯文質(zhì)量提高的瓶頸所在。
我們相信,在計(jì)算機(jī)專(zhuān)家、語(yǔ)言學(xué)家、心理學(xué)家、邏輯學(xué)家和數(shù)學(xué)家的共同努力下,尤其在“人類(lèi)大腦工程”的推動(dòng)下,機(jī)譯的瓶頸問(wèn)題將會(huì)得到解決,語(yǔ)言的交流障礙將會(huì)得以跨越。展望未來(lái),機(jī)譯技術(shù)將迎來(lái)更加光明的發(fā)展前景和更加廣闊的發(fā)展空間。