今天,你可以走進(jìn)昏暗的起居室,讓 Alexa 把智能燈的亮度調(diào)到 75%。或者,你可以讓 Alexa 告訴你世界另一端的天氣狀況。在 Google 最近的 Duplex 演示中展示了該行業(yè)最近的進(jìn)展情況,AI 智能體進(jìn)行商務(wù)呼叫或者預(yù)定約會(huì)。曾經(jīng)存在于科幻小說(shuō)里的幻想在今天變成了現(xiàn)實(shí),但為了能夠保持真正讓人滿意的人機(jī)關(guān)系,機(jī)器必須能夠進(jìn)行更為直觀、更有語(yǔ)境和更加自然的對(duì)話——這仍然是一個(gè)挑戰(zhàn)。自我參加工作以來(lái),一直研究 NLP 技術(shù)。NLP 這個(gè)研究領(lǐng)域,和人工智能本身一樣古老,而我們?nèi)匀惶幵谶@個(gè)旅程的起步階段。
語(yǔ)言是共享信息并與我們周圍的人聯(lián)系的機(jī)制,但是機(jī)器需要理解語(yǔ)言的復(fù)雜之處,以及我們作為人類,如何交流才能使用語(yǔ)言。在情感分析、問(wèn)答系統(tǒng)和聯(lián)合多任務(wù)學(xué)習(xí)方面的進(jìn)步,是人工智能得以能夠真正理解人類和我們溝通的方式。
情感分析
語(yǔ)言從本質(zhì)上來(lái)說(shuō)就很難。語(yǔ)言在不斷進(jìn)化,非常微妙,一般人想熟練掌握語(yǔ)言,沒有幾年的功夫是不可能的。通過(guò)情感分析,我們可以使用人工智能來(lái)理解關(guān)于特定陳述的某些事情,如品牌介紹、電影評(píng)論是正面的、負(fù)面的還是中立的。但我們也可以弄清楚講者的態(tài)度和意圖(是否生氣了?快樂(lè)嗎?感到驚訝嗎?要準(zhǔn)備買嗎?)。從客戶服務(wù)到在線社區(qū)審核,再到算法交易,通過(guò)及時(shí)分析成千上萬(wàn)的推文或數(shù)百條產(chǎn)品評(píng)論,了解公眾對(duì)一個(gè)品牌的看法,對(duì)企業(yè)來(lái)說(shuō),是非常有價(jià)值的。
情感分析已經(jīng)存在了一段時(shí)間,但它并不總是非常準(zhǔn)確。然而,隨著 NLP 技術(shù)的進(jìn)步,這種情況正在發(fā)生改變。在我擔(dān)任 Salesforce 的首席科學(xué)家時(shí),我們的 Einstein AI 服務(wù)就能夠讓品牌廠商從聊天中實(shí)時(shí)分析電子郵件、社交媒體和文本中的情緒,以便提供更好的客戶體驗(yàn)。例如,準(zhǔn)確的情感分析允許服務(wù)代理了解哪些不滿意的客戶需要優(yōu)先提供服務(wù),或者向哪些客戶提供促銷優(yōu)惠信息。它還可以用來(lái)識(shí)別產(chǎn)品缺陷,衡量產(chǎn)品總體滿意度,甚至還可以通過(guò)社交媒體渠道監(jiān)控公眾對(duì)品牌的看法。其他科技公司也提供了類似的服務(wù)。
我們還需要能夠理解上下文的能力。假設(shè)你有一個(gè)香皂公司,有人在推特上說(shuō):“這種香皂真的很適合嬰兒呢。”這條推文,可以認(rèn)為是對(duì)兒童香皂的積極認(rèn)可,但也有可能是反話,暗示這種香皂對(duì)孩子來(lái)說(shuō)是可怕的。因此,這句話到底是什么意思要結(jié)合上下文來(lái)看,這還是一條非常簡(jiǎn)單的陳述句!要教會(huì)人工智能來(lái)解析句子所有的可能含義,并理解某個(gè)人在特定語(yǔ)境中想要表達(dá)的真實(shí)含義,是 NLP 研究中的重大挑戰(zhàn)之一。它既需要標(biāo)記數(shù)據(jù)來(lái)改進(jìn)模型訓(xùn)練,也需要能夠?qū)W習(xí)上下文并同時(shí)在不同任務(wù)之間共享知識(shí)的新模型。
問(wèn)答系統(tǒng)
隨著 NLP 越來(lái)越能夠更好地解析文本的含義,借由這點(diǎn),管理我們?nèi)粘I畹臄?shù)字助理的將會(huì)更加智能。Siri 和 Google Assistant 等應(yīng)用現(xiàn)在已經(jīng)能夠很好地回答常見問(wèn)題了,并能夠執(zhí)行相當(dāng)簡(jiǎn)單的命令。但在理想情況下,我們應(yīng)該可以向計(jì)算機(jī)提出任意問(wèn)題,并能夠得到很好的答案。
要想讓計(jì)算機(jī)能夠提供更好的答案,其中一個(gè)方法是確保計(jì)算機(jī)能夠理解問(wèn)題。如果你問(wèn):“When will my plane arrive?”你問(wèn)的是航班呢,還是從 Amazon 訂購(gòu)的木工刨子呢?(譯注:plane 有飛機(jī)和刨子的含義)計(jì)算機(jī)要如何確定你到底是問(wèn)什么呢?只有通過(guò)更深入地理解語(yǔ)義,以及更加智能地使用上下文數(shù)據(jù),計(jì)算機(jī)才能越來(lái)越善于猜測(cè)我們表達(dá)的意思。有了 NLP,我們才能弄清楚如何學(xué)習(xí)這些上下文層,這樣,人工智能就可以同時(shí)處理所有的上下文,而不會(huì)錯(cuò)過(guò)重要的信息。
例如,動(dòng)態(tài)共注意網(wǎng)絡(luò)(dynamic coattention networks,DCN。詳見《State of the art deep learning model for question answering》,http://u6.gg/ejFYu )可以根據(jù)所提問(wèn)的各種問(wèn)題對(duì)單個(gè)文檔進(jìn)行不同的解釋,比如“Which team represented the NFC in Super Bowl 50?”或者“Who scored the touchdown in the fourth quarter?”,通過(guò)這種條件解釋,它就可以迭代地假設(shè)多個(gè)答案,以便得到最好的、最準(zhǔn)確的結(jié)果。
聯(lián)合多任務(wù)學(xué)習(xí)
科研界擅長(zhǎng)的是構(gòu)建能夠很好地完成單一任務(wù)的人工智能模型。但更直觀、會(huì)話式和上下文相關(guān)的界面將需要一個(gè)能夠不斷學(xué)習(xí)的人工智能模型——將新任務(wù)與舊任務(wù)集成在一起,并在此過(guò)程中學(xué)習(xí)執(zhí)行更為復(fù)雜的任務(wù)。人工智能在通常情況下都是如此,但在語(yǔ)言方面尤為如此,這是因?yàn)檎Z(yǔ)言的靈活性所要求的。
問(wèn)題“Who are my customers?”提出了一個(gè)足夠簡(jiǎn)單的任務(wù):創(chuàng)建一個(gè)客戶列表。但問(wèn)題是“Who are my best customers in the Pacific Northwest for a particular product?”現(xiàn)在,我們?cè)黾恿艘粚訌?fù)雜性,需要一些綜合任務(wù)來(lái)回答合格的問(wèn)題,比如,如何定義“best”?每個(gè)客戶都住在哪里?讓客戶對(duì)某種產(chǎn)品感到興趣都有哪些因素?通過(guò)向查詢添加一個(gè)項(xiàng)目,問(wèn)題的復(fù)雜性就會(huì)顯著增加了。
Saleforce Research 最近創(chuàng)建了“自然語(yǔ)言十項(xiàng)全能(Natural Language Decathlon)”,這是一個(gè)挑戰(zhàn),利用問(wèn)答功能在單一模型中解決了 NLP 最棘手的 10 項(xiàng)任務(wù):?jiǎn)柎鹣到y(tǒng)、機(jī)器翻譯、摘要、自然語(yǔ)言推理、情感分析、語(yǔ)義角色標(biāo)注、關(guān)系提取、目標(biāo)導(dǎo)向?qū)υ挕?shù)據(jù)庫(kù)查詢生成和代詞解析。使用多任務(wù)問(wèn)答模型,將每個(gè)任務(wù)作為問(wèn)答的一種形式,單個(gè)模型聯(lián)合共同學(xué)習(xí)和處理不同的任務(wù),無(wú)需任何特定的參數(shù)或模塊。這不僅意味著數(shù)據(jù)科學(xué)家無(wú)需為每項(xiàng)任務(wù)構(gòu)建、訓(xùn)練和優(yōu)化單個(gè)模型。但這也意味著模型將具備零樣本學(xué)習(xí)(zero-shot learning)能力,也就是說(shuō),模型可以解決它從未見過(guò)或經(jīng)過(guò)專門訓(xùn)練的任務(wù)。
隨著研究人員不斷改進(jìn)這樣的模型,我們將看到人工智能界面在承擔(dān)個(gè)能為復(fù)雜的任務(wù)時(shí),會(huì)變得更加智能。
盡管在 NLP 領(lǐng)域中,我們摸爬滾打了很久,但仍然處于起步階段。不過(guò),公眾希望隨著 NLP 的進(jìn)步,人工智能能夠得以改變我們與機(jī)器交互的一切方式。