在過去1個多月,F(xiàn)acebook 開發(fā)的對話機(jī)器人開始采用一些奇怪的語句。
Bob 和 Alice 是 Facebook 開發(fā)的對話機(jī)器人
這兩個對話機(jī)器人由 Facebook 內(nèi)部的人工智能研究實(shí)驗(yàn)室(FAIR)開發(fā),研究員用機(jī)器學(xué)習(xí)訓(xùn)練這兩個機(jī)器人進(jìn)行對話、談判,希望它們可以跟人用英文進(jìn)行交涉,獲取相應(yīng)的目標(biāo)商品。
訓(xùn)練的材料是5808組人與人之間的談判對話,總共有2236種不同的劇情。所謂的劇情根據(jù)談判的商品和對應(yīng)價值有所區(qū)分。
例如,其中一個劇情里商品是三本書,每本書對應(yīng)價值是 2;兩頂帽子,單個帽子對應(yīng)價值 1;一個球,單個球?qū)?yīng)價值是 2。談判雙方的評判標(biāo)準(zhǔn)是根據(jù)獲得的商品的對應(yīng)價值計(jì)算。
進(jìn)展比較順利。Facebook 開發(fā)的機(jī)器人可以用比較順暢的英文跟普通人對話,對方?jīng)]怎么意識到他其實(shí)在跟機(jī)器人談判。
但事情的發(fā)展超出了預(yù)料。Facebook 的研究員希望讓這些機(jī)器人更進(jìn)一步,于是開發(fā)了兩個已經(jīng)預(yù)先受過訓(xùn)練的、受監(jiān)管的模型 Alice 和 Bob,讓它們作為談判雙方進(jìn)行強(qiáng)化學(xué)習(xí)(Reinforcement Learning),也就是機(jī)器人之間的談判。于是就出現(xiàn)了開頭這種看上去沒有意義的對話。
但對于機(jī)器人來說,這些看上去語法不通順的對話還是承擔(dān)的了一定的功用。該 Facebook 實(shí)驗(yàn)室的發(fā)言人告訴《大西洋月刊》,F(xiàn)acebook 的數(shù)據(jù)顯示,這些對話仍然能夠幫助兩者最后達(dá)成一致的。Facebook 的研究員認(rèn)為,這種對話比較接近于語言。來自佐治亞理工學(xué)院(Georgia Tech)、FAIR 實(shí)驗(yàn)室的訪問研究科學(xué)家 Dhruv Batra 稱,F(xiàn)acebook 已經(jīng)觀察到類似的現(xiàn)場多次。
除了 Facebook 外,還有像特斯拉 CEO Elon Musk、知名孵化器 YC 主席 Sam Altman 創(chuàng)立的非盈利機(jī)構(gòu) OpenAI 也在機(jī)器人語言上有所研究。他們設(shè)立了一個虛擬環(huán)境,讓一堆被標(biāo)記上不同顏色的機(jī)器人完成一些特定的目標(biāo),例如將他們移動到一個具體的位置上,其中需要這些機(jī)器人自己協(xié)作、對話。最終可以達(dá)到的結(jié)果是,這些機(jī)器人可以完成一句類似于“ 你最終是否可以達(dá)到綠色那邊(Did you end up getting to the green can or not)? ”
但賓夕法尼亞大學(xué)的語言學(xué)教授 Mark Liberman 持有不同的意見,他認(rèn)為這跟語言的差距還是挺遠(yuǎn)的。他說:“首先,這完全是基于文本的字符,但人類的語言基本上都是通過口頭表達(dá)或者是手勢完成,文本作為一層虛擬的表面。”
不過,不管這是不是一種機(jī)器人語言還是只是字符串,作為 Facebook 實(shí)驗(yàn)室的一項(xiàng)研究結(jié)果,研究員們最終決定將機(jī)器人設(shè)定為使用普通英文。
他們給出的理由是:我們的興趣是有一些機(jī)器人可以跟人對話。