谷歌想要給你的計算機帶來個性 何時能實現呢?

責任編輯:editor007

作者:樂邦

2017-10-13 20:58:55

摘自:網易科技

10月13日消息,《時代》(Time)發(fā)布文章稱,谷歌的個性團隊成員正在試圖使得它的數字助手Google Assistant聽上去像是人類,給你的計算機帶來個性。Google Assistant配音員以一種似乎很有谷歌特色的方式回答道,“他準時出現,佩戴了一條漂亮的領帶。

Members of Google’s personality team are trying to make its digital helper, Assistant, sound more like a person

10月13日消息,《時代》(Time)發(fā)布文章稱,谷歌的個性團隊成員正在試圖使得它的數字助手Google Assistant聽上去像是人類,給你的計算機帶來個性。

以下是文章主要內容:

在谷歌總部,幾位作家在圍著一塊寫著各種想法的白板。它們看起來像是骷髏杰克(Jack Skellington)可能會寫下的那種東西:“萬圣節(jié)求生背包”,“如何打敗怪獸。”對于37歲的萊恩·杰米克(Ryan Germick)來說,有個想法尤其搶眼。“去年人們不喜歡‘聞我的腳’,”他笑道。他的同事艾瑪·科茨(Emma Coats)解釋道:

“這是‘不給糖就搗蛋’的小游戲,其中一個回應是‘聞我的腳。’人們都唯恐避之不及。”

那個下午,杰米克一直處在像這樣的頭腦風暴會議當中。期間,谷歌員工們討論生活中的一些重大問題,比如冒泡的大汽鍋的聲音和遠處傳來的嚎叫聲哪個更加嚇人。這些都是他作為谷歌語音助手Google Assistant首席個性設計師的職責的一部分。該語音助手服務已經出現惡劣各式各樣的智能手機上,同時也登陸了谷歌去年秋季開售的Home智能音箱。

創(chuàng)造個性

這時候是8月份,但杰米克的團隊卻在考慮用戶在萬圣節(jié)可能會問谷歌什么問題,為什么會有那些問題。人們會問Google Assistant給些裝扮建議嗎?又或者,他們會想要聽到很合事宜的笑話嗎?Google Assistant的創(chuàng)造者們認為,回答這些種類的問題的關鍵在于,不要像我們大多數人那樣看待谷歌,即把它看作不帶感情的信息提供者,而應當把它看作一個充滿活力的角色。Google Assistant產品管理主管莉蓮·林孔(Lilian Rincon)表示,“簡單來說,就是我跟谷歌說話能不能就像我現在跟你說話那樣?”

這項任務實際上比它聽上去要更加困難。在過去幾年里,開發(fā)聲控設備已經成為硅谷競爭最激烈的科技競賽之一。Google Assistant進入三星、LG等Android手機廠商的產品。亞馬遜在它頗為流行的Echo智能音箱上提供它的語音助手Alexa。蘋果已經將Siri整合到各款iOS設備當中。微軟也將它的語音助手服務Cortana推向從筆記本電腦到恒溫器的各式設備。

雖然有如此之多的公司在爭相打造各種支持傾聽和對話的設備,但要具體預估該類技術多快會成為市場主流并非易事。但根據市場研究公司eMarketer的數據,今年,有6050萬美國人每月至少使用一次Alexa、Google Assistant或者其它的虛擬助手。Gartner的分析師預計,到2021年,全球智能音箱銷售額將達到35.2億美元,較2016年增長近400%。許多科技行業(yè)專家都認為,語音是人機交互的下一個重大轉變。“這將成為一種全然不同的互動方式,”艾倫人工智能研究所CEO奧倫·埃齊奧尼(Oren Etzioni)指出,“當你能夠跟像酒店禮賓員那樣的虛擬助手對話的時候,這真的會引發(fā)巨大的變革。”

但對著計算機喊出指令,跟與之進行對話完全是兩回事——這讓谷歌處在不同尋常的位置。該公司開發(fā)的技術能夠索引海量的網絡信息,做到人類無法做到的事情,它也由此成為全球最具價值的企業(yè)之一?,F在,它的未來前景可能取決于它能否教導機器執(zhí)行一項對于大多數人而言再簡單不過,但對于計算機極其困難的任務:閑聊。為此,該公司寄望于一個不在它平常的招聘范疇內的左腦型創(chuàng)意人才團隊:小說作家,制片人,視頻游戲設計師,共情專家,喜劇演員。如若他們成功的話,那他們就將給谷歌帶來某種它以前從未有過的東西:個性。

讓Google Assistant變得像人

數字助手算不是什么新鮮技術。1952年,貝爾實驗室的Audrey計算機能夠識別口頭說出的數字,但它要消耗大量的計算能力,無法理解所訓練的語音。1990年,Dragon Systems推出Dictate,該軟件擁有3萬術語詞匯量,但需要說話人每說出一個詞都要停頓一下。1997年,該領域迎來了一個典型的失敗案例。那一年,微軟推出Clippy卡通紙夾,該產品旨在預測Office用戶的需求和回答問題。但實際上,Clippy比C-3PO更加糟糕,時不時彈出造成干擾,幫倒忙。(幸好它不會說話。)該功能成了笑柄,最終在2007年徹底退出歷史舞臺。

直到6年后,Clippy背后的那個好點子——預測你接下來可能需要的信息,適時提供合適的貼士——在蘋果Siri上成形。它可理解特定語境中的問題,經過一定的智能技術處理后會大聲作出回答。此外,它相當風趣幽默。很快,蘋果的各家競爭對手紛紛效仿,爭相開發(fā)類似的技術。

谷歌Google Assistant團隊成員沒有忽視數字助手的這段失敗史。曾在萬圣節(jié)將自己打扮成Clippy的杰米克指出,未來的數字助手得不僅僅是問答機器。畢竟,谷歌搜索在那方面已經做得非常出色。“我們希望你能夠跟這種角色建立連接,”他說,“它部分要做的就是理解人類的經歷和人類的需求,它不僅僅要能夠提供信息,還要懂得如何與人們建立聯系。”

情感聯系

讓那種角色變得合理的任務落在谷歌個性團隊身上,他們一直在致力于將Google Assistant變成像是人類而不是假裝是人類的數字助手。(那是Google Assistant沒有取像Siri或者Alexa這樣的擬人名稱的部分原因。)作為個性團隊的角色負責人,科茨擁有數年的虛擬角色開發(fā)經驗。她在皮克斯動畫工作室供職了5年,曾參與《怪獸大學》(Monsters University)?、《勇敢傳說》(Brave)、《頭腦特工隊》(Inside Out)等電影的制作。“要花很多的心思去思考除了面部表情以外,還可以利用哪些其它的工具來進行情感聯系。”

科茨談到了谷歌在琢磨生動但不會引起誤導的回答時會考慮的問題。當中包括:用戶希望從互動中得到什么?谷歌能夠如何以一種積極正面的態(tài)度作出回答?如何能夠讓對話進行下去?科茨舉了一個例子:被問到是否怕黑的時候,Google Assistant不會給出表明它怕黑的回答。相反,它會說,“我喜歡天黑,因為天黑了星星會出來。沒有星星的話,我們就無法了解行星和星座。”科茨解釋道,“這是一項來自谷歌的服務。我們想要它變得盡可能地健談,而不去偽裝成別的東西。”

這往往涉及先分析某人詢問特定問題的言外之意。被問到“你愿意嫁給我嗎?”的時候——谷歌稱這個問題被問了成千上萬遍——Google Assistant不會直接給出回答,而是轉而說它很高興主人想要得到更多的承諾。

像這樣的問題要么是問著玩的俗套問題,要么是發(fā)自于復雜的情感。雖然任何向Google Assistant求婚的人都不大可能想要得到一個認真的回復,但該公司正在試圖系統性地理解提問者的情感狀態(tài)有多大的不同。在谷歌擔當共情設計師的丹妮爾·克蕾特克(Danielle Krettek)的職責就是幫助創(chuàng)意作家理解那一點??死偬乜说慕巧苋菀妆灰曌魇乔楦薪庾x者。坐下來跟她交談沒多久后,我就明白為什么會這樣:她熱情奔放,充滿活力,任何時候看她的面部表情,就能知道她的情緒狀態(tài)。“有的東西人們是能夠感覺和表達出來的,有的東西則表達不出來。”她說,“我解讀那些東西的能力就是我對這個團隊的貢獻。”

克蕾特克從人體驗情緒的不同方式的角度來談論她的各位同事,尤其是那些相似但容易搞混的情緒。她可能會鉆研失望情緒會憤怒情緒有多大的不同,又或者為什么放松自如的感覺會跟滿足的感覺不一樣。這應當有助于作家們想出帶來共鳴感的回答。以Google Assistant對于“我覺得身心俱疲”的回答為例,它回復道,“你覺得很心煩吧。怎么才能幫到你?”克蕾特克說道,“那種理解會讓人覺得自己的感受被看見,自己的需要被聽見。它就像是一種眼神接觸。”

如何推進對話

Google???s personality team draws on a broad range of sources to hone the character of the company???s voice-enabled Assistant. Writers use notes and doodles to track potential ideas that eventually show up in products like this white-and-brass-colored Google? Home, top center, and the Pixel smartphone, bottom right.

谷歌的個性設計師有時候從意想不到的地方獲得靈感。據科茨和杰米克透露,即興劇是最重要的靈感來源之一。那是因為即興劇需要推進會話,鼓勵參與者不斷相互接話——被稱作“是的,而且”(yes and)的原則。杰米克表示,谷歌個性團隊的幾乎所有成員都曾做過即興劇。

從問Google Assistant它最喜歡的冰淇淋口味的例子中,你就會了解到“是的,而且”原則。“我們不會說,‘我不吃冰淇淋,我身子都沒有。’”杰米克解釋道,“我們也不會說,‘我喜歡巧克力冰淇淋,我每個星期二都會跟妹妹一起去吃,’因為那也是不實的。”在這些情況中,作家們會思索普通的回答來讓用戶繼續(xù)對話。例如,對于那個冰淇淋問題,谷歌會回答像這樣的話,“選三色冰淇淋錯不了,它總有適合你的味道。”

不過,讓對話進一步展開對于Google Assistant而言仍然十分困難。問它三色冰淇淋中的特定口味,比如香草味或者草莓味,它會被難倒。谷歌的數字助手也難以應對對話中的一些常見情況,比如理解措辭上不同于系統所輸入的問題的特定請求。另外,谷歌能夠用來理解用戶需求或者他們的情緒狀態(tài)的工具相當有限。例如,它無法光根據用戶的語調來分辨他們是喜是憂,是不是很疲倦。它也肯定無法覺察用戶的面部表情變化。

對于用戶,谷歌目前要解決的最佳特征是他們的歷史記錄。通過了解用戶以往問了哪些問題,最常使用哪些功能,它能夠試著去避免給出重復性的回答。未來,谷歌希望根據用戶與Google Assistant的互動方式來更加廣泛地理解他們的偏好。“我們還沒有完全做到那一點,”杰米克說道,“但我們將能夠開始理解,特定的用戶是那種喜歡開玩笑的用戶,還是那種嚴肅的用戶。對我來說,圣杯就是我們能夠真正理解人的語言,達到我說出的任何話幾乎都可以理解的地步,”他說,“即便我在情感上有弦外之音,又或者涉及某種習語。”

那具體會在什么時候實現,還是未知之數。問遍硅谷從事語音技術的人,包括谷歌的人才,他們基本都是給出像“現在還言之尚早”這樣的回答,也就是說“沒有人知道答案。”研究音調的細微變化

與此同時,谷歌在專注于研究音調的細微變化。Google Assistant告訴你天氣狀況的時候,它會著重強調像“基本”這樣的詞語。又或者,你可能會注意到,當它在句子開頭說“不”的時候,它的聲音聽上去略有上揚。那些細微的音調變化是有意而為的,它們可能就是詹姆斯·吉安哥拉(James Giangola)正在做的事情。作為谷歌對話和個性設計主管,他是語言學和韻律學(研究語言的抑揚頓挫)的專家。

在我會見的所有谷歌個性團隊成員里,吉安哥拉是最像工程師的那一個。他來與我會面的時候準備了筆記和談話要點。他非常嚴肅,但也很興奮地告訴我,做好語音交互對于科技公司來說為什么會那么重要。“語音用戶界面至關重要,因為聲音很大程度上是個人社會身份的一個標記。”他說。跟很多其他的Google Assistant團隊成員一樣,吉安哥拉在交談中也常常將語音用戶界面簡稱為“VUI”。“海倫·凱勒(Helen Keller),”他表示,“聲音代表你在社會中的位置。”

他的職責還包括選派和指導谷歌聘來的演員給Google Assistant配音。在供職于谷歌之前,吉安哥拉曾在蘋果參與Siri初始版本的開發(fā)。他給我播放了一段他在工作室與Google Assistant配音員共事,指導她進入角色的視頻。(谷歌拒絕透露配音員的身份。)在該特定的場景中,吉安哥拉扮演經理的角色,詢問谷歌最近與一位應聘者的面談進行得怎么樣。Google Assistant目前還無法幫助處理該類任務,但未來或許可以。

Google Assistant配音員以一種似乎很有谷歌特色的方式回答道,“他準時出現,佩戴了一條漂亮的領帶。”說的沒錯,聽上去很正面。她的聲音跟她飾演的那個無生命的管家的聲音幾乎無法分辨,就只是她說“領帶”(tie)一詞時略有破音才讓我想到說話的是個人。那也讓我想到,如果Google Assistant無法理解口語的微妙之處,那它的聲音不管聽上去再真實,也無補于事。跟Google Assistant說“我很孤獨”,它會背誦出克蕾特克等人幫助精心設計的、帶有同理心的回答。但跟它說“我覺得沒人喜歡我”,它會回答它聽不懂。重重挑戰(zhàn)

對于谷歌和它的競爭對手來說,它們要處理一些比解讀語音基本元素更加基本的問題。先吸引用戶便是一個很重要的問題。谷歌通常都不公開Google Assistant的用戶使用數據,但根據市場研究機構Creative Strategies去年的一項調查,人們說他們很少或者有時候使用語音功能:70%使用Siri,62%使用Google Assistant。

隱私問題是另一個日漸加劇的隱憂。例如,今年早些時候,來自亞馬遜Echo智能音箱的周圍環(huán)境錄音在阿肯色州的一起謀殺案審訊中作為證據被提交上去,這是由人工智能驅動的設備記錄的數據第一次被用于美國法庭。像Echo和谷歌Home這樣的設備一直在收聽,但不會將信息發(fā)送回開發(fā)商,除非它們有被喚醒——以Google Assistant為例,就是有人說“O.K., Google”的時候。但考慮到像亞馬遜和谷歌這樣的公司是通過盡可能了解你來賺錢的,在家中放置聯網的傳聲器的主意會讓很多人感到不安。谷歌表示它有在它的網站上明確列舉它從其設備收集的數據類型,還指出它的Home音箱上方有指示它處于收聽狀態(tài)的提示燈。

然后,谷歌還面臨一個根本性的難題。計算機還遠未能夠在人們發(fā)出請求或者提問的時候察覺可能反映他們的感受的線索。要做到這一點,Google Assistant需要從大量描繪用戶在不同情緒狀態(tài)下的聲音的數據當中進行學習。“訓練數據通常都包括相對平靜的環(huán)境中的普通聲音。”卡內基梅隆大學計算機科學學院語音技術研究所主任杰米·卡博內爾(Jaime Carbonell)指出,“通常來說你無法讓處在巨大壓力下的人提供數據,在所有的這些狀況下收集聲音數據極其困難。”

讓更多的設備進入家家戶戶會帶來幫助。10月4日,谷歌發(fā)布了兩款新的Home智能音箱,包括一個相對小巧便宜的版本和一個高端版本。但亞馬遜在該領域仍遙遙領先。據eMarketer估計,2017年,亞馬遜Echo音箱將占據聲控音箱市場70.6%的份額,谷歌將僅占23.8%。

不過,杰米克對此并不擔心。他也對Google Assistant的缺點毫不諱言。我問他他希望Google Assistant變成哪一種科幻片AI產品,他沒有選擇像《鋼鐵俠》(Iron Man)電影中的Jarvis或者《她》(Her)中的Samantha那樣超級先進的、無所不知的品種。他說,他希望讓Google Assistant變得像Netflix的情景喜劇《我本堅強》(Unbreakable Kimmy Schmidt)中艾麗·坎伯爾(Ellie Kemper)扮演的角色Kimmy。雖然被邪教綁架關在地牢15年之久,還遭到了愚弄,Kimmy卻仍能夠看到積極的一面。

“我們常常討論她令人難以置信的樂觀,”杰米克說道,“就像她從地下室出來的時候那樣,我們并不是總能夠理解語境,但我們會嘗試保持積極樂觀。”個性就是這樣:古怪也能成為個性魅力的一部分。

鏈接已復制,快去分享吧

企業(yè)網版權所有?2010-2024 京ICP備09108050號-6京公網安備 11010502049343號