由立德基金會主辦的第三屆“全球青年大會(Global Youth Summit)”于2017年7月16日在京舉辦。今年大會的主題為“未來的商業(yè)”,與全球青年從數(shù)字化來剖析,回到商業(yè)本源——奏出數(shù)字化誤區(qū),在本源上解決問題,走可持續(xù)發(fā)展路線,導(dǎo)師攜手全球青年打造另類商業(yè)體驗。
會上,電子科技大學(xué)互聯(lián)網(wǎng)科學(xué)中心主任周濤做了主題演講,以下為演講實錄。
剛才周偉已經(jīng)講了,當(dāng)下一個現(xiàn)象,商業(yè)計劃書好像不提人工智能不好意思拿出來。其實大數(shù)據(jù)也是如此,是一個熱詞,它現(xiàn)在火熱的程度甚至超過了產(chǎn)業(yè)界實際的貢獻。
第一,大數(shù)據(jù)的企業(yè)多的不可思議,任何一家公司只要能夠打開一個表格它都號稱自己是一家大數(shù)據(jù)的企業(yè)。
第二,大數(shù)據(jù)給了我們?nèi)A而不實的感覺,因為很多公司做了大數(shù)據(jù)的項目但是好像沒有踩著大數(shù)據(jù)的清風(fēng)扶搖直上。所以我今天作為大數(shù)據(jù)行業(yè)里面的研究人員,想給大家談兩個現(xiàn)實,三點建議。
第一個現(xiàn)實,數(shù)據(jù)它首先是成本,其次才是價值。我們有的時候在新聞媒體中看到了一些了不得的互聯(lián)網(wǎng)企業(yè),他們用不太多的數(shù)據(jù)產(chǎn)生巨大的價值。但是在銀行、運營商、政府,雖然有更多、更好的數(shù)據(jù),卻沒有產(chǎn)生出應(yīng)有的價值。我們看到機柜里面擺著無窮無盡的數(shù)據(jù),但是卻有一種感覺,不是到了金礦區(qū)而是到了墳?zāi)箙^(qū),因為數(shù)據(jù)沉睡在那里沒有產(chǎn)生價值。我們自己規(guī)劃企業(yè)大數(shù)據(jù)計劃,要看它會不會帶來真正的價值?要讓價值作為一個取舍對象。而不是為了建一個數(shù)據(jù)中心而建一個數(shù)據(jù)中心。
所以我想提的第一個建議就是,我們一定要想辦法用一些示范性的應(yīng)用創(chuàng)新來拉動數(shù)據(jù)的價值,而不是為了建一個平臺而建一個平臺。
第二個現(xiàn)實,計算機它和我們?nèi)祟愄幚硗瑯拥膯栴},但是采用的是完全不同的方法和思路。我們千萬不要試圖用我們的理念去束縛計算機。比如沒有阿法狗之前,很早之前計算機就開始下棋,最早下棋的思路是搜索+優(yōu)化,它本質(zhì)就是盡可能窮盡一切的可能性。即便在這種方法下計算機下棋比人下的更好,我們是中是可能學(xué)到下棋的藝術(shù)。計算機還有一套方法不是搜索,我們叫做機器學(xué)習(xí)。它是在一大堆數(shù)據(jù)和特征中,重新做特征提取,通過非線性的變化,兩兩三三特征的組合,形成幾十萬到幾百上千的特征,然后用很多學(xué)習(xí)模型。比如神經(jīng)網(wǎng)絡(luò)、回歸分析,然后找到從特征到結(jié)果之間的關(guān)聯(lián),然后把這些模型重新做集成學(xué)習(xí)。這種處理幾十億上千億的特征,用幾千上萬進行學(xué)習(xí),和我們?nèi)祟愃伎紗栴}的方式是截然不同的。
所以我給大家提的第二個小建議,我們要把大數(shù)據(jù)和人工智能用來解決企業(yè)問題的時候,我們要抓住的是企業(yè)真正要解決的目標是什么,然后我們要去尊重計算機的方法。
比如打一個廣告,我們希望廣告的點擊率足夠高,或者再進一步說,我們希望有更多人點了這個廣告之后,能夠購買你的商品,它可能是體現(xiàn)在搜索引擎中的推薦,可能是體現(xiàn)在我們電子商務(wù)網(wǎng)站中的猜你喜歡。這個時候懂計算機懂人工智能的人把這個問題轉(zhuǎn)化成學(xué)習(xí)怎么廣告排序,來提高你的點擊率,或者把購買和銷售額作為我們的目標。但是有一些企業(yè)主,他有一套自己的邏輯。他想我先對消費者做一個畫像,我這個煙酒多大人買?是白領(lǐng)還是窮酸?他做這個人物畫像之后,用這個人物畫像,從所有人里面把最可能買的人選出來,給他們打廣告。
這是非常愚蠢的想法。因為他完全在用人的腦子去思考計算機做的事情,計算機能夠處理上千萬上億的特征,為什么做一個如此粗糙的畫像?對于你讓你的東西賣的更好,這種思路就是把人的想法去套計算機,效果往往很差。
但是反過來一個市場的負責(zé)人,他想要做地面廣告的投放,比如路牌廣告?;蛘弋a(chǎn)品的負責(zé)人想設(shè)計新的產(chǎn)品,面對90后00后的消費者,這個時候他需要人物的畫像,需要我們的消費者的畫像和我們競爭品牌的畫像。他可能不需要廣告,線上廣告投放的點擊率多高。這個時候畫像尤其是不同品牌之間畫像差異,以及這么多年消費者畫像發(fā)展的趨勢,就成為他最想要的東西,他可以讓計算機去完成這樣的事情。
我講這個例子是說,我們千萬不要用我們的條條框框來限制計算機,也不要猜測計算機到底需要什么東西?我們只要抓住我們真正的商業(yè)目標就可以了,其他的事情可以尊重計算機,讓他去做。因為時間關(guān)系這個問題我們在臺上還可以談,最后給大家三個建議。
第一個建議,我希望大家在考慮一個數(shù)字化項目的時候,或者考慮大數(shù)據(jù)項目的時候,我們要以應(yīng)用作為牽引,以目標作為導(dǎo)向,不要受什么人的蠱惑建大數(shù)據(jù)的項目。
第二個建議,我希望大家不要用自己人類的思維方式去束縛計算機。舉個例子比如想象有一天,當(dāng)計算機統(tǒng)治了我們的世界,今天我們在這兒交流,大部分人用中文,霍夫曼用的英文我們能聽中文,也可以聽英文。我們和女朋友寫情書我們用中文,我們有時候在國外我們可以說意大利語,但是如果有一天計算機說別說那么多語言,我們交流就用C語言,你寫情書談戀愛我們開會做報告也用C語言,你說我們還能用C語言思考我們的人生嗎?我覺得不能。大家不要用自己的人類語言套計算機身上,計算機在提供可預(yù)測性的時候,不一定提供可解釋性,在提供可解釋性的時候,不一定給出非常好的預(yù)測建議。
第三個建議,我想提醒大家大數(shù)據(jù)不是萬能的。有一位哲學(xué)家他曾經(jīng)回顧精神分析和后現(xiàn)代主義的時候,他曾經(jīng)說在人類發(fā)展的歷史中有時候某些哲學(xué)思想,會突然涌現(xiàn)出來,就像是宏大的概念。那一切的聰明人把這些概念抓住,好像找到了萬能鑰匙,可以開一切的門,但是時間20年30年50年過去了,很多頂尖的哲學(xué)家在宏大的概念中迷失自我,沒有做出應(yīng)有的貢獻。人工智能和大數(shù)據(jù)也是如此,它的應(yīng)用是有局限,不能替代我們的方方面面。好像導(dǎo)師講的,不能替代我們體驗一個愛情,不能代替我們經(jīng)歷痛苦,不能帶給人格力量的提高。我最后一個建議就是我們要了解大數(shù)據(jù)的邊界,在可以應(yīng)用的地方應(yīng)用它,可以拓展的地方可以拓展它,在不能應(yīng)用不能拓展的地方就停下來。