最近,電子科技大學教授,云基地大數(shù)據(jù)實驗室合伙人周濤在接受采訪時提出,對于普通企業(yè)要通過修煉成為大數(shù)據(jù)企業(yè),關鍵要做好7個步驟:
第一步是要實現(xiàn)數(shù)據(jù)化。企業(yè)要為此做好計劃,到底需要保存什么樣的數(shù)據(jù),以人為中心的數(shù)據(jù)還是以產(chǎn)品為中心,還是更關注企業(yè)運營,需要做好這樣的計劃,然后再將企業(yè)生產(chǎn)經(jīng)營中的數(shù)據(jù)保存下來,即便是現(xiàn)在看來沒什么用的數(shù)據(jù),未來也可能產(chǎn)生巨大的價值。比如說像售樓處、體驗店客戶的來訪數(shù)據(jù),就有必要完整的記錄下來。包括怎么過來的,一個人來還是幾個人,有老人和小孩嗎,穿什么樣的衣服等等,還有客戶的情緒,看了什么,問了什么問題,最后買了什么東西,都是非常重要的數(shù)據(jù)。另外,企業(yè)內部人力資源的各個方面也都可以記錄下來,這些可以進行挖掘和分析的數(shù)據(jù)。他舉例說,長虹公司在自己的生產(chǎn)線設置了很多傳感器,監(jiān)測溫度、濕度、震動、噪音、顆粒等等因素,希望了解到生產(chǎn)過程中哪些因素會對員工產(chǎn)生明顯影響。他們此前都認為溫度和顆粒可能對于員工操作和產(chǎn)品質量影響最大,但是事實上最終數(shù)據(jù)分析的結果,溫度是沒有什么影響的,恒溫的控制對于生產(chǎn)效率和合格率的貢獻并不像想象中那么大,反而是噪音對于員工情緒以及生產(chǎn)的影響非常重要。要成為大數(shù)據(jù)企業(yè),第一步企必須要實現(xiàn)數(shù)據(jù)化。
第二步,企業(yè)要建設自己的大數(shù)據(jù)管理與應用平臺。對于很多企業(yè),做大數(shù)據(jù)并不是意味著要自己去建設數(shù)據(jù)中心。隨著云計算和云數(shù)據(jù)中心出現(xiàn),使用外部數(shù)據(jù)中心的成本已經(jīng)非常低了,數(shù)據(jù)存儲的費用也是在成倍的下降。但是,企業(yè)要做大數(shù)據(jù),必須要在IT基礎設施方面具有比較好的數(shù)據(jù)處架構,要用大一些工具比如數(shù)據(jù)分布式存儲、Hadoop等等。很關鍵的企業(yè)不僅要具備一個數(shù)據(jù)中心的硬件,還要考慮和企業(yè)業(yè)務方向結合,不僅就是包括了數(shù)據(jù)的采集、數(shù)據(jù)庫架構,向上的分析模塊,再往上的API數(shù)據(jù)出口,以及橫向的一些業(yè)務模塊和出口這些東西。要做成企業(yè)的大數(shù)據(jù)管理應用平臺,我們強調一定要從企業(yè)的業(yè)務出發(fā),量體裁衣,企業(yè)首先必須要搞清楚自己的業(yè)務形態(tài)是什么。
第三步,企業(yè)要自己培養(yǎng)一些大數(shù)據(jù)理念,或者是小數(shù)據(jù)挖掘的團隊。做大數(shù)據(jù),企業(yè)的規(guī)模不一樣,要求也不一樣。如果企業(yè)規(guī)模足夠大,比如說是電信運營商或者電力、銀行這樣的行業(yè),可能會形成一個大數(shù)據(jù)的團隊。如果不是,比如說就是簡單的服務企業(yè),那么形成理念就可以了?,F(xiàn)在我們認為比較好的數(shù)據(jù)科學家,也不是說就是特別擅長或適應網(wǎng)絡,這樣的人不重要了,重要的是要有武器,什么樣的問題來了知道怎么解決。關鍵我們認識是要培養(yǎng)四種理念:(1)除了結構化數(shù)據(jù)以外還有文本、音頻、圖像、遙感、網(wǎng)絡、行為軌跡、時間數(shù)據(jù),這些數(shù)據(jù)怎么處理,它存在的大挑戰(zhàn)是什么。(2)一定要懂預測,因為絕大部分的大數(shù)據(jù)應用回到預測中,預測里面很多方法都是基準學習的,而基準學習目前最火的方向是集群學習。(3)要走分布式存儲計算,這絕對不是說我知道給Hadoop 、Mapreduce、Hbase就夠了,關鍵問題是首先要知道怎么樣去搭一個混合式的,你的數(shù)據(jù)來了,我到底是應該犧牲我的一致性還是犧牲操作性,大概的成本多少,哪些數(shù)據(jù)挖掘的重要算法我要把他Hadoop、Mapreduce實現(xiàn),哪些算法要通過SPTA,可變邏輯治理是在硬件里面,從而替代CPU、GPU。(4)需要整個數(shù)據(jù)向外的發(fā)展,知道哪些數(shù)據(jù)可能在外部產(chǎn)生什么樣的重要價值,或者外部的數(shù)據(jù)能夠在你的企業(yè)產(chǎn)生什么樣的重要價值。企業(yè)應該培養(yǎng)出這四個能力,建立起企業(yè)數(shù)據(jù)挖掘的人才團隊。
第四步,企業(yè)一定要做好自己的外部數(shù)據(jù)儲備。我們都說“書到用時方恨少”,很多的企業(yè),比如說像服裝銷售這樣的傳統(tǒng)行業(yè),我要進的貨在淘寶、天貓上賣的怎么樣?在淘寶、天貓哪一個店鋪怎么樣?它的競爭品牌是什么樣售價,怎么樣銷售的?對于這樣一些數(shù)據(jù),如果到需要的時候才去找,往往都來不及了。同樣的道理。比如銀行給中小企業(yè)發(fā)放貸款的時候,希望了解到它的用水、用電、生產(chǎn)、交通數(shù)據(jù),例如通過攝像頭就能知道這個企業(yè)到底有多少車運行,這些數(shù)據(jù)可能對于中小企業(yè)發(fā)放貸款決策都很重要。但是當你要發(fā)貸款的時候,再去問已經(jīng)沒有機會了,或者說成本太高了。我們建議,企業(yè)應該學會通過公共渠道或者數(shù)據(jù)交換的方法,根據(jù)自己的業(yè)務需求來量身定做自己的外部數(shù)據(jù)和戰(zhàn)略數(shù)據(jù)。
第五步,大企業(yè)一定要有數(shù)據(jù)偵測的能力,需要有創(chuàng)新思維的人隨時思考這些問題,比如企業(yè)占有的數(shù)據(jù)到底在外部能夠產(chǎn)生什么樣大的作用。就像我們經(jīng)常拿雅昌藝術中心的例子,它存了很多藝術品的數(shù)據(jù),所以最后它可以發(fā)布藝術指數(shù)。同樣國家電網(wǎng)也發(fā)布兩個指數(shù),一個叫重工業(yè)用電指數(shù),一個叫輕工業(yè)用電指數(shù)。淘寶網(wǎng)有它的CPI指數(shù),還有很多企業(yè)的一些數(shù)據(jù),實際上都可以發(fā)揮想象不到的價值。
第六步,一個大數(shù)據(jù)企業(yè)包括未來現(xiàn)代化企業(yè),一定要有開放共享的態(tài)度。一方面需要企業(yè)把自己的很多問題社會化,另一方面企業(yè)要盡量去通過一些平等辦法,通過數(shù)據(jù)交換的方式互相共享形成數(shù)據(jù)化。
第七步,企業(yè)還要做好數(shù)據(jù)方面的戰(zhàn)略投資。我認為有三種比較先進的模式。 一種模式叫做產(chǎn)業(yè)鏈布局,比如說海爾、長虹可以投物聯(lián)網(wǎng),對物聯(lián)網(wǎng)企業(yè)創(chuàng)新進行投入。比如說中信集團可以關注醫(yī)療,在這個方面尋找相關的數(shù)據(jù)應用。第二個方面就是技術,你要知道哪些是硬技術創(chuàng)新,特別是在基礎術設施層面的,比如加速存儲,云計算的一些技術,比如數(shù)據(jù)挖掘,垂直應用分析,這個方面集中了很多創(chuàng)新也可以形成很大的規(guī)模。第三種模式是數(shù)據(jù)集方面的投資,我們知道阿里巴巴投資高德是為了數(shù)據(jù),它投資新浪微博不僅是要投錢還要花錢買數(shù)據(jù),所有這一切本質還是想把數(shù)據(jù)流動起來做更大的事情。這種投資就是集成數(shù)據(jù),強調數(shù)據(jù)流動性。這些投資里面有幾點是需要注意的,一是要去關注企業(yè)的數(shù)據(jù)價值,其次要關注早期的投資,去長期指引而不是短期追逐回報率,最后還要多關注傳統(tǒng)行業(yè)。周濤教授提出,大數(shù)據(jù)的本質不在于數(shù)據(jù)量有多少,也不在于是否是異構的數(shù)據(jù),而是在于數(shù)據(jù)是關聯(lián)的,整體的數(shù)據(jù)可以流動起來。他認為,跨領域關聯(lián),通過一加一產(chǎn)生遠大于二的價值才是大數(shù)據(jù)的精髓。