你敢說你真的知道大數(shù)據(jù)是啥嗎?

責(zé)任編輯:editor005

作者:郭煒

2015-07-13 13:43:59

摘自:互聯(lián)網(wǎng)沙龍

郭煒,現(xiàn)任聯(lián)想研究院大數(shù)據(jù)方向負(fù)責(zé)人,畢業(yè)于北京大學(xué),曾任萬達(dá)電商數(shù)據(jù)部總經(jīng)理、曾在中金、IBM、Teradata公司擔(dān)任大數(shù)據(jù)方向重要崗位。

郭煒,現(xiàn)任聯(lián)想研究院大數(shù)據(jù)方向負(fù)責(zé)人,畢業(yè)于北京大學(xué),曾任萬達(dá)電商數(shù)據(jù)部總經(jīng)理、曾在中金、IBM、Teradata公司擔(dān)任大數(shù)據(jù)方向重要崗位。在智能Wi-Fi, Beacon等o2o智能硬件方案以及O2O大數(shù)據(jù)采集、處理、挖掘、應(yīng)用具有豐富的理論和實(shí)踐經(jīng)驗(yàn),多次在CIO論壇、O2O論壇、創(chuàng)業(yè)論壇發(fā)表相關(guān)演講,在傳統(tǒng)行業(yè)和互聯(lián)網(wǎng)行業(yè)享有盛譽(yù)。

以下是郭總分享原文(有刪節(jié))

大家晚上好,我是郭煒。今天想跟大家分享一下在大數(shù)據(jù)下面的一些我的見解過去遇到的一些情況和經(jīng)驗(yàn),那么主要分幾部分。

第一是當(dāng)前大數(shù)據(jù)現(xiàn)狀,我會給大家去分析一下現(xiàn)在的大數(shù)據(jù)趨勢,然后是O2O領(lǐng)域怎么去建立大數(shù)據(jù)平臺,最后分享下我所觀察到的大數(shù)據(jù)的未來的一些趨勢。

大數(shù)據(jù)現(xiàn)狀

先從大數(shù)據(jù)現(xiàn)狀分析開始,先給大家看一張圖。

其實(shí)大數(shù)據(jù)這個概念現(xiàn)在被大家炒的非常火,好像說到統(tǒng)計都要說是由大數(shù)據(jù)統(tǒng)計出來的,所有的無論網(wǎng)絡(luò)金融,還是相關(guān)的O2O,還是我們的所有企業(yè)都在說自己在做大數(shù)據(jù)平臺。那么什么是大數(shù)據(jù)呢,其實(shí)我覺得現(xiàn)在有好多專家有各式各樣的定義,我覺得其實(shí)這個大數(shù)據(jù)不是一個特別新鮮的東西,就像我在這個圖里面給大家劃分出來的,數(shù)據(jù)和大數(shù)據(jù)是產(chǎn)生很多年積累的概念。

馬云提到說未來是一個DT時代,不是IT時代。那么他是說將來會在任何方面都會產(chǎn)生數(shù)據(jù)和大數(shù)據(jù)來決策、影響我們相關(guān)的一些生活,那么其實(shí)這個所謂的DT,最早的時候是叫做數(shù)據(jù)倉庫,在大概十五年到二十年前它就已經(jīng)出現(xiàn)在國外,那么在1998年到兩千年左右開始引入到國內(nèi)。

在那個時候把它叫做ERP和CRM時代,都是一些企業(yè)內(nèi)部的一些系統(tǒng)比如客戶關(guān)系管理、庫存管理、購銷存等等,各個模塊其實(shí)那個時候就積累了相當(dāng)多的一些數(shù)據(jù),那么像銀行像電信那么投入非常大的一些資金來去做數(shù)據(jù)倉庫,當(dāng)時叫做數(shù)據(jù)倉庫,其實(shí)它也是把我們現(xiàn)在所謂的大數(shù)據(jù)的這些詳單,也都收錄在過去的關(guān)系型的數(shù)據(jù)庫里,那么就形成了它的數(shù)據(jù)倉庫。

那么在數(shù)據(jù)倉庫之上,當(dāng)時也有一些概念叫做數(shù)據(jù)挖掘。其實(shí)也是基于收集到的客戶的詳單,然后找到這個所有數(shù)據(jù)之間的相關(guān)性。還有包括像客戶流失分析、交叉銷售,以及當(dāng)時最著名的一個案例啤酒和尿片案例。講的是沃爾瑪經(jīng)過相關(guān)性分析發(fā)現(xiàn)所有的男顧客在買啤酒的時候,經(jīng)常會買尿片兒,那么這個現(xiàn)象很奇怪。后來經(jīng)過調(diào)研發(fā)現(xiàn)這一般都是妻子讓自己的愛人去商店買尿布,孩子在家已經(jīng)沒尿片兒了,于是沃爾瑪就把尿片放在啤酒旁邊,然后這個啤酒銷量和整體客流量都有很好的變化。這個故事其實(shí)就是發(fā)生在那個ERP和CRM時代,當(dāng)時其實(shí)已經(jīng)有數(shù)據(jù)分析和數(shù)據(jù)推薦的味道,只不過發(fā)生在純線下時代,所以我把它叫做ERP和CRM的時代。

在這之后,互聯(lián)網(wǎng)興起,包括各大的門戶網(wǎng)站,包括像谷歌、雅虎這些全部都發(fā)展起來了,那么國內(nèi)的BAT三家也發(fā)展起來了,這個時候的就不僅僅是過去我們所謂的交易和這些銀行的流水這些數(shù)據(jù)了。這個時代,其實(shí)是主要是以我們的WEB,網(wǎng)絡(luò)日志以及搜索引擎而產(chǎn)生的搜索關(guān)鍵詞,或者是APP產(chǎn)生的點(diǎn)擊流,產(chǎn)生了這樣的數(shù)據(jù)。那么在這個時代,我把它叫做WEB2.0時代,我們這個時代其實(shí)是因?yàn)檫^去的時候,它的所有過去的技術(shù)全都是在處理關(guān)系型,還有這種交易類的數(shù)據(jù),在這個時代它開始處理的非結(jié)構(gòu)化的數(shù)據(jù),比較著名一些品牌像HADOOP開始興起,現(xiàn)在基本上很多的人在做的時候都會說,大數(shù)據(jù)是什么,要建大數(shù)據(jù)平臺必須建HADOOP。

最典型的就是在所有的這些搜索引擎的網(wǎng)站、電商網(wǎng)站,最終它會給個人消費(fèi)者開始做一些推薦的工作,比如說猜你喜歡或者是做一些定時提醒等等,這些東西其實(shí)都是在幫助最終的消費(fèi)者來做一些新的一些購買決策,或者是你在搜索的時候幫你做下廣告的推薦,這個時代其實(shí)叫做2.0時代。

那么在最后,現(xiàn)在這個時代我管他叫IOT和O2O時代。它和過去三個時代差別在哪兒呢?大家可以看到在第一個時代所有的這些數(shù)據(jù)其實(shí)都是企業(yè)內(nèi)部的數(shù)據(jù),它的產(chǎn)生是由客戶產(chǎn)生,數(shù)據(jù)的消費(fèi)這些數(shù)據(jù)的人,一般是企業(yè)內(nèi)部的所謂的決策層,做一些決策支持,做一些數(shù)據(jù)分析、報表,只是少數(shù)人去分享,在第一個ERP時代大家都叫它BI。

在WEB2.0時代,其實(shí)是有個人的消費(fèi)者產(chǎn)生數(shù)據(jù),根據(jù)我們的點(diǎn)擊情況,把這些數(shù)據(jù)采集,再根據(jù)你的推薦引擎重新推薦給消費(fèi)者去方便購買,這個時代其實(shí)是在WEB2.0時代。

在IOT和O2O時代比較有代表性的比如說像現(xiàn)在做了很多的智能Wi-Fi,那么也有現(xiàn)在的炒的比較火的Beacon的技術(shù)。那么也包括現(xiàn)在咱們手機(jī)上的各個

感器去采集的相關(guān)數(shù)據(jù),也包括現(xiàn)在像蘋果PC上面去采集的相關(guān)數(shù)據(jù),那么還包括像我們的手環(huán)、智能家居,甚至于機(jī)器人,包括我們現(xiàn)在線下見到的,這些硬件去采集來的數(shù)據(jù),那么它的數(shù)據(jù)已經(jīng)不是過去的這些網(wǎng)絡(luò)日志。而是除了網(wǎng)絡(luò)日志之外的,比如說我們的線下行為軌跡流。比如說我們視頻別人,比如說我們的經(jīng)濟(jì)數(shù)據(jù)等等,這些所有這些相關(guān)的數(shù)據(jù),那么當(dāng)這些數(shù)據(jù)來臨的時候,過去其實(shí)在WEB2.0的一些技術(shù),又不能完全的去滿足現(xiàn)狀。

舉個例子比如說在WEB2.0的時候可能大家談的最多的還都是HADOOP,HADOOP其實(shí)是做批量分析來去幫你做一個推薦,可能是留數(shù)據(jù)挖掘模型,在WEB2.0時代已經(jīng)不能滿足需求了。

其實(shí)是因?yàn)楝F(xiàn)在O2O的時代,我們需要的是實(shí)時的大數(shù)據(jù),我們需要的是實(shí)時的能給客戶做出根據(jù)過去的行為和他現(xiàn)在所在的位置,來去給他做相關(guān)的一個推薦或者是一個推送,或者是指導(dǎo)這樣一個工作,所以在這個時代有很多新的大數(shù)據(jù)的技術(shù)產(chǎn)生。那么結(jié)合新的智能硬件,會產(chǎn)生一個完全和WEB2.0和SAM不同的時代,那么這個時代其實(shí)就是O2O的大數(shù)據(jù)時代。

所以我整體分析來看呢,不同的時代我們從這個消費(fèi)者的距離來看,原來最開始的這個ERP時代到WEB2.0到O2O這個時代。距離消費(fèi)者的數(shù)據(jù)是由遠(yuǎn)到近的,從數(shù)據(jù)的影響力來講,在過去只是給終端的領(lǐng)導(dǎo)決策層,現(xiàn)在時時融入到生活當(dāng)中。會發(fā)現(xiàn)數(shù)據(jù)對整個業(yè)務(wù)的影響比例由弱到強(qiáng),隨著技術(shù)的發(fā)展會給最終用戶一個全新完全不同的體驗(yàn)。

我給大家分享兩個我的個人畫像,這個畫像其實(shí)是在過去在某商業(yè)地產(chǎn)的時候給給我自己畫出來的那么其中一個畫線了,左側(cè)的藍(lán)色的那個畫像,其實(shí)是我自己一個人的一個線下的行為軌跡流。

其實(shí)它是通過我自己在廣場里面,在每一個這個門店的行走的軌跡來去捕捉我自己在線下的行為的情況??梢钥吹秸f我是經(jīng)常會去九毛九去吃飯,然后我在那邊會經(jīng)常看這個影城的一些電影,我會經(jīng)常去KTV。能看到這里面所有的這些這個小的字其實(shí)都是我過去在我線下的軌跡來給我個人畫出一個畫像。那么,這就是我剛才提到說在ITO和O2O時代每一個人其實(shí)優(yōu)過去的在WEB2.0的這種點(diǎn)擊流變成了我們現(xiàn)在線下的這種軌跡流了。

我們能把每一個人在這個廣場里面,這個所有的消費(fèi)的記錄,全部都找到,每條明細(xì)全部都能夠無論你是用是哪個商家的終端,那么通過的只能智能POSS我們?nèi)康榷寄馨涯愕南M(fèi)消費(fèi)的明細(xì),全部是是拿到云端。

拿到了這些數(shù)據(jù)和我們干什么呢,其實(shí)我在那個時候做了一個叫做場景引擎的東西。那就是一個類似一個虛擬的人陪你一起在逛這個萬達(dá)廣場,站在你進(jìn)入萬達(dá)廣場的那個時候,我會請一個實(shí)時的進(jìn)程去跟蹤你的狀態(tài)。你買的什么東西,走到哪里,然后給你推薦你想要的東西!比如我剛從一個電影從院線的電影在剛剛走出來,這個虛擬進(jìn)程會監(jiān)控到會看到你從電影院里走出來我會知道你是星巴克的一個愛好者,那么我其實(shí)在這個時候就可以給你這兩個優(yōu)惠券讓你去到星巴克去。

這樣其實(shí)更能夠根據(jù)你現(xiàn)在此時此刻此地,你現(xiàn)在的狀態(tài)和你過去的行為的一個偏好給你推一個優(yōu)惠這樣的話就能夠讓促成一筆新的交易,那這些東西其實(shí)是在新的IOT和O2O時代,那么其實(shí)是和WEB2.0時代是完全不同的。

那在這里了我再給大家分享一個現(xiàn)在新的時代下,我們和客戶為中心的這樣一個整體的一個大數(shù)據(jù)的一個閉環(huán),它會是什么樣的呢?

那么大家知道,剛才我提到在新的現(xiàn)在的IOT和O2O時代的來臨以后其實(shí)它的各種技術(shù)已經(jīng)發(fā)展到一個和過去的WEB2.0時代的大數(shù)據(jù)技術(shù)已經(jīng)完全有些不同了,那么它會體現(xiàn)在幾方面,一看的是剛才提到的智能硬件,那么第二個大家知道最近很多人都聽過深度學(xué)習(xí)這個概念。那么其實(shí)隨著深度學(xué)習(xí)和自然語言算法的更新,那么實(shí)現(xiàn)了一件什么事情呢,我們現(xiàn)在的電腦,它可以理解你說的一些話。所以當(dāng)這件事情發(fā)生的時候我們可以發(fā)現(xiàn)說,在整個目前的和用戶交互當(dāng)中所產(chǎn)生的無論是線上我們用戶的對話,還是線下用戶打的客戶熱線的內(nèi)容,其實(shí)我們都可以完全能夠理解他。

這樣的話其實(shí)在整個這個閉環(huán)里面大家可以看到從客戶對這個品牌的感知到他線下產(chǎn)品的選擇購買到使用到服務(wù)到創(chuàng)新,這一系列的這個過程其實(shí)在大數(shù)據(jù)的幫助下他都發(fā)生一些變化,那么分別大概跟大家講講。

比如說這個品牌感知,剛才我提到說這個自然語言和大數(shù)據(jù)能夠直接和他一起,你會發(fā)現(xiàn)過去的所有的這些用戶到底說了些什么?用戶在論壇上關(guān)注什么?過去其實(shí)是很難知道?,F(xiàn)在其實(shí)你對你這個品牌,用戶怎么去交互,她在網(wǎng)絡(luò)上的評論論壇怎么說,你很快的就能夠通過很容易的一種方式能跟你展現(xiàn)出來,那么在線下再做產(chǎn)品選擇剛才我提到Beacon、 Wi-Fi技術(shù),視頻技術(shù),其實(shí)完全可以能夠知道用戶在線上的這些產(chǎn)品,他究竟是怎么樣去選擇了,然后你完全能知道和競爭對手究竟是什么樣的區(qū)別。

在用戶購買的時候我們也能夠做到比較好的用戶購買的畫像,包括他的購買線上線下的購買的路徑。其實(shí)一切都可以完全在我們當(dāng)前的這個大數(shù)據(jù)的覆蓋了內(nèi)容里面,我們可以做相關(guān)的這個分析也可以給用戶做相關(guān)的推薦等等。

整個用戶怎么去使用你的這個產(chǎn)品,無論你是智能家具也好你是手環(huán)也好好。而在過去的時候可能還沒有這些東西大家都知道只是在互聯(lián)網(wǎng)上的網(wǎng)絡(luò)日志,現(xiàn)在通過新的這個智能設(shè)備和智能控制芯片的加入,他怎么去使用你的這些芯片怎么要去使用電腦,怎樣去使用空調(diào),廠家或者商家都可能拿到。

基于這些我們會直接能夠看到說,我們用戶的服務(wù)當(dāng)中會出現(xiàn)了哪些問題,他怎么樣去就跟你交互,哪些地方需要提高。也可以去做很多的這個業(yè)務(wù)的創(chuàng)新,比如說我們做一些用戶的分析,也許我們還可以做一些其他的這個數(shù)據(jù)變現(xiàn),這些全都是根據(jù)現(xiàn)在整體上面以用戶為中心來做,所以我經(jīng)常提一句話,我說DT會讓這個商業(yè)回歸本源,那本源是什么,其實(shí)這就是過去和這個用戶和商家做買賣的時候面對面的這樣的過程?,F(xiàn)在能夠讓企業(yè),無論多大,無論賣什么東西,通過DT的技術(shù)又可以重回到那個直接面向你最終用戶的這樣一個形態(tài)。

大數(shù)據(jù)平臺建立方案

前面的是跟大家聊了一下在新的O2O和IOT這個環(huán)境下我們大數(shù)據(jù)的一些新的技術(shù)和一些新的發(fā)展,那么下面的我跟大家聊聊這個創(chuàng)業(yè)企業(yè)的一些大數(shù)據(jù)里方案的一些討論。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號-6京公網(wǎng)安備 11010502049343號