大爆料:互聯(lián)網(wǎng)大數(shù)據(jù)處理中的隱秘事件

責任編輯:jcao

作者:曹建菊

2016-04-12 10:37:24

來源:企業(yè)網(wǎng)D1Net

原創(chuàng)

從來沒有在哪個沙龍,哪個論壇里聽到過這么多關(guān)于CIO對大數(shù)據(jù)探索的爆料。當然,我們并不是秘密的窺視者,只是希望將各種好的或者相對來講不那么成功的經(jīng)驗進行分享。(受嘉賓委托,過于勁爆或者涉及商業(yè)機密的內(nèi)容不在此呈現(xiàn)。)

從來沒有在哪個沙龍,哪個論壇里聽到過這么多關(guān)于CIO對大數(shù)據(jù)探索的爆料。當然,我們并不是秘密的窺視者,只是希望將各種好的或者相對來講不那么成功的經(jīng)驗進行分享。(受嘉賓委托,過于勁爆或者涉及商業(yè)機密的內(nèi)容不在此呈現(xiàn)。)

本期企業(yè)網(wǎng)D1Net采訪到的嘉賓包括:新毅金融CIO肖鵬、易觀智庫CTO郭煒,中國大數(shù)據(jù)專家龔才春博士,優(yōu)客工廠首席數(shù)據(jù)官、產(chǎn)品開發(fā)總監(jiān)、前百度大數(shù)據(jù)運營部創(chuàng)建者范宇,現(xiàn)京東技術(shù)學院院長呂建偉。他們將從自身經(jīng)驗出發(fā)告知我們,在大數(shù)據(jù)探索過程中所面臨的困難及部分解決辦法。

優(yōu)客工廠首席數(shù)據(jù)官范宇:數(shù)據(jù)是死的,我之前在某大型互聯(lián)網(wǎng)做了很多領(lǐng)域的探索,比如醫(yī)療,比如車聯(lián)網(wǎng),比如商業(yè)WIFI等等。在醫(yī)療行業(yè),當時我們把某醫(yī)院所有的檔案數(shù)據(jù)拿過來,發(fā)現(xiàn)根本沒有用,充其量只能做一個BI分析,告訴你犯哮喘病人的性別分布,一點預(yù)測能力都沒有,因為它的數(shù)據(jù)樣本太小了。但是,想要完全獲得這個樣本需要跟所有醫(yī)院合作,拿到至少60%以上的數(shù)據(jù)采集,這顯然不可能實現(xiàn)。

這家大型互聯(lián)網(wǎng)公司當時還花過大價錢買了微博的數(shù)據(jù),希望通過微博的數(shù)據(jù)打通與社交化的聯(lián)系,結(jié)果發(fā)現(xiàn)買過來之后,花了這么多錢的微博數(shù)據(jù)其打通率只在1.4%。還比如商業(yè)WIFI,各種咖啡館、餐館,雖然數(shù)據(jù)量非常大,但其獲得的數(shù)據(jù)卻非常零碎,而且各地局域網(wǎng)的接入方法不一樣,要打通這樣的數(shù)據(jù)也非常難,投入也相當之大。因此,互聯(lián)網(wǎng)公司的大數(shù)據(jù)探索其實走了很多彎路,唯一找到的比較好的切入點是智能電視OTT領(lǐng)域,打通非常容易, PC端打通率在50%左右,移動端打通率在75%,這樣才可以產(chǎn)生商業(yè)價值。

目前大數(shù)據(jù)的主要用途在營銷端,通過與移動端打通,就可以知道消費者看電視的行為方式,知道這個消費者平時在搜索什么,從而可以更好地在智能電視上推薦投放更多的廣告。

優(yōu)客工場是一家提供全要素、社區(qū)化的聯(lián)合辦公空間的創(chuàng)業(yè)公司,樓宇或者辦公室出租與住宅是不一樣的,首先商業(yè)寫字樓與住宅不一樣;第二、銷售與租賃也是兩回事,很難做到業(yè)務(wù)預(yù)測。比如消費者可能在夏天買一身羽絨服,因為反季購買比較便宜,但并不會因為冬天要去滑雪,但在夏天就提前租一個雪橇,因為一般都是在滑雪場現(xiàn)場租用,不會提前租。所以,優(yōu)客工場面臨的很大壓力就是在場地正式裝修好開業(yè)前提前出租,因為優(yōu)客工場做的是T0B市場,因此采取了一些精準手段,利用了百度的一些資源、人脈,花5萬塊錢購買了一個百度大數(shù)據(jù)營銷平臺的賬號,用關(guān)鍵詞看這些創(chuàng)業(yè)者、小微企業(yè)、企業(yè)主都關(guān)注些什么,從而精準優(yōu)客工場的辦公服務(wù)。另外,還通過SNS、旅游等線索進行精準線上營銷,以在前期就吸引到大量的客流。再具體就是商業(yè)機密了!

京東技術(shù)學院院長呂建偉:京東的廣告投放最主要在線下,京東也曾經(jīng)嘗試過數(shù)據(jù)互換和數(shù)據(jù)交易,但是發(fā)現(xiàn)這條路根本走不通。京東現(xiàn)在通過業(yè)務(wù)合作獲得數(shù)據(jù)流通,也就是純粹購買數(shù)據(jù)這條路是死的。京東的活躍用戶,也就是一個月在京東上做一次消費購買完成的活躍用戶是1.4億。京東在大數(shù)據(jù)精準方面還沒有到人工智能、神經(jīng)網(wǎng)絡(luò)、深度學習等程度。但使用了大量的統(tǒng)計方法,以及在搜索方面的精準搜索、精準推薦,通過給數(shù)據(jù)打標簽來實現(xiàn)。

中國大數(shù)據(jù)專家龔才春:中國大數(shù)據(jù)的首要問題是數(shù)據(jù)孤島問題,新浪微博每天有一億到兩億條博文發(fā)出來,即使新浪與淘寶可以實現(xiàn)賬號互通,其數(shù)據(jù)打通率也不超過10%。新浪曾探索過場景搜索,就是對人打標簽,給五億人打標簽,包括興趣,愛好,誰在發(fā)博文,博文的內(nèi)容,以及在什么地方什么時間發(fā)的博文等等。

很多企業(yè)都將大數(shù)據(jù)用于營銷,但我認為在互聯(lián)網(wǎng)行業(yè)不應(yīng)該這么理解,互聯(lián)網(wǎng)的每一個環(huán)節(jié)都可以用大數(shù)據(jù),而不僅僅是用作營銷。其正的大數(shù)據(jù)應(yīng)該做什么?比如福特,它的每臺發(fā)動機都可以檢測發(fā)動機的數(shù)據(jù),通過檢測發(fā)動機的數(shù)據(jù),就知道這個汽車大概什么時候會壞,能夠賣多少錢,應(yīng)該上多少錢的保險。所以,它跟金融,跟危機都可以聯(lián)系起來,不僅僅是營銷。

在人力資源行業(yè),大數(shù)據(jù)也可以得到很好的應(yīng)用,把一個合適的候選人推薦給一個合適的公司的一個合適的崗位,這是人力資源關(guān)注的事,但現(xiàn)在很少有招聘網(wǎng)站做得好,就是沒有大數(shù)據(jù),沒有畫像。大數(shù)據(jù)在人力資源領(lǐng)域的應(yīng)用,通過對所有人,所有公司,所有職位進行畫像,將一億多人的簡歷進行搜集畫像,最后實現(xiàn)大數(shù)據(jù)挖掘。未來應(yīng)該是什么公司什么時候招人,需要招什么樣的人,甚至應(yīng)聘者的簡歷哪部分是虛假的都可以識別出來,形成一個精準匹配。

易觀智庫CTO郭煒:做大數(shù)據(jù)第一件事不是先搞技術(shù),而是先懂政治。大數(shù)據(jù)平臺得先把數(shù)放進來,而這些數(shù)據(jù)可能會損害某些利益集團的利益。CIO需要借勢將背后的利益關(guān)系分析清楚,通過自己的影響力把大數(shù)據(jù)建立起來,數(shù)的來源需要政治的博弈才能達到。

第二, “數(shù)”可比作石油,原因在于大數(shù)據(jù)中可能有80%到90%的數(shù)據(jù)是沒用的,數(shù)據(jù)如何變現(xiàn)?從大數(shù)據(jù)的角度來講屬于后臺部門,而變現(xiàn)的則是產(chǎn)品部門和前端業(yè)務(wù)部門。

大數(shù)據(jù)變現(xiàn)目前來看有三種模式,一個是分析報告,一個是金融類的征信,另外就是營銷。

新毅金融CIO肖鵬:我沒做過大數(shù)據(jù)技術(shù),但是現(xiàn)在在用大數(shù)據(jù)的應(yīng)用,我們用的是反欺詐跟征信的結(jié)果,比如我要借款,通過我的平臺發(fā)起借款請求以后,就會把個人的一些信息傳遞到后臺的大數(shù)據(jù)平臺上。它產(chǎn)生了多個緯度的一些數(shù)據(jù),比如它有社交屬性的數(shù)據(jù),微博和微信、門戶網(wǎng)站等,以及不同場景下的消費記錄,甚至和社保的數(shù)據(jù)打通。當我們發(fā)送一個請求后,應(yīng)用會生成一個報告,從而提高效率及風險控制能力?,F(xiàn)在的互聯(lián)網(wǎng)金融應(yīng)包括三塊技術(shù):一是區(qū)塊鏈技術(shù),其次是大數(shù)據(jù)征信分析,最后是生物識別技術(shù),這三大技術(shù)未來將對金融產(chǎn)生革命性的影響。

現(xiàn)在的傳統(tǒng)銀行,為什么不能做小額信貸?因為它做一筆小額信貸的成本和做一筆幾百萬,上千萬的成本是一樣的,都是靠人工的方式來做。但通過區(qū)塊鏈技術(shù)在金融行業(yè)的應(yīng)用,區(qū)塊鏈是去中心化的,只要有消費,便會被記在這個記賬體系里,可實現(xiàn)有效的反欺詐。比如同一個人如果在很短期里面頻繁的借款,基本上這個人欺詐的可能性比較高。還可以根據(jù)他每個月的電話記錄,電商的購物頻度以及其它消費行為,根據(jù)上述畫像,便能預(yù)測其信用額度。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號-6京公網(wǎng)安備 11010502049343號