隨著大數(shù)據(jù)概念深入人心,越來越多的企業(yè)開始認(rèn)可數(shù)據(jù)存在價(jià)值。挖掘自身數(shù)據(jù)價(jià)值、獲取外部數(shù)據(jù)是企業(yè)兩大需求。但在實(shí)踐中,企業(yè)發(fā)現(xiàn)兩大需求存在同樣問題,不論是自身數(shù)據(jù)還是外部數(shù)據(jù),原始數(shù)據(jù)與有價(jià)值數(shù)據(jù)之間存在鴻溝,自身缺乏填平鴻溝的技術(shù)手段。
新興大數(shù)據(jù)公司成為解決問題的答案,他們具備處理數(shù)據(jù)的經(jīng)驗(yàn)和技術(shù),可以將原始數(shù)據(jù)轉(zhuǎn)化成能為業(yè)務(wù)提供支持的數(shù)據(jù)。數(shù)據(jù)服務(wù)產(chǎn)業(yè)鏈就此形成。
整個(gè)數(shù)據(jù)服務(wù)產(chǎn)業(yè)鏈可以分為三個(gè)部分,從上游的數(shù)據(jù)源到中游的數(shù)據(jù)服務(wù)商,再到下游的企業(yè)級(jí)用戶。因?yàn)榇髷?shù)據(jù)公司大多成立時(shí)間較短,自身業(yè)務(wù)產(chǎn)生數(shù)據(jù)有限,一般是作為數(shù)據(jù)源和企業(yè)級(jí)用戶的橋梁,處于整個(gè)產(chǎn)業(yè)中游。做數(shù)據(jù)加工和數(shù)據(jù)應(yīng)用,挖掘原始數(shù)據(jù)的價(jià)值,為企業(yè)業(yè)務(wù)提供數(shù)據(jù)支持。
在整個(gè)大數(shù)據(jù)產(chǎn)業(yè)生態(tài)中,數(shù)據(jù)服務(wù)是生態(tài)中重要一環(huán),下接底層技術(shù)平臺(tái),上接頂層應(yīng)用。
數(shù)據(jù)源眾多,有價(jià)值數(shù)據(jù)源在巨頭手中
政府的數(shù)據(jù)大部分還尚未被挖掘,目前應(yīng)用比較多的是公安數(shù)據(jù),明略數(shù)據(jù)、中奧科技等公司在與公安合作,挖掘數(shù)據(jù)價(jià)值。其他政府機(jī)關(guān)的數(shù)據(jù)多數(shù)還處于沉睡階段,九次方等公司正與地方政府合作,推進(jìn)政府機(jī)關(guān)大數(shù)據(jù)發(fā)展。
傳統(tǒng)企業(yè)的數(shù)據(jù)應(yīng)用程度與該行業(yè)的信息化程度有關(guān),像金融、電信等行業(yè)信息化程度較高,其數(shù)據(jù)源價(jià)值很大。像醫(yī)療、制造業(yè)等行業(yè)的企業(yè)內(nèi)部數(shù)據(jù)庫尚未實(shí)現(xiàn)互聯(lián),大數(shù)據(jù)尚處于起步階段。這點(diǎn)可以從大數(shù)據(jù)公司重點(diǎn)涉足的行業(yè)看出,多數(shù)大數(shù)據(jù)公司選擇將銀行、運(yùn)營商作為切入點(diǎn),醫(yī)療、工業(yè)大數(shù)據(jù)公司相對較少,而且體量較小。
互聯(lián)網(wǎng)數(shù)據(jù)乍一看是開放程度最高,應(yīng)用范圍最廣的數(shù)據(jù)源,但實(shí)際上互聯(lián)網(wǎng)數(shù)據(jù)中最具價(jià)值的部分都被BAT等互聯(lián)網(wǎng)巨頭所擁有,目前幾乎不對外開放。通過爬蟲等方式獲取的數(shù)據(jù)價(jià)值非常有限。不過隨著移動(dòng)互聯(lián)網(wǎng)興起,移動(dòng)設(shè)備承載的用戶行為數(shù)據(jù)價(jià)值被挖掘出來。
目前來看,最有價(jià)值的數(shù)據(jù)源是政府、運(yùn)營商和BAT,BAT的數(shù)據(jù)完全不開放,政府的數(shù)據(jù)同樣開放程度有限,而運(yùn)營商的數(shù)據(jù)開放程度最高,有十幾家大數(shù)據(jù)公司與運(yùn)營商合作,可以接觸到運(yùn)營商的數(shù)據(jù)。
大數(shù)據(jù)公司承上啟下
數(shù)據(jù)加工是指將數(shù)據(jù)源的數(shù)據(jù)進(jìn)行清洗、整理,而數(shù)據(jù)應(yīng)用是將清洗后的數(shù)據(jù)賦予行業(yè)屬性,使其能直接為下游客戶提供幫助。
目前,數(shù)據(jù)堂、聚合數(shù)據(jù)等公司專注于數(shù)據(jù)加工,而TalkingData、集奧聚合等公司同時(shí)在做數(shù)據(jù)加工和數(shù)據(jù)應(yīng)用。
數(shù)據(jù)堂、聚合數(shù)據(jù)的業(yè)務(wù)比較類似,他們將不同渠道的數(shù)據(jù)進(jìn)行清洗、整理,將數(shù)據(jù)進(jìn)行分類,做成標(biāo)準(zhǔn)化API接口,提供給做數(shù)據(jù)應(yīng)用的公司,一般來說,他們并不直接面對企業(yè)級(jí)客戶。工作有點(diǎn)類似于將小麥加工成面粉,做面包的工作交給下一層公司去完成。
TalkingData、集奧聚合不僅僅做數(shù)據(jù)加工,還在探索數(shù)據(jù)的場景應(yīng)用。他們直接服務(wù)企業(yè)級(jí)客戶,他們在處理數(shù)據(jù)的過程中就需要考慮客戶的需求,從場景應(yīng)用層面考慮數(shù)據(jù)挖掘和數(shù)據(jù)分析。工作是將小麥加工成適合做面包的面粉,同時(shí)做面包。
上述兩類公司的區(qū)別是,數(shù)據(jù)堂、聚合數(shù)據(jù)的業(yè)務(wù)更貼近數(shù)據(jù)源,而TalkingData、集奧聚合的業(yè)務(wù)更貼近企業(yè)級(jí)用戶。
大數(shù)據(jù)交易中心如雨后春筍般出現(xiàn)
提供數(shù)據(jù)服務(wù)的,除了大數(shù)據(jù)公司外,大數(shù)據(jù)交易所也扮演重要角色。自2015年4月貴陽大數(shù)據(jù)交易所成立,各地大數(shù)據(jù)交易中心如雨后春筍般冒出。短短一年時(shí)間,就出現(xiàn)了長江大數(shù)據(jù)交易中心、華中大數(shù)據(jù)交易中心、上海大數(shù)據(jù)交易中心、浙江大數(shù)據(jù)交易中心等近十家交易中心。
交易中心要么是地方政府與大數(shù)據(jù)公司合作成立,如貴陽大數(shù)據(jù)交易所,要么是由上市公司牽頭建立,如浙江大數(shù)據(jù)交易中心。從目前來看,大數(shù)據(jù)交易中心還處于探索階段,數(shù)據(jù)交易量不大。截至今年8月,成立一年的貴陽大數(shù)據(jù)交易所的交易總額剛剛突破1億元。
數(shù)據(jù)特點(diǎn)決定數(shù)據(jù)是非標(biāo)商品,交易存在信息不對稱現(xiàn)象
經(jīng)過幾年發(fā)展,大數(shù)據(jù)不再僅僅是概念,開始逐步落地。大家不再迷信數(shù)據(jù),對數(shù)據(jù)的看法開始回歸理性。愛分析認(rèn)為數(shù)據(jù)具備以下幾個(gè)特點(diǎn):
一. 絕大部分?jǐn)?shù)據(jù)價(jià)值有限。
無論是政府、傳統(tǒng)企業(yè)還是互聯(lián)網(wǎng),每天都在產(chǎn)生TB級(jí)、甚至PB級(jí)的數(shù)據(jù)。這其中大部分?jǐn)?shù)據(jù)對企業(yè)級(jí)用戶而言,是沒有價(jià)值的,或者說價(jià)值有限的,真正能為企業(yè)提供幫助的數(shù)據(jù)是極小一部分。
每個(gè)人都知道數(shù)據(jù)源越多,數(shù)據(jù)維度越廣,數(shù)據(jù)對業(yè)務(wù)的提升越大。但在實(shí)際應(yīng)用中,還是需要摒棄掉大部分?jǐn)?shù)據(jù),集中研究很小規(guī)模的數(shù)據(jù)。一方面,盡管Hadoop、Spark等開源技術(shù)已經(jīng)大大降低了數(shù)據(jù)存儲(chǔ)、處理的成本,但面對海量數(shù)據(jù),仍然有些力不從心;另一方面,大數(shù)據(jù)在各行業(yè)的應(yīng)用尚處于探索階段,很多數(shù)據(jù)的場景應(yīng)用尚未被發(fā)掘。
上述兩個(gè)原因使得絕大部分?jǐn)?shù)據(jù)價(jià)值有限,這導(dǎo)致數(shù)據(jù)存在一定聚合效應(yīng),有價(jià)值的數(shù)據(jù)源集中在幾個(gè)行業(yè),甚至是幾個(gè)公司。
二. 數(shù)據(jù)與場景應(yīng)用相結(jié)合才有價(jià)值。
經(jīng)濟(jì)下行,業(yè)績不樂觀,企業(yè)變得越來越務(wù)實(shí)。像前十年大量購買IT設(shè)備那樣在大數(shù)據(jù)投入是不可能的,企業(yè)更加關(guān)心數(shù)據(jù)能帶來什么價(jià)值。直接把數(shù)據(jù)給企業(yè)是沒有用的,需要將數(shù)據(jù)與企業(yè)的業(yè)務(wù)場景結(jié)合起來,使企業(yè)真正看到這些數(shù)據(jù)能為其帶來什么,這才是數(shù)據(jù)的價(jià)值。
從這個(gè)角度來看,脫離應(yīng)用場景空談數(shù)據(jù)價(jià)值是沒有意義的。與場景結(jié)合的越緊密,數(shù)據(jù)價(jià)值越大,企業(yè)級(jí)用戶付費(fèi)意愿越強(qiáng)烈。
三. 數(shù)據(jù)具有時(shí)效性,越久遠(yuǎn)的數(shù)據(jù)價(jià)值越低。
很多人將數(shù)據(jù)比喻為石油,兩者的確有很多相像之處。但是數(shù)據(jù)與石油有一個(gè)非常大的區(qū)別,數(shù)據(jù)具有時(shí)效性。只要保存得當(dāng),一年前的石油和剛開采的沒有本質(zhì)區(qū)別,而一年前的數(shù)據(jù)價(jià)值遠(yuǎn)低于最新數(shù)據(jù)。
以精準(zhǔn)營銷為例,通過數(shù)據(jù)挖掘找到用戶感興趣的產(chǎn)品,過段時(shí)間很可能用戶已經(jīng)購買該產(chǎn)品。這時(shí),原有數(shù)據(jù)已經(jīng)失效,用戶畫像發(fā)生變化,需要對最新的數(shù)據(jù)進(jìn)行分析,找到新的需求點(diǎn)。
因?yàn)樯鲜鋈齻€(gè)特點(diǎn),數(shù)據(jù)是非標(biāo)準(zhǔn)化商品。如果雙方僅限于數(shù)據(jù)交易,沒有更加深層次的合作,數(shù)據(jù)就脫離應(yīng)用場景而存在,如何進(jìn)行定價(jià)是最大問題,如前文所述,數(shù)據(jù)只有在應(yīng)用過程中才能發(fā)現(xiàn)其價(jià)值。
除以之外,不同數(shù)據(jù)對更新速度依賴程度是不一樣的,在各場景應(yīng)用上數(shù)據(jù)時(shí)效性也有很大差別。因此,在判斷數(shù)據(jù)價(jià)值上,時(shí)效性對數(shù)據(jù)價(jià)值影響有多大是難以估量的。
另一方面,數(shù)據(jù)交易過程中存在信息不對稱的現(xiàn)象。數(shù)據(jù)買方如果不實(shí)際使用數(shù)據(jù)是無法判斷買到的數(shù)據(jù)是否為真正有效數(shù)據(jù),現(xiàn)實(shí)與想象中有多大差別是不確定的。另一方面,買方很難用一種簡單方式去判斷獲得的數(shù)據(jù)是否為最新數(shù)據(jù),同樣需要在應(yīng)用過程中去鑒別。
目前數(shù)據(jù)在各行業(yè)的應(yīng)用還處于探索階段,隨著行業(yè)發(fā)展,數(shù)據(jù)在各行業(yè)應(yīng)用成熟,數(shù)據(jù)能帶來多大價(jià)值會(huì)逐漸達(dá)成共識(shí),數(shù)據(jù)將逐漸成為標(biāo)準(zhǔn)化商品,交易過程中的信息不對稱將大大降低。
在實(shí)際操作上,很多有價(jià)值的數(shù)據(jù)源都是敏感數(shù)據(jù),如何進(jìn)行脫敏處理,如何實(shí)現(xiàn)交易是另外一個(gè)大問題。針對這樣的問題,目前大數(shù)據(jù)公司采取的方式是將自身的算法架設(shè)在數(shù)據(jù)源的機(jī)房,通過原始數(shù)據(jù)提煉出數(shù)據(jù)標(biāo)簽,完成數(shù)據(jù)加工的工作,像數(shù)據(jù)堂、TalkingData、集奧聚合都采用這類方式。
大數(shù)據(jù)交易中心還得靠政府
大數(shù)據(jù)交易中心不僅僅是作為民間數(shù)據(jù)交易的橋梁,更是作為政府?dāng)?shù)據(jù)開放的橋頭堡。目前來看,政府?dāng)?shù)據(jù)的開放存在政策問題。盡管國家近年頻頻出臺(tái)大數(shù)據(jù)相關(guān)政策,但是中央關(guān)于政府機(jī)關(guān)數(shù)據(jù)開放的具體管理辦法還未公布,地方政府對開放數(shù)據(jù)存在疑慮,做法非常謹(jǐn)慎。
如果大數(shù)據(jù)交易中心僅僅交易一些民間數(shù)據(jù),交易所的作用相對有限。正如前文所言,大部分?jǐn)?shù)據(jù)價(jià)值有限,數(shù)據(jù)源相對比較集中,數(shù)據(jù)買方可以直接與數(shù)據(jù)源進(jìn)行合作,無需通過交易所這個(gè)平臺(tái)實(shí)現(xiàn)。
近期,貴州政府制定發(fā)布《政府?dāng)?shù)據(jù) 數(shù)據(jù)分類分級(jí)指南》等4項(xiàng)政府?dāng)?shù)據(jù)系列地方標(biāo)準(zhǔn)。這說明一些地方政府已經(jīng)開始在政府?dāng)?shù)據(jù)開放上進(jìn)行嘗試,相信國家層面的相關(guān)政策為時(shí)不遠(yuǎn)。
數(shù)據(jù)與應(yīng)用結(jié)合當(dāng)前發(fā)展最佳
隨著技術(shù)發(fā)展,數(shù)據(jù)加工會(huì)更趨于標(biāo)準(zhǔn)化加工流程,同業(yè)比拼的不僅僅是技術(shù)實(shí)力,對接的數(shù)據(jù)源數(shù)目和質(zhì)量更為重要。目前這一領(lǐng)域還屬于早期圈地階段,很多行業(yè)的數(shù)據(jù)還未被有效存儲(chǔ)、采集,未來隨著各行業(yè)信息化成熟,高質(zhì)量數(shù)據(jù)源是最核心競爭力。這個(gè)領(lǐng)域會(huì)逐步淘汰小公司,最終剩下幾個(gè)大公司,新公司進(jìn)入門檻越來越高。
這領(lǐng)域先發(fā)優(yōu)勢比較明顯,越早進(jìn)入市場,越容易對接更多的數(shù)據(jù)源。很多掌握數(shù)據(jù)源的企業(yè)最初是不清楚自身數(shù)據(jù)源價(jià)值,因此早期獲取數(shù)據(jù)源成本相對較低。數(shù)據(jù)堂深耕這一領(lǐng)域五年時(shí)間,現(xiàn)在是這一領(lǐng)域最大公司,數(shù)據(jù)源通過眾包、行業(yè)、政府及互聯(lián)網(wǎng)四個(gè)維度進(jìn)行獲取,與同業(yè)公司相比優(yōu)勢明顯。
數(shù)據(jù)應(yīng)用領(lǐng)域發(fā)展前景更好,這些公司的優(yōu)勢不僅僅是技術(shù)和數(shù)據(jù)源,還有對數(shù)據(jù)基于場景應(yīng)用的理解,各家公司為企業(yè)級(jí)用戶提供的服務(wù)具有差異性,市場競爭相對良性。另一方面,數(shù)據(jù)應(yīng)用市場規(guī)模前景巨大,目前僅僅是冰山一角。以銀行客戶為例,目前大數(shù)據(jù)公司為銀行提供的主要是風(fēng)險(xiǎn)控制、精準(zhǔn)營銷等對外業(yè)務(wù)層面,未來還會(huì)涉及到銀行客戶的內(nèi)部運(yùn)營效率提升等方面。市場規(guī)模大、業(yè)務(wù)差異化大,使得各個(gè)垂直行業(yè)中都會(huì)產(chǎn)生巨頭公司。
從目前行業(yè)發(fā)展來看,數(shù)據(jù)應(yīng)用領(lǐng)域的公司增速更快、體量更大,TalkingData、集奧聚合估值都超過30億。這兩家公司都是選擇以金融、地產(chǎn)作為切入點(diǎn)。金融、地產(chǎn)行業(yè)一方面公司自身信息化程度高,對數(shù)據(jù)非常重視,另一方面大型企業(yè)居多,付費(fèi)能力強(qiáng)。