三問大數(shù)據(jù) 尋覓正確答案

責(zé)任編輯:editor006

2013-12-27 17:54:23

來源:企業(yè)網(wǎng)D1Net

原創(chuàng)

如今,若論互聯(lián)網(wǎng)領(lǐng)域,誰最炙手可熱,非大數(shù)據(jù)莫屬,大數(shù)據(jù)真的很火,它的重要性也被廣泛認(rèn)可,那都有哪些細(xì)分領(lǐng)域在用實(shí)時(shí)大數(shù)據(jù)分析?大數(shù)據(jù)分析目前有哪些主流技術(shù)?大數(shù)據(jù)分析有什么挑戰(zhàn)?

《企業(yè)網(wǎng)D1Net》12月27日訊

如今,若論互聯(lián)網(wǎng)領(lǐng)域,誰最炙手可熱,非大數(shù)據(jù)莫屬,大數(shù)據(jù)真的很火,它的重要性也被廣泛認(rèn)可,那都有哪些細(xì)分領(lǐng)域在用實(shí)時(shí)大數(shù)據(jù)分析?大數(shù)據(jù)分析目前有哪些主流技術(shù)?大數(shù)據(jù)分析有什么挑戰(zhàn)?

大數(shù)據(jù)在各行業(yè)的機(jī)遇如下:金融證券(高頻交易、量化交易),電信業(yè)務(wù)(支撐系統(tǒng)、統(tǒng)一營帳、商業(yè)智能),能源(電廠電網(wǎng)監(jiān)控、用電信息采集分析),互聯(lián)網(wǎng)與電商(用戶行為分析、商品模型分析、信用分析),其他行業(yè)如智慧城市、物聯(lián)網(wǎng)。

經(jīng)典的案例:

智慧城市,一個(gè)城市,大概有十幾萬的攝像頭在城市里面,每秒都會發(fā)數(shù)據(jù)到云端的數(shù)據(jù)中心里面,每天有TB級別的數(shù)據(jù)需要處理,并且需要實(shí)時(shí)的反饋,這個(gè)場景需要實(shí)時(shí)處理的技術(shù)。

車聯(lián)網(wǎng),我們有一個(gè)客戶做車聯(lián)網(wǎng),他大概一個(gè)城市每臺電腦上,都要裝終端,這個(gè)終端每分鐘會發(fā)一個(gè)路況的信息發(fā)到云端,要發(fā)一億條數(shù)據(jù)到云端里面,并且是每分鐘進(jìn)行一些計(jì)算,實(shí)時(shí)的判斷路況,給用戶最好的行車建議。

金融證券,比如金融交易電話交易是一個(gè)主流的方向,我們?yōu)橐粋€(gè)證券的機(jī)構(gòu)構(gòu)建了一個(gè)非常大的云平臺,有幾百億條數(shù)據(jù)放在后臺里面,可以實(shí)時(shí)的提供數(shù)據(jù)的分析,數(shù)據(jù)的接口,讓他們快速的運(yùn)行。

電信,我們這邊在移動那邊有一個(gè)案例。我們在一個(gè)省里面,我們把一個(gè)省的所有上網(wǎng)的信息,都加載到我們的集權(quán)里面,我們的集權(quán)可以把一些統(tǒng)計(jì)反饋給他們,支撐他們一些業(yè)務(wù)的支撐系統(tǒng),還有商業(yè)技能,還有統(tǒng)計(jì)相關(guān)的。

能源,主要用于電廠電網(wǎng)的監(jiān)控,用電信息采集的分析。

電商,實(shí)時(shí)的推廣廣告給用戶,他們可以做商品模型的分析,把最好的產(chǎn)品推薦給用戶。比如說互聯(lián)網(wǎng)里面,有一個(gè)商品模型,還有信用分析。我有一個(gè)朋友是做信用分析的,在十幾秒鐘之內(nèi)把這個(gè)人的數(shù)據(jù)進(jìn)行一個(gè)分析,給用戶做一個(gè)評級,迅速的判斷這個(gè)用戶是不是值得放貸款給他。

為什么需要大數(shù)據(jù)實(shí)時(shí)的分析?

第一、實(shí)時(shí)的決策,量化交易,可以實(shí)時(shí)的計(jì)算數(shù)據(jù),迅速的判斷我是買股票還是不買。

第二、提高業(yè)務(wù)效率。

第三、對于到數(shù)據(jù),我們可以自由的嘗試一些新的算法,或者是新的策略。這樣通過實(shí)時(shí)的嘗試,我們可以快速發(fā)現(xiàn)新的觀點(diǎn)和機(jī)會。

第四、提供業(yè)務(wù)產(chǎn)出。

大數(shù)據(jù)的挑戰(zhàn)是什么呢?首先是要快:10秒以內(nèi),100毫秒為佳給出結(jié)果?;ヂ?lián)網(wǎng)公司,百度他們希望100毫秒給出結(jié)果。一些金融機(jī)構(gòu)他們希望微秒給出結(jié)果,需要實(shí)時(shí)的能力,

第一點(diǎn)就是快,就是實(shí)時(shí)的分析。

第二、就是大,針對的數(shù)據(jù)量,是10億每TB的級別。之前我們認(rèn)為數(shù)據(jù)超過1000萬不算大。我們現(xiàn)在碰到最大的集權(quán),大概是接近萬億條數(shù)據(jù)這樣的級別。

第三、可以做各種各樣的分析操作。最簡單的是查詢,也可以是邏輯復(fù)雜一些的算法和數(shù)據(jù)分析。

有哪些技術(shù)可以選擇?

第一個(gè)是hadoop。它本身是谷歌研發(fā)出來的,它是在大數(shù)據(jù)方面的算法,對于TB數(shù)據(jù),在大方面沒有問題,并且操作多樣化。因?yàn)樗暇€的工具有很多的算法都是非常不錯(cuò)的。但是它的快比較尷尬,他需要一分鐘以內(nèi)才可以,他很多要做一個(gè)reduce,需要很長的時(shí)間。

第二、NoSQL(非關(guān)系型的數(shù)據(jù)庫)。在大方面,應(yīng)該可以支撐大。Hbase可以滿足大的特點(diǎn),它可以做到一個(gè)大。Hbase底層是數(shù)據(jù)庫,只能支持簡單的查詢。Hbase很難做一些邏輯復(fù)雜的數(shù)據(jù)分析和挖掘。比如說淘寶那邊,他們可能比較有錢,他們用大量的硬件和大量的開發(fā)成本,有一套Hbase的數(shù)據(jù)開發(fā)集群。對于中小企業(yè),和傳統(tǒng)的企業(yè)是不的太適合用No SQL做分析的。它需要巨大的硬件成本和開發(fā)成本。傳統(tǒng)的數(shù)據(jù)庫甲骨文支持大數(shù)據(jù)的分析嗎?支持算法可以,但是天生對大的數(shù)據(jù)運(yùn)算比較吃力。

D1Net評論:

大數(shù)據(jù)時(shí)代下,發(fā)揮大數(shù)據(jù)價(jià)值的首要條件是完全了解大數(shù)據(jù),以上關(guān)于大數(shù)據(jù)的三大問題的回答,可以幫助我們?nèi)嬲J(rèn)識大數(shù)據(jù),在此基礎(chǔ)上,正確運(yùn)用大數(shù)據(jù),發(fā)揮大數(shù)據(jù)的應(yīng)有價(jià)值。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號-6京公網(wǎng)安備 11010502049343號