但彬:大數(shù)據(jù) = 海量數(shù)據(jù) + 復(fù)雜類型的數(shù)據(jù)

責(zé)任編輯:hli

2012-03-06 16:24:18

來源:企業(yè)網(wǎng)D1Net

原創(chuàng)

但彬認(rèn)為:"大數(shù)據(jù)"包含了"海量數(shù)據(jù)"的含義,而且在內(nèi)容上超越了海量數(shù)據(jù),簡而言之,"大數(shù)據(jù)"是"海量數(shù)據(jù)"+復(fù)雜類型的數(shù)據(jù)。

Informatica中國區(qū)首席產(chǎn)品顧問但彬認(rèn)為:"大數(shù)據(jù)"包含了"海量數(shù)據(jù)"的含義,而且在內(nèi)容上超越了海量數(shù)據(jù),簡而言之,"大數(shù)據(jù)"是"海量數(shù)據(jù)"+復(fù)雜類型的數(shù)據(jù)。

但彬進(jìn)一步指出:大數(shù)據(jù)包括交易和交互數(shù)據(jù)集在內(nèi)的所有數(shù)據(jù)集,其規(guī)?;驈?fù)雜程度超出了常用技術(shù)按照合理的成本和時限捕捉、管理及處理這些數(shù)據(jù)集的能力。

Informatica中國區(qū)首席產(chǎn)品顧問但彬
Informatica中國區(qū)首席產(chǎn)品顧問但彬

大數(shù)據(jù)是由三項主要技術(shù)趨勢匯聚組成:

海量交易數(shù)據(jù):在從 ERP應(yīng)用程序到數(shù)據(jù)倉庫應(yīng)用程序的在線交易處理(OLTP)與分析系統(tǒng)中,傳統(tǒng)的關(guān)系數(shù)據(jù)以及非結(jié)構(gòu)化和半結(jié)構(gòu)化信息仍在繼續(xù)增長。隨著企業(yè)將更多的數(shù)據(jù)和業(yè)務(wù)流程移向公共和私有云,這一局面變得更加復(fù)雜。

海量交互數(shù)據(jù):這一新生力量由源于 Facebook、Twitter、LinkedIn 及其它來源的社交媒體數(shù)據(jù)構(gòu)成。它包括了呼叫詳細(xì)記錄(CDR)、設(shè)備和傳感器信息、GPS 和地理定位映射數(shù)據(jù)、通過管理文件傳輸(Manage File Transfer)協(xié)議傳送的海量圖像文件、Web 文本和點(diǎn)擊流數(shù)據(jù)、科學(xué)信息、電子郵件等等。

海量數(shù)據(jù)處理:大數(shù)據(jù)的涌現(xiàn)已經(jīng)催生出了設(shè)計用于數(shù)據(jù)密集型處理的架構(gòu),例如具有開放源碼、在商品硬件群中運(yùn)行的 Apache Hadoop。對于企業(yè)來說,難題在于以具備成本效益的方式快速可靠地從 Hadoop 中存取數(shù)據(jù)。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號-6京公網(wǎng)安備 11010502049343號