《企業(yè)網(wǎng)D1Net》1月30日訊(上海)你不可能在當(dāng)今的商業(yè)技術(shù)世界里沒有觸及過大數(shù)據(jù)的話題。
簡(jiǎn)單地講,大數(shù)據(jù)是大容量、高速率、多樣化的數(shù)據(jù)集,無法以傳統(tǒng)的數(shù)據(jù)庫工具管理。在 2011年,全球的數(shù)據(jù)量估計(jì)達(dá)到1.8 zettabytes(每個(gè)Zettabytes等于10億TB)。更令人咋舌的是這個(gè)已被廣泛引用的判斷——世界上90%的數(shù)據(jù)是在過去兩年內(nèi)創(chuàng)建。
當(dāng)然,呈現(xiàn)爆炸性增長(zhǎng)的數(shù)據(jù)背后,是非結(jié)構(gòu)化的數(shù)據(jù)世界。在去年的惠普探索會(huì)議上,英國分析軟件公司Autonomy首席執(zhí)行官(CEO)兼信息管理行政副總裁邁克-林奇(Mike Lynch)在談到非結(jié)構(gòu)化數(shù)據(jù)的巨大增長(zhǎng)時(shí)表示,IT世界正在遠(yuǎn)離結(jié)構(gòu)化、機(jī)器友好的信息(以行和列來管理),并朝著更加人性化、非結(jié)構(gòu)化的數(shù)據(jù)邁進(jìn),這些數(shù)據(jù)來自電子郵件和社交媒體,不只是包括文字和電話號(hào)碼,也包含視頻、音頻和圖像。
由于大數(shù)據(jù)的崛起,我相信你正聽到Apache Hadoop周圍的熙熙攘攘聲。這種免費(fèi)的軟件框架支持?jǐn)?shù)據(jù)密集型分布式應(yīng)用程序,讓應(yīng)用程序能夠與成千上萬的節(jié)點(diǎn)和PB級(jí)的數(shù)據(jù)(PB=一千萬億字節(jié))共事。它確實(shí)看起來是管理非結(jié)構(gòu)化數(shù)據(jù)的必殺技,因此也難怪每個(gè)人都隨大流。如果你進(jìn)行一個(gè)快速的網(wǎng)絡(luò)搜索,會(huì)發(fā)現(xiàn)在剛剛過去的幾個(gè)月中,包括EMC、微軟、IBM、甲骨文、Informatica、惠普、戴爾和Cloudera在內(nèi)的公司都采用了這種軟件框架。
而更值得注意的是,諸如雅虎、亞馬遜、comScore和AOL等公司都紛紛轉(zhuǎn)向Hadoop,以同時(shí)擴(kuò)大業(yè)務(wù)和降低存儲(chǔ)成本。
Infineta Systems是一家廣域網(wǎng)優(yōu)化初創(chuàng)公司,根據(jù)它的近期研究,傳統(tǒng)的數(shù)據(jù)存儲(chǔ)每GB消耗5美元,但使用Hadoop存儲(chǔ)的話,相同的數(shù)據(jù)每GB的成本是約25美分。
這是任何CEO都會(huì)記住的一個(gè)數(shù)字。
所以為2012 Hadoop之年做好準(zhǔn)備吧。企業(yè)網(wǎng)D1Net很希望聽到您在為解決大數(shù)據(jù)存儲(chǔ)做什么。在今年4月于北京召開的CCS云計(jì)算高峰論壇,企業(yè)網(wǎng)也將開辟大數(shù)據(jù)專場(chǎng)探討大數(shù)據(jù)的現(xiàn)狀與未來。(Vivian/文)