如今,大數(shù)據(jù)時代的到來,已經(jīng)成為不可阻擋的歷史潮流,不管你愿不愿意,大數(shù)據(jù)就在那里。
然而,究竟何為大數(shù)據(jù)?大數(shù)據(jù),英文名big data,又稱巨量資料,是指其數(shù)據(jù)規(guī)模極其巨大,以致很難通過一般軟件工具加以擷取、管理、處理并整理成為有用資訊的海量數(shù)據(jù)。按目前業(yè)界公認(rèn)說法,大數(shù)據(jù)特點有4個V:即,Volume(大量)、Velocity(高速)、Variety(多樣)、Value(價值)。日常工作生活中,切切實實感到“大數(shù)據(jù)”時代向我們步步“逼”來。
先說大量、高速。大量、高速到了什么程度?我們曉得,一個移動硬盤,容量大約為10個G。2001年,全球互聯(lián)網(wǎng)總流量大約為1EB,即10億個G。到了2004年,一個月流量即可達(dá)到1EB,而到了2007年,達(dá)到此流量時間是一周,到2013年,達(dá)到1EB的流量僅僅需要一天!換句話說,目前,全球互聯(lián)網(wǎng)一天產(chǎn)生的信息量,可以刻滿1.88億張DVD光盤!
再說多樣、價值。如此大量、高速的數(shù)據(jù),其多樣性毋庸置疑,小到某人與某人的數(shù)分鐘通話,大到某公司與某公司的一筆巨額交易,雖然全是些風(fēng)馬牛不相及的數(shù)字,但是,經(jīng)過科學(xué)的收集、歸類,整理,再加以分析、排列、組合,這些數(shù)字就會神奇地演變成全新的極其有用的各種資訊!原始數(shù)據(jù)越大,處理難度自然越大,但是,處理后其應(yīng)用價值亦越大。大數(shù)據(jù)這種無中生有、化腐朽為神奇的增值功能,既叫人稱奇,更令人神往!
大數(shù)據(jù)這塊餑餑,聞起來確實很香,但啃起來卻相當(dāng)堅硬。其難度主要有四,一是數(shù)據(jù)收集難。這么無邊無際的海量信息,多而且雜,萬千角度,如何下手?二是數(shù)據(jù)存儲難。海量存儲,既要求低成本、低能耗,又要求高質(zhì)量、高識別。三是數(shù)據(jù)處理難,信息如密網(wǎng)交織,錯綜復(fù)雜,處理如剝繭抽絲,穿針引線,其難度可想而知。四是數(shù)據(jù)呈現(xiàn)難,數(shù)據(jù)最終是要拿來使用的,所以,其呈現(xiàn)必須簡單、實用,無疑,這是又一個由繁入簡的艱巨工程。
好在,大數(shù)據(jù)應(yīng)用已經(jīng)初見曙光,歐美各國,均有成功先例,紛紛應(yīng)用于實踐并卓有成效。有人曾設(shè)想,倘若我們將大數(shù)據(jù)應(yīng)用于日常生活,那么,當(dāng)你在北京或者某一城市打算購買某一產(chǎn)品時,只消將名稱輸入手機,大數(shù)據(jù)立即就會告訴你,你所需要的這些東西,此時此刻,在當(dāng)?shù)啬男┥虉鲇惺?,其價格分別是多少。于是,你可以馬上作出決策……這將給人們帶來多么大的方便,又將給商業(yè)流通帶來多么大的改變!
萬事雖然起頭難,堅持動手就不難。所謂大數(shù)據(jù)之“大”,不過是相對而言,著手于小,小可積大。目前,百度、阿里、騰訊等不少互聯(lián)網(wǎng)公司,已成立大數(shù)據(jù)研發(fā)機構(gòu)??吹揭毁Y料,百度目前日處理數(shù)據(jù)量已達(dá)100PB,相當(dāng)于一個圖書館2700萬冊藏書!而阿里則根據(jù)淘寶網(wǎng)上中小企業(yè)的交易狀況,利用先天掌握的大數(shù)據(jù)篩選出財務(wù)健康及講誠信企業(yè),并對其發(fā)放無擔(dān)保貸款300多億元,其壞賬率僅0.3%,創(chuàng)造了金融業(yè)一個奇跡!這些都是大數(shù)據(jù)應(yīng)用的范例。讓我們張開雙臂,迎接大數(shù)據(jù)時代的來臨吧!
D1Net評論:
大數(shù)據(jù)時代的到來,不僅帶來巨大商業(yè)價值,也帶來巨大社會價值,不管是企業(yè)用戶,還是普通用戶,對大數(shù)據(jù)都十分青睞,隨著大數(shù)據(jù)這塊香餑餑啃起來很麻煩,但是,廣大用戶卻樂此不疲,因此,對于大數(shù)據(jù)時代的到來,任何人都沒有理由拒絕。