所謂大數(shù)據(jù)(Big data)或稱巨量資料、海量資料、大資料,是指所涉及資料“數(shù)量龐大”、“種類繁雜”及“增加飛快”的特性,無法透過人工在合理時間內(nèi)達(dá)到擷取、管理、處理、并整理成為人類所能解讀的資訊。
大數(shù)據(jù)與巨量資料分析(Big Data Analytics)均屬于以資訊科技領(lǐng)域軟硬體為基礎(chǔ)的應(yīng)用工具,這工具要發(fā)揮到效用需要將此工具結(jié)合到?jīng)Q策模型中,才能展現(xiàn)價值。
市場預(yù)測,2015年將是Big Data蓬勃發(fā)展的一年。但是目前處于探討大數(shù)據(jù)的機(jī)會,遠(yuǎn)多于投入實際使用。雖然每個人都知道需要做的事情與大數(shù)據(jù)息息相關(guān),但實際上很少人懂得如何運(yùn)用。甚至認(rèn)為,能有效硬體部署與管理分類網(wǎng)路資訊就足夠,反而忽略資料種類多樣性與更新快速也是大數(shù)據(jù)的挑戰(zhàn)。
大數(shù)據(jù)建立首重資料搜集,必須依據(jù)各產(chǎn)業(yè)特性,決定要搜集何種資料,才不會陷入資料漩渦中。巨量資料的成功關(guān)鍵在于非結(jié)構(gòu)化資料與快速流動資料清理過程需要新技術(shù)之導(dǎo)入,透過資料探勘與挖掘找出新規(guī)律,包括Hadoop及江河運(yùn)算(Streams Computing)成為巨量資料分析技術(shù)核心。
分享大數(shù)據(jù)之決策分析也不能完全依賴先進(jìn)技術(shù),數(shù)據(jù)品質(zhì)的關(guān)鍵在于資料建立者與使用者的良好溝通,資料品質(zhì)的責(zé)任應(yīng)該從資訊科技人員,轉(zhuǎn)移到需要資料正確而大量投資的經(jīng)理人身上。否則,將產(chǎn)生“Big Data Gets Little”的反效果。
物聯(lián)網(wǎng)是成為這場“數(shù)據(jù)變革”的最大驅(qū)動力。因為物聯(lián)網(wǎng)與各種行動裝置的出現(xiàn),迫使很多人思考而產(chǎn)生變化,進(jìn)而影響到對于這些數(shù)據(jù)的互動方式。愈來愈多不同傳感器、設(shè)備、或應(yīng)用程序產(chǎn)生出愈來愈多的數(shù)據(jù),一個事件會伴隨出更多樣化結(jié)構(gòu)數(shù)據(jù),從企業(yè)內(nèi)系統(tǒng)到外部數(shù)據(jù),都必須經(jīng)過清理整合才能轉(zhuǎn)化成有效情報進(jìn)行分析。
巨量資料投資沒有效果的最大原因,是在于多數(shù)公司未善用本來就有的資料。千萬不要以為花大錢投資精密的分析工具,就能培養(yǎng)出分析能力。首先必須學(xué)習(xí)如何使用核心營運(yùn)系統(tǒng)內(nèi)有的資料,必須先學(xué)會使用資料和分析,來支持營運(yùn)決策,才有可能從巨量資料受惠。
在結(jié)合巨量資料工具之決策模型方面,一、如何將巨量資料分析導(dǎo)入并整合傳統(tǒng)決策模式是關(guān)鍵,且這些決策問題需要針對不同類型之決策進(jìn)行處理。二、有巨量資料后,要如何將傳統(tǒng)資料與決策模型結(jié)合,才能發(fā)揮綜效。
根據(jù)證據(jù)做決策而非直覺來決定,是很困難的文化轉(zhuǎn)變,工作流程必須重新定義,資料必須篩選,還要訂定商業(yè)規(guī)則做為指引,建立決策模式后,最大好處就是競爭對手無法輕易模仿。
不論從決策模式與需求出發(fā),未來將出現(xiàn)不同類型的典型資料與巨量資料分析模型,并將發(fā)展出新興應(yīng)用與商機(jī)。因此,誰先累積核心Know-How或是關(guān)鍵技術(shù),將有機(jī)會成為新一代的巨量資料受益者或贏家。