企業(yè)如何更好地制定大數(shù)據(jù)策略

責(zé)任編輯:一三

2014-04-09 08:40:35

摘自:36大數(shù)據(jù)

面向服務(wù)架構(gòu)、軟件即服務(wù)、云計(jì)算及其他現(xiàn)代化解決方案在協(xié)助企業(yè)實(shí)現(xiàn)大型應(yīng)用集成過程中都發(fā)揮了一定的作用。

大數(shù)據(jù)策略會失敗嗎?是時候該討論一下這個問題了。企業(yè)才剛剛掌握如何集成ERP(企業(yè)資源規(guī)劃)及其他業(yè)務(wù)應(yīng)用來消除業(yè)務(wù)流程中妨礙效率的孤島。面向服務(wù)架構(gòu)、軟件即服務(wù)、云計(jì)算及其他現(xiàn)代化解決方案在協(xié)助企業(yè)實(shí)現(xiàn)大型應(yīng)用集成過程中都發(fā)揮了一定的作用。但是如今,在大量數(shù)據(jù)的環(huán)境中組織正面臨新的一系列挑戰(zhàn)。更清楚地說,它不是一條數(shù)據(jù)流。它是由許多獨(dú)立的數(shù)據(jù)流組成的,使數(shù)據(jù)互相分離或者就像以前的企業(yè)應(yīng)用那樣將孤立起來。

這不是因循守舊

這些數(shù)據(jù)中有許多都不像那些企業(yè)用處理的數(shù)據(jù)那樣。在大規(guī)模結(jié)構(gòu)化數(shù)據(jù)環(huán)境中,數(shù)據(jù)激增所面臨的大部分挑戰(zhàn)都可以通過擴(kuò)展、冗余及分析而得到解決。大數(shù)據(jù)時代,以上這些挑戰(zhàn)僅僅是企業(yè)必須解決的小部分問題。如今收集到的數(shù)據(jù)類型來源非常廣泛。數(shù)據(jù)通過嵌入式傳感器、RFID芯片、箱子和音像供給、文檔和圖像文件、圖像等其他方式而傳輸?shù)綌?shù)據(jù)庫中。社交媒體會改變數(shù)據(jù)應(yīng)有的形象。這還不包括業(yè)務(wù)伙伴之間所共享過的大數(shù)據(jù)。

組織不再描述或者規(guī)定數(shù)據(jù)所要展現(xiàn)的形式。實(shí)際上,如果嘗試這樣做,會大大地降低數(shù)據(jù)本身的價值。企業(yè)僅能預(yù)測一定數(shù)量的潛在情節(jié)或者反應(yīng)。無論他們創(chuàng)建了多少復(fù)選框或者數(shù)據(jù)文件,總會有數(shù)據(jù)溢出的現(xiàn)象。從競爭的角度來說,忽視那些非傳統(tǒng)數(shù)據(jù)的后果是極具破壞性的。最近麥肯錫全球研究院進(jìn)行了一項(xiàng)研究,題目為:大數(shù)據(jù)是創(chuàng)新、競爭、生產(chǎn)率領(lǐng)域的下一個研究方向,研究表明如果企業(yè)未能充分利用現(xiàn)有的數(shù)據(jù),那么該企業(yè)將虧損數(shù)千億美元。

關(guān)系數(shù)據(jù)庫僅能提供部分解決方法

由于數(shù)據(jù)量大而且種類不同,因此采用工具和技術(shù)管理非結(jié)構(gòu)化數(shù)據(jù)就變得非常困難。非關(guān)系型NoSQL、XML以及關(guān)鍵/數(shù)值數(shù)據(jù)存儲都可以協(xié)助企業(yè)解決多數(shù)大數(shù)據(jù)的可伸縮性和可訪問性問題。例如Hadoop這樣的解決方案使用MapReduce及Hive Query Language,為企業(yè)提供管理大數(shù)據(jù)的一個起點(diǎn),并獲取商業(yè)情報(bào)。如MongoDB和Cassandra這樣的NoSQL數(shù)據(jù)庫管理系統(tǒng)已經(jīng)實(shí)現(xiàn)Hadoop集成,使客戶獲得至少一個客戶端接口或者覆蓋連接不同的數(shù)據(jù)流變得更加容易一些。

如今數(shù)據(jù)本身在企業(yè)中變得更加靈活。并行流程及智能數(shù)據(jù)將JitterBit這樣的工具分塊應(yīng)用,將其設(shè)計(jì)成允許數(shù)據(jù)從一個應(yīng)用程序傳輸?shù)较乱粋€應(yīng)用程序,并保證傳輸?shù)臄?shù)據(jù)質(zhì)量。這種通過數(shù)據(jù)類型及應(yīng)用進(jìn)行的集成對于時間敏感的企業(yè)活動來說非常重要,這些活動中也會涉及即時分析。一般地,這種形式的分析必須查詢當(dāng)前數(shù)據(jù)和歷史數(shù)據(jù),來識別新趨勢。這就是SQL經(jīng)常再次發(fā)揮作用的原因。

SQL、NoSQL以及大數(shù)據(jù)技術(shù)

新型數(shù)據(jù)的來臨并不是否定過去幾十年精心收集并整理出來的業(yè)務(wù)數(shù)據(jù)。SQL數(shù)據(jù)存儲中的內(nèi)部企業(yè)數(shù)據(jù)可以解釋大數(shù)據(jù)與其他數(shù)據(jù)在精確性及相關(guān)性之間的差異。多數(shù)組織發(fā)現(xiàn)他們?nèi)匀恍枰獮榱似髽I(yè)數(shù)據(jù)而保持SQL結(jié)構(gòu),來支持企業(yè)最佳業(yè)務(wù)實(shí)踐。將一切數(shù)據(jù)變?yōu)榉墙Y(jié)構(gòu)化格式并不是集成,這僅僅是趨同化處理。與此同時,試圖迫使結(jié)構(gòu)化數(shù)據(jù)向非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)變也都是白費(fèi)力氣的努力。

從企業(yè)角度來說,集成的目標(biāo)并不是關(guān)注數(shù)據(jù)結(jié)構(gòu)化而是關(guān)注組織化。像新型Oracle Data Integrator這樣的工具試圖通過加載和轉(zhuǎn)換數(shù)據(jù)的Hadoop來尋找平衡點(diǎn),所以,結(jié)合傳統(tǒng)企業(yè)數(shù)據(jù)就更容易進(jìn)行分析。分析流程中,這種方法使得來自多種信息源及存儲中的數(shù)據(jù)相融合,此時就更需要數(shù)據(jù)集成。這種折中的方法使得原始數(shù)據(jù)比最初的狀態(tài)更加自由,維持這種隱含價值可能更適合于未來分析的新方法。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號-6京公網(wǎng)安備 11010502049343號