企業(yè)利用所有數(shù)據(jù)必須克服的五大挑戰(zhàn)

責任編輯:cres

作者:Joe Pasqua 譯者:HERO

2017-09-07 11:21:42

來源:企業(yè)網(wǎng)D1Net

原創(chuàng)

如今的組織知道他們需要充分有效地利用所有的數(shù)據(jù),這包括日益增長的通信數(shù)字化,以及從燈泡到智能手機的所有數(shù)據(jù)。

如今的組織知道他們需要充分有效地利用所有的數(shù)據(jù),這包括日益增長的通信數(shù)字化,以及從燈泡到智能手機的所有數(shù)據(jù)。他們也知道,必須捕獲各種各樣的數(shù)據(jù),以便通過能夠訪問的方式存儲數(shù)據(jù),并根據(jù)業(yè)務(wù)快速變化的需求查詢數(shù)據(jù)。他們也知道,他們無法忍受刻板的、預(yù)先安排好的模式。然而他們發(fā)現(xiàn),這說起來容易做起來難。
 
那么是什么妨礙了他們實施?有很多事情,而組織必須克服的五大挑戰(zhàn)是為了充分利用其數(shù)據(jù)以及合作伙伴的數(shù)據(jù)和其他外部數(shù)據(jù)源。
 
(1)無法使用多種數(shù)據(jù)類型和格式。如今的數(shù)據(jù)有各種格式,規(guī)模和形式,必須實時處理和分析。這包括不適合傳統(tǒng)關(guān)系數(shù)據(jù)庫系統(tǒng)的行和列的數(shù)據(jù)。更重要的是,這些不同的形式和類型的數(shù)據(jù)需要無縫地一起使用。豐富的結(jié)構(gòu)化數(shù)據(jù),圖形數(shù)據(jù),地理空間數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)可能都被視為單個查詢或事務(wù)。
 
(2)基于傳統(tǒng)系統(tǒng)的創(chuàng)新步伐緩慢。如今,技術(shù)和業(yè)務(wù)需求幾乎每天都在變化,組織需要進行創(chuàng)新,以保持競爭力和合規(guī)性。許多公司卻幾乎無法處理他們手頭上的數(shù)據(jù),更不用說未來會發(fā)生什么,例如物聯(lián)網(wǎng)生成的數(shù)據(jù)。在創(chuàng)新方面進行投資時,他們常常感到沮喪,因為他們需要處理擁有組織的大量數(shù)據(jù)資產(chǎn)的傳統(tǒng)系統(tǒng),這些系統(tǒng)將成為減緩其進展以及提高有效競爭能力的阻礙。
 
(3)企業(yè)數(shù)據(jù)倉庫的擴散。各種數(shù)據(jù)的快速增長和企業(yè)為客戶提供的服務(wù)數(shù)量的增長,在造成了企業(yè)中數(shù)據(jù)孤島的擴散。為了更好地服務(wù)于客戶、監(jiān)管者和他們自己,企業(yè)需要對客戶、產(chǎn)品等業(yè)務(wù)對象創(chuàng)建360度的視圖。但是,創(chuàng)建這種整體景觀是一項艱巨而耗資巨大的任務(wù)。一直以來,企業(yè)正在建立更多的數(shù)據(jù)孤島。更糟糕的是,數(shù)據(jù)質(zhì)量和這些觀點的治理常常是事后的結(jié)果,甚至會導(dǎo)致監(jiān)管處罰。
 
(4)ETL和模式優(yōu)先系統(tǒng)的使用。關(guān)系數(shù)據(jù)庫實際上是大多數(shù)組織中存儲數(shù)據(jù)的標準。一旦填充了關(guān)系模式,使用SQL進行查詢就很簡單。這聽起來不錯,但這是一個大問題,但是組織必須創(chuàng)建查詢將被發(fā)布的模式。整合所有現(xiàn)有的模式(可能是主機數(shù)據(jù)和文本內(nèi)容)需要在業(yè)務(wù)部門,主題專家和實施者之間進行大量的時間和協(xié)調(diào)。然后,一旦模型被各利益相關(guān)者最終確定,必須將數(shù)據(jù)從源系統(tǒng)中提取,轉(zhuǎn)化為適合新的模式,然后加載到新的稱之為ETL過程(即數(shù)據(jù)抽取、轉(zhuǎn)換、裝載的過程)。這些過程不需要太長時間(平均6-18個月)。而且,它永遠不會結(jié)束。數(shù)據(jù)源發(fā)生變化。添加新的來源。提出了不同的問題。ETL一直在接受,而不是給予。
 
(5)背景缺失。也許當今組織最大的問題是認為他們知道他們不知道的東西。沒有背景的數(shù)據(jù)是無用的。這些數(shù)據(jù)意味著什么?它與其他數(shù)據(jù)有什么關(guān)系?數(shù)據(jù)的出處是什么?在什么情況下,可以和誰分享?在大多數(shù)情況下,這些問題的答案不會在數(shù)據(jù)庫中捕獲。它可能在開發(fā)人員的頭腦中,或者設(shè)計文檔中,或者ETL腳本里,或者更糟糕的是在所有的這些地方中,但不是一致的。傳統(tǒng)數(shù)據(jù)庫并不側(cè)重于存儲,管理和查詢元數(shù)據(jù),而典型的ETL流程通常會將此信息丟棄在本地。放棄背景意味著放棄從數(shù)據(jù)中獲得的最大價值。
 
那么組織需要做什么呢?越來越多的組織轉(zhuǎn)向多模型數(shù)據(jù)庫。使用多模型數(shù)據(jù)庫,他們可以捕獲數(shù)據(jù)的背景并將其與數(shù)據(jù)進行存儲,從而提供最大的數(shù)據(jù)敏捷性和可審計性。并且在將來防范數(shù)據(jù)庫系統(tǒng)對任何新類型的數(shù)據(jù),轉(zhuǎn)移數(shù)據(jù)范例或監(jiān)管要求,不可避免地出現(xiàn)偏移。
 
考慮采用多模型數(shù)據(jù)庫平臺的公司應(yīng)該尋求:
 
•多結(jié)構(gòu)的本地存儲(結(jié)構(gòu)感知)
 
•按原樣加載數(shù)據(jù)的能力(在加載數(shù)據(jù)之前不需要模式)
 
•能夠有效地對這些不同的模型進行索引
 
•能夠無縫地使用所有模型,并進行組合
 
•企業(yè)級安全性和可用性
 
當然,數(shù)據(jù)庫技術(shù)的轉(zhuǎn)變并不輕松,許多IT專業(yè)人員在整個職業(yè)生涯只專注一種或幾種技術(shù)。 但是,如果組織有時間確保他們能夠有效地收集,分析和利用他們掌握的數(shù)據(jù)的話,那么現(xiàn)在正是時候。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號-6京公網(wǎng)安備 11010502049343號