大數據和分析法學的挑戰(zhàn):數據聚積和偏好

責任編輯:vivian

2012-06-11 09:03:38

摘自:TechTarget中國

撇開炒作,利用大數據和分析法將會對企業(yè)未來業(yè)績產生重大影響,重整整個行業(yè)并孕育新的產業(yè)。

撇開炒作,利用大數據和分析法將會對企業(yè)未來業(yè)績產生重大影響,重整整個行業(yè)并孕育新的產業(yè)。然而,還面臨著很多挑戰(zhàn)。它們從眾所周知的缺乏數據科學人員來處理大數據,到更加棘手且很少提及的根源于人性的問題。

后者之一是人類聚積數據的傾向。另一個是人類仍然固守先入為主的傾向,即使數據結果明顯不同。最近舉辦的麻省理工斯隆學院CIO研討會就大數據和分析法發(fā)言的數據專家們取得了共識。發(fā)現地雷?希望落空?那些已經取得進展的企業(yè)已經知道,大數據和分析法沒有最終真理。迭代就是全部,專家們也同意。

不僅如此,除了迭代的價值, CIO們可以將最佳實踐拋于腦后。正在興起的未來實踐才是深入研究大數據的公司最可以依靠的, 在舊金山工作的計算機科學家Michael Chui說。他是麥肯錫全球研究院高級研究員,該研究院是位于紐約的麥肯錫咨詢公司的研究機構。

“我們知道這不可行:等到5年后完美的數據倉庫出現。”Chui說,他是去年重大麥肯錫大數據價值報告的作者。

相對地看待數據質量

Chui說,事實上,沉迷于數據質量是很多公司需要克服的第一個障礙,如果他們希望有效的使用大數據。數據的精確性對銀行財務報告是至關重要的。然而,不精確的數據包含了模式可以突出業(yè)務問題或者提供可以產生重要價值的洞察力,比如另一個研討會專家小組的相關新聞報道的,“抓住大數據和分析法,否則將落伍,MIT專家小組稱”

專門小組成員Shvetank Shah說,相對那些快馬加鞭以取得最佳質量數據的組織,那些“了解數據質量”的組織,即使使用元標簽或顏色編碼來標識數據質量—,對大數據的進展更快。他是華盛頓特區(qū)的咨詢公司(CEB)的執(zhí)行董事,一家位于。

Shah提醒道,然而大數據結構的混亂性使得商業(yè)才智至關重要:重視經理了解何時值得去追求這些數據的能力。他說:“你雇傭經理的原因就是:去分析,去聯系和迭代。”

在科學研究中,理解每一個變量的所有情況是不可能的,所以“迭代很重要”James Noga說。他是波士頓的醫(yī)療保健非營利性組織Partners HealthCare System的CIO. 他說,那些擅長大數據處理的人必須能夠挑選出有代表性的關鍵點,并且“在當時作出最好的推測”。

不管怎樣這一點可以被推而廣之,不僅是在關注數據質量的公司,而且那些習慣于結構化IT流程的IT公司中也可以推廣。

消除舊觀念和成見不易

專家組成員說,那些擁有模式識別技能、好奇心,并理解實驗價值的人是有效使用大數據和分析法的關鍵。然而,CEB的Shah發(fā)現,使科學方法成為公司文化的一部分極其困難。“你可以讓所有聰明的數據分析專家聚集在企業(yè)核心,做出很多聰明的決定。但是如果做不到這樣的話,客服代表、經理們以及其它外圍人員做出的決定就更加重要。”因為大多數公司沒辦法雇傭足夠的數據科學人員去研究大數據,另一個挑戰(zhàn)是尋找培訓人才。

CEB發(fā)現很少公司能夠使用大數據和分析法法去驅動業(yè)務決策。最新對近500家企業(yè)的研究發(fā)現,20%的調查對象使用直覺做決定;49%想要更多數據,另有38%被CEB稱為”知情的懷疑論者”,也就是那些可以進行模糊數據,并推動業(yè)務向前發(fā)展。不僅如此,Shah說,人們傾向于堅持成見,“技術數據顯示的恰恰相反”。“消除成見非常困難。”

聚積數據是另一個開發(fā)大數據的障礙。麥肯錫研究的一個發(fā)現是金融服務(其收集和分析數據的歷史悠久)在使用大數據上滯后。Chui說:“我們發(fā)現很多西方銀行的業(yè)務豎井的界限已經變得如此之大,以至于分享數據的想法非常,非常之弱。”

鏈接已復制,快去分享吧

企業(yè)網版權所有?2010-2024 京ICP備09108050號-6京公網安備 11010502049343號