要實現(xiàn)大數(shù)據(jù)分析項目的最佳實踐并非易事。正因如此,Gartner研究總監(jiān)Svetlana Sicular題為“大數(shù)據(jù)7大失敗案例”的報告吸引了思科工程師Karen Liu的注意。
“我們正處于開始階段,想了解下其他人正在做什么,有哪些成功案例。”Liu說:“而所有的失敗案例,也是我們必須學習并加以警惕的。”
很多人有著和Liu一樣的想法。Family Dollar Stores Inc.(美國知名折扣零售商,總部位于北卡羅來納的夏洛特,最近剛被另一家折扣連鎖店Dollar Tree Inc.收購)的企業(yè)架構(gòu)總監(jiān)David Kropman也基于同樣原因參加了這次會議。“我們剛開始大數(shù)據(jù)的探索,想了解正確的應用場景,同時防止自己重蹈其他公司的覆轍。”Kropman表示。
Sicular的報告給出了足夠明晰的信息,可以讓Kropman和Liu回去分享給各自的團隊,避免犯同樣的錯誤。Kropman說:“大數(shù)據(jù)項目的失敗不單單是因為某個原因,而是由多個因素一起導致的。”
對于大數(shù)據(jù)項目的失敗,Sicular總結(jié)出7個主要原因,并劃分為三個大類:戰(zhàn)略、技能和分析。
戰(zhàn)略方面的失敗
1.組織惰性。某家旅游公司系統(tǒng)通過web日志數(shù)據(jù)的挖掘來提升客戶洞察。結(jié)果證明,用戶在瀏覽網(wǎng)站之后,隨后的消費行為模式與管理層所認為的不一致。當團隊匯報此事時,管理層認為不值一提。但是,該團隊并沒有放棄,并通過嚴密的A/B測試,回擊了管理層的輕視。
這個案例的最終結(jié)果,不是每個CIO都能期盼的。但是,有一點是可以確定的:做好和管理層打交道的準備,讓他們充分理解大數(shù)據(jù)是什么以及相應的價值。要說對CIO們有什么建議的話,Sicular認為,不要在失敗的項目上過多糾纏,重新啟動一個新的。
2.選擇了錯誤的應用場景。一家保險公司想了解日常習慣和購買生命保險意愿之間的關(guān)聯(lián)性。由于隨后覺得習慣太過于寬泛,該公司將調(diào)查范疇限定到是否吸煙上。但是,工作仍然沒有實質(zhì)進展。“不到半年,他們就終止了整個項目,因為一直未能發(fā)現(xiàn)任何有價值的信息。”Sicular說。
這個項目的失敗是由于問題的復雜性。在抽煙與否之間,該公司沒有注意到還有大片灰色地帶:很多人是先抽煙而后又戒煙了。在將問題簡單化動機的驅(qū)動下,這個部分被忽略了。“他們不是醫(yī)療健康方面的專家。”Sicular分析到。為此,她提醒聽眾要對應用案例排定優(yōu)先級,先易后難,循序漸進。
技術(shù)層面的失敗
3.無法應對料想之外的問題。一家全球性公司的大數(shù)據(jù)團隊發(fā)現(xiàn)了很多深刻的洞察,并且計劃通過云讓全公司共享。“為此,他們啟動了一個云中的項目。”Sicular說。
Sicular認為,這樣做是有風險的 – 一個在受控的定制環(huán)境中獲得成功的項目,未必能適應于生產(chǎn)環(huán)境中。“這個團隊低估了效率方面的損耗。由于網(wǎng)絡(luò)擁塞的問題,無法滿足全球各個分支順暢提交數(shù)據(jù)運行分析的需求。”Sicular分析說。
該公司應該仔細思考下如何支撐大數(shù)據(jù)項目,梳理所需的技能并協(xié)調(diào)各IT分支的力量進行支持。“由于網(wǎng)絡(luò)、安全或基礎(chǔ)設(shè)施的問題,已經(jīng)有太多的大數(shù)據(jù)項目栽了跟頭。你必須事先想清楚,需要哪些方面的人手加入到項目中來。”Sicular表示。
4.缺乏大數(shù)據(jù)分析技能。一家零售公司的首席執(zhí)行官不認同亞馬遜規(guī)?;⒈馄交姆?wù)模式,因此讓CIO構(gòu)建一個客戶推薦引擎。項目最初的規(guī)劃是半年為期,但是團隊很快認識到諸如協(xié)同過濾(collaborative filtering)之類的概念無法實現(xiàn)。為此,一個團隊成員提出做一個“假的推薦引擎”,把床單作為唯一的推薦產(chǎn)品。
這個假引擎的工作邏輯是:買攪拌機的人會買床單,買野營書籍的人會買床單,買書的人會買床單。就是如此,床單是唯一的、默認的推薦品。
盡管可笑,這個主意其實并不壞,默認的推薦也能給企業(yè)帶來銷售上的提升。但是,由于大數(shù)據(jù)相關(guān)技能的缺失,真正意義上的引擎未能實現(xiàn)。Sicular表示,這是需要很長時間探索和積累的。盡管過程曲折而漫長,不過不用擔心,大數(shù)據(jù)的推進是有明確階段劃分的,對CIO們來說可以有針對性地加以應對。這些階段包括:
管理高層表示支持大數(shù)據(jù)戰(zhàn)略規(guī)劃形成進行各種測試和驗證流程上線并不斷完善(Sicular稱之為戰(zhàn)術(shù)階段)投資回報開始顯現(xiàn),企業(yè)真正體會到大數(shù)據(jù)的價值(Sicular稱之為戰(zhàn)略階段)技術(shù)領(lǐng)先的企業(yè)開始構(gòu)建真正的數(shù)據(jù)產(chǎn)品(Sicular稱之為轉(zhuǎn)型階段)
數(shù)據(jù)分析本身的失敗
5.對數(shù)據(jù)過于相信。2008年,Google第一次開始預測流感就取得了很好的效果,比美國疾病預防控制中心(Centers for Disease Control and Prevention)提前兩禮拜預測到了流感的爆發(fā)。但是,幾年之后,Google的預測比實際情況(由防控中心根據(jù)全美就診數(shù)據(jù)推算得出)高出了50%。“媒體過于渲染了Google的成功,出于好奇目的而搜索相關(guān)關(guān)鍵詞的人越來越多,從而導致了數(shù)據(jù)的扭曲。”Sicular說。
因此,CIO在拿到數(shù)據(jù)之后,應該從不同角度進行加以審視,確保對數(shù)據(jù)的來源、驗證方法、控制手段以及是否有臟數(shù)據(jù)等問題都能胸有成竹。
6.提出了錯誤的問題。一家全球領(lǐng)先的汽車制造商決定開展一個情感分析項目,為期6個月,耗資1千萬美元。項目結(jié)束之后,該廠商將結(jié)果分享給經(jīng)銷商并試圖改變銷售模式。然后,所得出的結(jié)果最終被證明是錯誤的。
“項目團隊沒有花足夠的時間去了解經(jīng)銷商所面臨的問題或業(yè)務(wù)建議,從而導致相關(guān)的分析毫無價值。”Sicular說。
對此,Sicular提到了決策分析中的“滿意度(satisficing)”模型 -- 即放棄對最優(yōu)結(jié)果的偏執(zhí),基于具體的情境,找到足夠好的解決方案。“耐下性子,去真正理解問題以及企業(yè)可能從中獲得的收益。”Sicular解釋說。
7.應用了錯誤的模型。為了尋找可供借鑒的案例,一位在銀行工作的博士研究了其他行業(yè)的大數(shù)據(jù)成功應用。最終,他的目光落在了電信行業(yè)的客戶流失預測模型上。
該銀行從電信業(yè)聘請了一位專家,后者也很快構(gòu)建了評估用戶是否即將流失的模型。Sicular表示,當時已進入評測驗證的最后階段,模型很快就將上線,而銀行也開始準備給那些被認為即將流失的客戶發(fā)出信件加以挽留。但是,為了保險起見,一位內(nèi)部專家被要求對模型進行評估。
這位銀行業(yè)專家很快發(fā)現(xiàn)了令人驚奇的事情:不錯,那些客戶的確即將流失,但并不是因為對銀行的服務(wù)不滿意。他們之所以轉(zhuǎn)移財產(chǎn)(有時是悄無聲息的),是因為感情問題 -- 正在為離婚做準備。
了解模型的適用性、數(shù)據(jù)抽象的級別以及模型中隱含的細微差別,這些都是非常具有挑戰(zhàn)性的。“這是大數(shù)據(jù)分析的關(guān)鍵之一。”Sicular表示。為了大數(shù)據(jù)項目的成功,CIO還必須從道德、倫理和心理的角度進行思考。