深度的數(shù)據(jù)分析項(xiàng)目通常花費(fèi)不菲。不過(guò),如果善于創(chuàng)新,CIO們能夠以較小成本順利完成項(xiàng)目。對(duì)此,Niel Nickolaisen進(jìn)行了說(shuō)明。
目前,IT領(lǐng)袖及其團(tuán)隊(duì)正面臨巨大的機(jī)遇,改變企業(yè)對(duì)自身的價(jià)值定位。IT團(tuán)隊(duì)有著現(xiàn)成的資源來(lái)實(shí)現(xiàn)巨大的業(yè)務(wù)價(jià)值,而成本卻可以非常低。對(duì),沒(méi)聽(tīng)錯(cuò),非常低的成本。
在進(jìn)入正題之前,首先聲明,我要談的東西可能與直觀感覺(jué)不符,甚至違返企業(yè)傳統(tǒng)文化。許多年來(lái),我們都被反復(fù)地告知,如果想要交付高價(jià)值服務(wù),就不得不付出高昂成本。對(duì),高價(jià)值服務(wù)背后往往意味著較高的成本,但這并非金科玉律。下面,我們進(jìn)入正題。
以較小成本實(shí)現(xiàn)高價(jià)值服務(wù)的場(chǎng)景之一,就是高級(jí)數(shù)據(jù)分析項(xiàng)目。
我之所以能做出這個(gè)結(jié)論,是因?yàn)槲矣羞^(guò)類(lèi)似經(jīng)歷(成本確實(shí)很低)。
我曾經(jīng)是某大學(xué)的CIO。當(dāng)時(shí),該大學(xué)的管理團(tuán)隊(duì)有一個(gè)最為主要的工作目標(biāo),即提升畢業(yè)率。不管在什么場(chǎng)合,團(tuán)隊(duì)都會(huì)就此展開(kāi)討論。在某次會(huì)議上,我曾經(jīng)這么表態(tài)過(guò):“如果能確保我認(rèn)識(shí)所有的學(xué)生,我能保證畢業(yè)率達(dá)到100%的水平。”當(dāng)時(shí),所有與會(huì)者都很無(wú)語(yǔ),轉(zhuǎn)而討論課程設(shè)置、學(xué)生輔導(dǎo)和教學(xué)模式等方面的話題。
會(huì)后,我繼續(xù)就畢業(yè)率的問(wèn)題進(jìn)行了思考。我們有一個(gè)錄取模型,由教育領(lǐng)域的專(zhuān)家開(kāi)發(fā),用于決定我們接收學(xué)生的標(biāo)準(zhǔn)。其中,有三個(gè)因素是最重要的:英語(yǔ)、寫(xiě)作和數(shù)據(jù)能力的測(cè)試分?jǐn)?shù)。所有報(bào)考的學(xué)生都必須進(jìn)行這三門(mén)考試,而我們擇優(yōu)錄取。
為此,我開(kāi)始懷疑我們的數(shù)據(jù)是否真正支撐了這種錄取模型。我們已經(jīng)有大量與報(bào)名學(xué)生、正式入學(xué)的學(xué)生以及最終畢業(yè)的學(xué)生相關(guān)的數(shù)據(jù)。如果對(duì)這些數(shù)據(jù)進(jìn)行分析,進(jìn)行形成對(duì)錄取模型的優(yōu)化,將是極具吸引力的工作。但是,該如何啟動(dòng)項(xiàng)目呢?我的團(tuán)隊(duì)中沒(méi)有真正的數(shù)據(jù)科學(xué)家,也沒(méi)有支撐這項(xiàng)高級(jí)數(shù)據(jù)分析工作的工具和環(huán)境。
不過(guò),最終結(jié)果證明,其實(shí)我并不真正需要這些人力物力。至少,在開(kāi)始階段不需要。我的做法是,在一個(gè)數(shù)據(jù)挑戰(zhàn)網(wǎng)站把問(wèn)題和數(shù)據(jù)(進(jìn)行了脫敏處理,去掉了學(xué)生們的個(gè)人識(shí)別信息)公布出去,讓全世界的數(shù)據(jù)科學(xué)家、分析師和統(tǒng)計(jì)學(xué)家來(lái)為我構(gòu)建新的錄取模型。
整個(gè)工作最終花費(fèi)了兩個(gè)禮拜的時(shí)間,得到了一個(gè)超出我預(yù)期的更好的模型(以現(xiàn)有數(shù)據(jù)集來(lái)看)。我選定了得到最佳模型的優(yōu)勝者,并發(fā)布了獎(jiǎng)勵(lì)3500美元(不是3萬(wàn)5千美元,也不是35萬(wàn)美元,更不是350萬(wàn)美元)。如果這個(gè)模型最終被證明為失敗,我的損失就是3500美元而已,就我當(dāng)時(shí)所掌控的預(yù)算來(lái)說(shuō),這點(diǎn)錢(qián)不是問(wèn)題。
那么,這個(gè)新模型的實(shí)際價(jià)值如何呢?新模型揭示了現(xiàn)有人為定制模型的問(wèn)題所在。根據(jù)數(shù)據(jù)分析的結(jié)果,我們之前認(rèn)為的最重要的因素,其實(shí)在重要性上僅排名第六而已,而之前第二重要的因素實(shí)際應(yīng)該在第九位。我們進(jìn)一步了解到,其實(shí)很多待錄取的學(xué)生沒(méi)有必要進(jìn)行英文、寫(xiě)作和數(shù)據(jù)能力測(cè)試——如果這些學(xué)生在真正重要的指標(biāo)上合格了,他們根本沒(méi)必要進(jìn)行測(cè)試。
就這樣,僅僅花了3500美元,我們就改變了學(xué)校運(yùn)營(yíng)的模式,并進(jìn)入了以數(shù)據(jù)推動(dòng)決策的階段。我們更新了學(xué)校的宣傳和錄取策略(現(xiàn)在,我們已經(jīng)知道哪些學(xué)生能夠順利畢業(yè),就沒(méi)有必要在其他人身上多費(fèi)力氣了)?;诖俪蓪W(xué)生成功的真正因素,我們開(kāi)始在相關(guān)領(lǐng)域開(kāi)始發(fā)力。比如,之前缺少科學(xué)、技術(shù)、工程或數(shù)據(jù)方面作業(yè)的學(xué)生不予錄取。這也意味著,在這些方面較弱的學(xué)生需要我們的特別關(guān)注和協(xié)助,以此提升其成功畢業(yè)的機(jī)率。
在這個(gè)項(xiàng)目之后,我們啟動(dòng)了一個(gè)有關(guān)學(xué)生輔導(dǎo)模型的數(shù)據(jù)分析項(xiàng)目。該項(xiàng)目意在識(shí)別出那些面臨困境的學(xué)生,而我們則可以根據(jù)分析結(jié)果將更多的資源投入到這些學(xué)生身上,以此幫助其獲得學(xué)業(yè)上的成功。
這一切成績(jī)的背后,起到主導(dǎo)作用的就是IT團(tuán)隊(duì)。
數(shù)據(jù)分析項(xiàng)目:如何啟動(dòng)
如果你對(duì)此感興趣,下面就介紹該如何啟動(dòng)一個(gè)數(shù)據(jù)分析項(xiàng)目。首先,定位一些長(zhǎng)期困擾企業(yè)的、較為含混不清的問(wèn)題,比如用戶(hù)流失、需求預(yù)測(cè)、精準(zhǔn)營(yíng)銷(xiāo)等等。然后,審視下手頭現(xiàn)有的、與這些問(wèn)題相關(guān)的數(shù)據(jù)。
是否擁有所需的數(shù)據(jù)?這些數(shù)據(jù)的存在形式?還缺少哪些數(shù)據(jù),以及該如何解決?之后的事情,就是找到模型開(kāi)發(fā)團(tuán)隊(duì)。比如,數(shù)據(jù)競(jìng)賽網(wǎng)站、尋找學(xué)生項(xiàng)目的本地大學(xué)、具備相應(yīng)能力的本地大數(shù)據(jù)/數(shù)據(jù)科學(xué)家用戶(hù)組。
有件事需要特別注意:在大學(xué)里推動(dòng)高級(jí)數(shù)據(jù)分析項(xiàng)目時(shí),我們從不在任何大數(shù)據(jù)基礎(chǔ)架構(gòu)或環(huán)境上進(jìn)行過(guò)多的投入。比如,對(duì)于上面提到的識(shí)別處于困境的學(xué)生的模型,由于只需要每?jī)芍苓\(yùn)行一次,我們是通過(guò)云租用的模式獲取計(jì)算資源的。每個(gè)月,我們支付3000美元來(lái)讓模型跑一次,對(duì)覆蓋約5萬(wàn)學(xué)生的2000個(gè)數(shù)據(jù)元素進(jìn)行計(jì)算。退一萬(wàn)步說(shuō),即便模型所產(chǎn)生的價(jià)值很低,這種成本也是極為低廉的。就我們的這個(gè)模型來(lái)說(shuō),這簡(jiǎn)直太劃算了 – 把學(xué)生退學(xué)率降低了10%,節(jié)省了數(shù)百萬(wàn)美元的成本。這一切,你也可以做到。