2020年的一天,在你驅(qū)車前往公司的路上,導(dǎo)航系統(tǒng)將通過(guò)預(yù)測(cè)交通流量自動(dòng)幫你選擇一條最適合的交通路線,車內(nèi)推薦系統(tǒng)將根據(jù)你的飲食習(xí)慣給你推薦沿途的早餐店,你的電子社交助理將為你自動(dòng)選擇你可能感興趣的社交網(wǎng)信息……
這并不是科幻大片,而是Preddiction impact董事長(zhǎng)、預(yù)測(cè)分析專家埃里克·西格爾在其新著《大數(shù)據(jù)預(yù)測(cè)》中所描述的一個(gè)未來(lái)場(chǎng)景。實(shí)際上,這些場(chǎng)景有些在今天已經(jīng)變成了現(xiàn)實(shí)。
結(jié)合預(yù)測(cè)分析的應(yīng)用實(shí)例,埃里克·西格爾在《大數(shù)據(jù)預(yù)測(cè)》一書(shū)中對(duì)大數(shù)據(jù)預(yù)測(cè)進(jìn)行了深入、細(xì)致且全面的解讀,并希望通過(guò)量化的方法來(lái)預(yù)測(cè)人類的行為。
他說(shuō):“大數(shù)據(jù)時(shí)代,核心就是預(yù)測(cè),預(yù)測(cè)分析已在商業(yè)和社會(huì)中得到廣泛應(yīng)用,隨著越來(lái)越多的數(shù)據(jù)被記錄和整理,未來(lái)預(yù)測(cè)分析必定會(huì)成為所有領(lǐng)域的關(guān)鍵技術(shù)。”
預(yù)測(cè)就是力量:
我就知道你會(huì)這么做
在大數(shù)據(jù)時(shí)代,預(yù)測(cè)已經(jīng)變得更加具有可能性,也變得幾乎無(wú)處不在,時(shí)刻影響著我們的生活?,F(xiàn)在,預(yù)測(cè)技術(shù)正在不知不覺(jué)中影響著人類的體驗(yàn),無(wú)論是開(kāi)車、購(gòu)物、學(xué)習(xí)、就醫(yī)、溝通、看電視,還是賺錢(qián)、借錢(qián)甚至偷盜。
那么預(yù)測(cè)是如何與大數(shù)據(jù)結(jié)合的呢?預(yù)測(cè)又能給企業(yè)帶來(lái)什么好處呢?
“預(yù)測(cè)除了讓你我這樣的消費(fèi)者獲益之外,也可讓企業(yè)脫胎換骨形成全新的競(jìng)爭(zhēng)力。因此,很多企業(yè)都在不余遺力地提升預(yù)測(cè)力。”
在《大數(shù)據(jù)預(yù)測(cè)》一書(shū)中,埃里克·西格爾介紹了預(yù)測(cè)應(yīng)用在企業(yè)領(lǐng)域的一個(gè)最為知名的案例:20世紀(jì)90年代中期,一位名叫丹·斯坦伯格的商業(yè)科學(xué)家走進(jìn)了大通銀行,他要幫助這家金融機(jī)構(gòu)預(yù)測(cè)數(shù)百萬(wàn)份按揭的風(fēng)險(xiǎn)。大通銀行采納了斯坦伯格的預(yù)測(cè)技術(shù),并借助斯坦伯格研發(fā)的系統(tǒng)來(lái)評(píng)估、處理大量的銀行按揭。
在這個(gè)案例中,斯坦伯格幫助美國(guó)大通銀行精確預(yù)測(cè)了按揭申請(qǐng)人的未來(lái)還款行為,由此極大降低了放貸風(fēng)險(xiǎn)并增加了盈利。
“預(yù)測(cè)就是力量,如果某大型商業(yè)機(jī)構(gòu)能夠預(yù)測(cè)個(gè)體資產(chǎn)的風(fēng)險(xiǎn)變化和價(jià)值,那么,它將形成不可撼動(dòng)的市場(chǎng)競(jìng)爭(zhēng)優(yōu)勢(shì)。”
當(dāng)然,即使在大數(shù)據(jù)出現(xiàn)之后,預(yù)測(cè)技術(shù)也并不是完美的,它需要不斷完善。
“做出精確的預(yù)測(cè)是件很難的事,每項(xiàng)預(yù)測(cè)都有若干先決條件,即首先要掌握每個(gè)病人、每個(gè)購(gòu)房者以及每封郵件的不同特征信息。”
那么在每項(xiàng)預(yù)測(cè)中,我們?cè)撊绾螌⑦@些分散的信息綜合起來(lái)呢?埃里克·西格爾給出的應(yīng)對(duì)策略是:用系統(tǒng)化和科學(xué)化的方法來(lái)開(kāi)發(fā)并持續(xù)改善預(yù)測(cè)技術(shù),即要讓計(jì)算機(jī)系統(tǒng)自動(dòng)“學(xué)習(xí)”如何預(yù)測(cè)。
“這就是機(jī)器學(xué)習(xí),也就是讓電腦自動(dòng)獲取新知識(shí)和新能力,持續(xù)不斷地輸入現(xiàn)代社會(huì)最有價(jià)值和最重要的非自然資源:數(shù)據(jù)。”
在埃里克·西格爾看來(lái),數(shù)據(jù)里面所凝結(jié)的內(nèi)涵,能夠給預(yù)測(cè)帶來(lái)更高的準(zhǔn)確率。數(shù)據(jù)里面的每一次醫(yī)療診斷、借款申請(qǐng)、發(fā)帖、影視推薦、垃圾郵件以及結(jié)果好壞的購(gòu)買行為、成功或失敗的推銷等等,都是機(jī)器學(xué)習(xí)的原始材料。
“機(jī)器學(xué)習(xí)會(huì)從這些發(fā)現(xiàn)中嘗試建立預(yù)測(cè)能力,通過(guò)對(duì)數(shù)字的挖掘和試錯(cuò),運(yùn)用統(tǒng)計(jì)學(xué)方法和計(jì)算機(jī)科學(xué)方法實(shí)現(xiàn)這種預(yù)測(cè)。”
而埃里克·西格爾在本書(shū)中所要講述的,正是計(jì)算機(jī)預(yù)測(cè)技術(shù)中最具有影響力和最有價(jià)值的成就,以及其背后的兩大因素——技術(shù)背后的人和推動(dòng)技術(shù)發(fā)展的神奇的科學(xué),他指出:“計(jì)算機(jī)自動(dòng)學(xué)習(xí)系統(tǒng)的研發(fā)使得數(shù)據(jù)資源的能量開(kāi)始爆發(fā),在獲取這些新知識(shí)之后,科學(xué)預(yù)測(cè)就成為了可能。”
兩條腿走路:
預(yù)測(cè),并根據(jù)預(yù)測(cè)結(jié)果采取行動(dòng)
研究數(shù)據(jù)只是做出準(zhǔn)確預(yù)測(cè)的第一步,事實(shí)上,要想將預(yù)測(cè)模型應(yīng)用于實(shí)踐,并從中獲益,并不是一件簡(jiǎn)單的工作。
“運(yùn)用預(yù)測(cè)分析意味著要根據(jù)預(yù)測(cè)結(jié)果去行動(dòng),要在實(shí)踐中應(yīng)用從預(yù)測(cè)中學(xué)到的東西并尊重?cái)?shù)據(jù)所揭示的規(guī)律。”
當(dāng)然,隨著技術(shù)的進(jìn)步,成功運(yùn)用預(yù)測(cè)分析的案例正不斷增加,而這些案例都具備如下特征:海量數(shù)據(jù)的積累、組織文化的變遷以及預(yù)測(cè)分析相關(guān)軟件的不斷完善。
在書(shū)中,埃里克·西格爾提出,要想擁有屬于自己的運(yùn)用預(yù)測(cè)分析的創(chuàng)新方法,你需要做到以下兩步:預(yù)測(cè)內(nèi)容及采取行動(dòng)。
“所謂的預(yù)測(cè)內(nèi)容,包括個(gè)人、股票以及其他任何事物的變現(xiàn)形式;而采取行動(dòng),則是指做出決策,針對(duì)預(yù)測(cè)結(jié)果所作出的組織行為。”
埃里克·西格爾把這種預(yù)測(cè)系統(tǒng)的構(gòu)建過(guò)程與航天飛機(jī)發(fā)射的過(guò)程相對(duì)比,在他看來(lái),這兩者具有很大程度上的相似性。
“正如航天飛機(jī)一樣,從理論上看,預(yù)測(cè)分析程序看上去很完美,你要先設(shè)計(jì)并構(gòu)建好系統(tǒng),然后將其放在發(fā)射塔上等待發(fā)射信號(hào),但當(dāng)真正要開(kāi)始執(zhí)行時(shí),發(fā)射過(guò)程卻可能出現(xiàn)波折。”
而在啟動(dòng)程序之后,預(yù)測(cè)分析系統(tǒng)就進(jìn)入了奇特而安靜的等待期,正如航天飛機(jī)進(jìn)入軌道之后出現(xiàn)的靜止?fàn)顟B(tài)一般。計(jì)算機(jī)能在不知不覺(jué)中完成海量的程序變更,而人是無(wú)法直接看到或感知到這些變更的。
但是,預(yù)測(cè)分析系統(tǒng)進(jìn)入等待期并不意味著人就無(wú)事可做,人不僅要時(shí)刻觀察這個(gè)系統(tǒng),還要做出決策。
“如果不根據(jù)預(yù)測(cè)結(jié)果采取行動(dòng),那么預(yù)測(cè)實(shí)際上沒(méi)有任何意義,它們只是信息而不是創(chuàng)意,雖然這些珍寶那么閃耀,但如果你只是把這些成果當(dāng)作裝飾品掛在墻上,那么除了展示你的良好自我感覺(jué)之外,它們別無(wú)用處。”
在埃里克·西格爾看來(lái),預(yù)測(cè)分析的目的絕不是要產(chǎn)生對(duì)在辦公桌上等著落滿灰層的報(bào)告,它要跳出實(shí)驗(yàn)室,在現(xiàn)實(shí)中發(fā)揮作用。
當(dāng)然,由于預(yù)測(cè)分析具有開(kāi)放性,其應(yīng)用領(lǐng)域幾乎無(wú)所不包,案例也層出不窮,埃里克·西格爾并不指望僅僅是這兩個(gè)簡(jiǎn)單的介紹就能讓讀者了解到大數(shù)據(jù)預(yù)測(cè)的精髓所在。因此,在書(shū)中,他列舉了147個(gè)案例,以便讀者瀏覽并對(duì)此擁有大致了解。
“這些案例設(shè)計(jì)包括精確營(yíng)銷、員工流失、股票價(jià)格、風(fēng)險(xiǎn)、事故、銷售、捐贈(zèng)、點(diǎn)擊率、取消率、健康問(wèn)題、醫(yī)院入診等等。”
埃里克·西格爾希望,他所觀察到的那些預(yù)測(cè)案例能給陷入麻煩或者有遠(yuǎn)見(jiàn)的企業(yè)及個(gè)人帶去一些哪怕是最微小的用處。
大通銀行的范例:
決策樹(shù)是有效的預(yù)測(cè)工具
在預(yù)測(cè)界,丹·斯坦伯格算得上是一個(gè)傳奇,他和大通銀行之間的故事,也成為了預(yù)測(cè)界的一個(gè)經(jīng)典案例。在書(shū)中,埃里克·西格爾詳細(xì)解讀了這次合作的過(guò)程,這或許能給讀者帶來(lái)更多啟發(fā)。
最開(kāi)始,大通銀行在按揭貸款評(píng)估中出現(xiàn)了一個(gè)不可協(xié)調(diào)的問(wèn)題——它們總是會(huì)出現(xiàn)很高的失誤率。
丹·斯坦伯格答應(yīng)幫助大通銀行來(lái)預(yù)測(cè)按揭貸款風(fēng)險(xiǎn),他組建了一個(gè)小規(guī)模的專家團(tuán)隊(duì),將分類——回歸決策樹(shù)方法用于分析大通銀行的按揭數(shù)據(jù)。
“但大通銀行希望這個(gè)預(yù)測(cè)模型能夠跟普通企業(yè)的不一樣。大部分企業(yè)會(huì)預(yù)測(cè)客戶是否會(huì)流失,由此確定如何挽留客戶,讓流失風(fēng)險(xiǎn)較高的客戶留下來(lái)。”
而大通銀行對(duì)客戶流失預(yù)測(cè)則有新的要求,他們希望用預(yù)測(cè)值來(lái)判斷個(gè)人按揭貸款的未來(lái)價(jià)值,由此來(lái)確定是否將這些貸款轉(zhuǎn)讓給其他銀行。
“銀行之間會(huì)交易信貸資產(chǎn),大通銀行可以根據(jù)預(yù)測(cè)的提前償付概率來(lái)判斷按揭貸款的價(jià)值,如果想要更加充分利用預(yù)測(cè)所能實(shí)現(xiàn)的價(jià)值,大通銀行可以判斷究竟是持有這筆貸款好還是將其轉(zhuǎn)讓好,而預(yù)測(cè)就能幫助我們做出這些決策。”
在這個(gè)按揭貸款預(yù)測(cè)評(píng)估程序當(dāng)中,丹·斯坦伯格所要預(yù)測(cè)的對(duì)象是在未來(lái)90天內(nèi)將提前還款的按揭貸款人;而所要采取的行動(dòng)則是評(píng)估按揭貸款的價(jià)值,決定是否將這筆貸款轉(zhuǎn)讓給其他銀行。
大通銀行從預(yù)測(cè)項(xiàng)目中受益匪淺,2000年,大通銀行決定購(gòu)買JP摩根并組建摩根大通集團(tuán),目前按資產(chǎn)總額測(cè)算,摩根大通是美國(guó)市場(chǎng)上最大的金融機(jī)構(gòu)。
“決策樹(shù)被證明是有效的預(yù)測(cè)工具,決策樹(shù)的規(guī)則通俗易懂,這對(duì)于許多機(jī)構(gòu)而言都是好消息。”
當(dāng)然,大通銀行的決策樹(shù)方案,只是適用于大通銀行本身的一種預(yù)測(cè)程序。在書(shū)中,埃里克·西格爾還列舉了諸多的案例,這些案例或許能給企業(yè)帶來(lái)一些啟發(fā)。
可以預(yù)測(cè)的 人類七大生存現(xiàn)狀
消費(fèi)行為:例如好萊塢影視公司會(huì)預(yù)測(cè),如果某劇本被制作成影片,它是否會(huì)受歡迎。
戀愛(ài)、工作、生育和離婚:職場(chǎng)社交網(wǎng)站LinkedIn會(huì)預(yù)測(cè)你的未來(lái)職業(yè)選項(xiàng)。
人的思考和決策:例如奧巴馬在選舉中利用預(yù)測(cè)左右了數(shù)百萬(wàn)的搖擺選民。
人的放棄:例如惠普公司對(duì)其全球33萬(wàn)名員工都進(jìn)行了“離職風(fēng)險(xiǎn)”評(píng)估,預(yù)測(cè)每位員工的離職可能性,這樣管理層就可以提前介入或及早采取應(yīng)對(duì)措施。
事故:例如,保險(xiǎn)公司會(huì)預(yù)測(cè)誰(shuí)開(kāi)車更容易出交通事故,或者誰(shuí)在滑雪時(shí)更容易受傷。
疾病和死亡:研究人員會(huì)根據(jù)病患的各項(xiàng)指標(biāo)以及身體狀況,來(lái)判斷其在手術(shù)中猝死的風(fēng)險(xiǎn),并將信息用于制定診療方案。
撒謊、欺詐、盜竊和謀殺:大部分大中型銀行都采取了預(yù)測(cè)技術(shù)來(lái)防范單證造假、信用卡盜刷以及其他行為。