大數(shù)據(jù)在金融行業(yè)的典型應用場景
大數(shù)據(jù)涉及的行業(yè)過于廣泛,除金融外,還包括政治、教育、傳媒、醫(yī)學、商業(yè)、工農(nóng)業(yè)、互聯(lián)網(wǎng)等多個方面,各行業(yè)對大數(shù)據(jù)的定義目前尚未統(tǒng)一。大數(shù)據(jù)的特點可歸納為“4V”。第一,數(shù)據(jù)體量大(Volume),海量性也許是與大數(shù)據(jù)最相關的特征。第二,數(shù)據(jù)類型繁多(Variety),大數(shù)據(jù)既包括以事務為代表的傳統(tǒng)結(jié)構(gòu)化數(shù)據(jù),還包括以網(wǎng)頁為代表的半結(jié)構(gòu)化數(shù)據(jù)和以視頻、語音信息為代表的非結(jié)構(gòu)化數(shù)據(jù)。第三,價值密度低(Value),大數(shù)據(jù)的體量巨大,但數(shù)據(jù)中的價值密度卻很低。比如幾個小時甚至幾天的監(jiān)控視頻中,有價值的線索或許只有幾秒鐘。第四,處理速度快(Velocity),大數(shù)據(jù)要求快速處理,時效性強,要進行實時或準實時的處理。
金融行業(yè)一直較為重視大數(shù)據(jù)技術的發(fā)展。相比常規(guī)商業(yè)分析手段,大數(shù)據(jù)可以使業(yè)務決策具有前瞻性,讓企業(yè)戰(zhàn)略的制定過程更加理性化,實現(xiàn)生產(chǎn)資源優(yōu)化分配,依據(jù)市場變化迅速調(diào)整業(yè)務策略,提高用戶體驗以及資金周轉(zhuǎn)率,降低庫存積壓的風險,從而獲取更高的利潤。
當前,大數(shù)據(jù)在金融行業(yè)典型的應用場景有以下幾個方面:
在銀行業(yè)的應用主要表現(xiàn)在兩個方面:一是信貸風險評估。以往銀行對企業(yè)客戶的違約風險評估多基于過往的信貸數(shù)據(jù)和交易數(shù)據(jù)等靜態(tài)數(shù)據(jù),內(nèi)外部數(shù)據(jù)資源整合后的大數(shù)據(jù)可提供前瞻性預測。二是供應鏈金融。利用大數(shù)據(jù)技術,銀行可以根據(jù)企業(yè)之間的投資、控股、借貸、擔保及股東和法人之間的關系,形成企業(yè)之間的關系圖譜,利于企業(yè)分析及風險控制。
在證券行業(yè)的應用主要表現(xiàn)為:一是股市行情預測。大數(shù)據(jù)可以有效拓寬證券企業(yè)量化投資數(shù)據(jù)維度,幫助企業(yè)更精準地了解市場行情,通過構(gòu)建更多元的量化因子,投研模型會更加完善。二是股價預測。大數(shù)據(jù)技術通過收集并分析社交網(wǎng)絡如微博、朋友圈、專業(yè)論壇等渠道上的結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),形成市場主觀判斷因素和投資者情緒打分,從而量化股價中人為因素的變化預期。三是智能投資顧問。智能投資顧問業(yè)務提供線上投資顧問服務,其基于客戶的風險偏好、交易行為等個性化數(shù)據(jù),依靠大數(shù)據(jù)量化模型,為客戶提供低門檻、低費率的個性化財富管理方案。
在互聯(lián)網(wǎng)金融行業(yè)的應用,一是精準營銷。大數(shù)據(jù)通過用戶多維度畫像,對客戶偏好進行分類篩選,從而達到精準營銷的目的。二是消費信貸?;诖髷?shù)據(jù)的自動評分模型、自動審批系統(tǒng)和催收系統(tǒng)可降低消費信貸業(yè)務違約風險。
金融大數(shù)據(jù)的典型案例分析
為實時接收電子渠道交易數(shù)據(jù),整合銀行內(nèi)系統(tǒng)業(yè)務數(shù)據(jù)。中國交通銀行通過規(guī)則欲實現(xiàn)快速建模、實時告警與在線智能監(jiān)控報表等功能,以達到實時接收官網(wǎng)業(yè)務數(shù)據(jù),整合客戶信息、設備畫像、位置信息、官網(wǎng)交易日志、瀏覽記錄等數(shù)據(jù)的目的。
該系統(tǒng)通過為交通銀行卡中心構(gòu)建反作弊模型、實時計算、實時決策系統(tǒng),幫助擁有海量歷史數(shù)據(jù),日均增長超過兩千萬條日志流水的銀行卡中心,形成電子渠道實時反欺詐交易監(jiān)控能力。利用分布式實時數(shù)據(jù)采集技術和實時決策引擎,幫助信用卡中心高效整合多系統(tǒng)業(yè)務數(shù)據(jù),處理海量高并發(fā)線上行為數(shù)據(jù),識別惡意用戶和欺詐行為,并實時預警和處置;通過引入機器學習框架,對少量數(shù)據(jù)進行分析、挖掘構(gòu)建并周期性更新反欺詐規(guī)則和反欺詐模型。
系統(tǒng)上線后,該銀行迅速監(jiān)控電子渠道產(chǎn)生的虛假賬號、偽裝賬號、異常登錄、頻繁登錄等新型風險和欺詐行為;系統(tǒng)穩(wěn)定運行,日均處理逾兩千萬條日志流水、實時識別出近萬筆風險行為并進行預警。數(shù)據(jù)接入、計算報警、案件調(diào)查的整體處理時間從數(shù)小時降低至秒級,監(jiān)測時效提升近3000倍,上線3個月已幫助卡中心挽回數(shù)百萬元的風險損失。
百度的搜索技術正在全面注入百度金融。百度金融使用的梯度增強決策樹算法可以分析大數(shù)據(jù)高維特點,在知識分析、匯總、聚合、提煉等多個方面有其獨到之處,其深度學習能力利用數(shù)據(jù)挖掘算法能夠較好地解決大數(shù)據(jù)價值密度低等問題。百度“磐石”系統(tǒng)基于每日100億次搜索行為,通過200多個維度為8.6億賬號精確畫像,高效劃分人群,能夠為銀行、互聯(lián)網(wǎng)金融機構(gòu)提供身份識別、反欺詐、信息檢驗、信用分級等服務。該系統(tǒng)累計為百度內(nèi)部信貸業(yè)務攔截數(shù)十萬欺詐用戶,攔截數(shù)十億不良資產(chǎn)、減少數(shù)百萬人力成本,累計合作近500家社會金融機構(gòu),幫助其提升了整體風險防控水平。
金融大數(shù)據(jù)應用面臨的挑戰(zhàn)及對策
大數(shù)據(jù)技術為金融行業(yè)帶來了裂變式的創(chuàng)新活力,其應用潛力有目共睹,但在數(shù)據(jù)應用管理、業(yè)務場景融合、標準統(tǒng)一、頂層設計等方面存在的瓶頸也有待突破。
一是數(shù)據(jù)資產(chǎn)管理水平仍待提高。主要體現(xiàn)在數(shù)據(jù)質(zhì)量不高、獲取方式單一、數(shù)據(jù)系統(tǒng)分散等方面。
二是應用技術和業(yè)務探索仍需突破。主要體現(xiàn)在金融機構(gòu)原有的數(shù)據(jù)系統(tǒng)架構(gòu)相對復雜,涉及的系統(tǒng)平臺和供應商較多,實現(xiàn)大數(shù)據(jù)應用的技術改造難度很大。同時,金融行業(yè)的大數(shù)據(jù)分析應用模型仍處于起步階段,成熟案例和解決方案仍相對較少,需要投入大量的時間和成本進行調(diào)研和試錯。系統(tǒng)誤判率相對較高。
三是行業(yè)標準和安全規(guī)范仍待完善。金融大數(shù)據(jù)缺乏統(tǒng)一的存儲管理標準和互通共享平臺,對個人隱私的保護上還未形成可信的安全機制。
四是頂層設計和扶持政策還需強化。體現(xiàn)在金融機構(gòu)間的數(shù)據(jù)壁壘較為明顯,各自為戰(zhàn)問題突出,缺乏有效的整合協(xié)同。同時,行業(yè)應用缺乏整體性規(guī)劃,分散、臨時、應激等特點突出,信息價值開發(fā)仍有較大潛力。
以上問題,一方面需要國家出臺促進金融大數(shù)據(jù)發(fā)展的產(chǎn)業(yè)規(guī)劃和扶持政策,同時,也需要行業(yè)分階段推動金融數(shù)據(jù)開放、共享和統(tǒng)一平臺建設,強化行業(yè)標準和安全規(guī)范。只有這樣,大數(shù)據(jù)技術才能在金融行業(yè)中穩(wěn)步應用發(fā)展,不斷推動金融行業(yè)的發(fā)展提升。