互聯(lián)網(wǎng)公司擁有大量的消費者數(shù)據(jù)、金融數(shù)據(jù)、物流數(shù)據(jù),可據(jù)此開發(fā)新產(chǎn)品和新商業(yè)模式。券商應(yīng)抓緊有效整合多方數(shù)據(jù),分析挖掘其中的業(yè)務(wù)價值,提升未來的競爭力,真正做到“大數(shù)據(jù)、小數(shù)據(jù)、智能數(shù)據(jù)、群數(shù)生輝;廣挖掘、深挖掘、互聯(lián)挖掘、多挖出金”。
國務(wù)院近期印發(fā)《促進大數(shù)據(jù)發(fā)展行動綱要》,正式拉開了國家層面運用大數(shù)據(jù)加強服務(wù)和監(jiān)管的序幕。綱要提出到2020年我國將形成一批具有國際競爭力的大數(shù)據(jù)處理、分析、可視化軟件和硬件支撐平臺等產(chǎn)品。這也為券商的全方位創(chuàng)新吹響了集結(jié)號。
今天,數(shù)據(jù)已成國家基礎(chǔ)性戰(zhàn)略資源,金融行業(yè)對數(shù)據(jù)重視度的加強也在日趨回歸本性,數(shù)據(jù)與金融行業(yè)一直形影相伴,可以看成是金融業(yè)發(fā)展的基石。目前金融業(yè)每天產(chǎn)生大量未加工可量化的數(shù)據(jù),金融數(shù)據(jù)流的產(chǎn)生、存儲、分析以及使用正在改變著他們的發(fā)展路徑。人們用海量性、多樣性、快速性、準確性和價值性5個“V”來標示大數(shù)據(jù),其中海量性、多樣性和快速化說明的是數(shù)據(jù)生成過程、如何采集數(shù)據(jù)和存儲數(shù)據(jù),而準確性和價值性是指處理數(shù)據(jù)的質(zhì)量和數(shù)據(jù)的有用性,而價值性才是企業(yè)獲取數(shù)據(jù)的真正目的,也是券商提升市場洞察力和交易決策能力賴以生存的基礎(chǔ)。
在過去幾年里,越來越多的券商采用數(shù)據(jù)驅(qū)動方法推進針對性服務(wù),以降低風(fēng)險和提高業(yè)績。他們執(zhí)行特殊的數(shù)據(jù)分析程序來收集、存儲、管理一系列資料,并分析大數(shù)據(jù)集,識別關(guān)鍵業(yè)務(wù),以便給客戶提供更好決策??衫玫慕鹑跀?shù)據(jù)源包括股價、外匯和衍生品交易、交易記錄、高頻交易、無結(jié)構(gòu)化新聞和文本、以及隱含在社會媒體和網(wǎng)絡(luò)中的消費者信心和商業(yè)情緒等。在大數(shù)據(jù)的趨勢下,市場信息所包含的數(shù)據(jù)量及其多樣性逐漸增加,促使企業(yè)提升處理和分析大數(shù)據(jù)的能力。
有些企業(yè)認為只要收集足夠多的數(shù)據(jù),即可得到充分的信息資料,這在浪費存儲資源的同時忽視了客戶的真正需求。其實,數(shù)據(jù)量越大,包含的噪聲就越多,有價值信息的獲取也就越艱難,對于券商來講,數(shù)據(jù)量之大不是關(guān)鍵,數(shù)據(jù)收集和開發(fā)只有在充分利用并能解決實際問題的時候才是有用的??梢?,關(guān)鍵之處在于挖掘并使用高價值的數(shù)據(jù),這些數(shù)據(jù)可轉(zhuǎn)化為智能數(shù)據(jù)。智能數(shù)據(jù)一般是結(jié)構(gòu)化且可控制的,對于券商來說是強有力的發(fā)展工具。從市場影響的角度,智能數(shù)據(jù)能使得券商更好的理解客戶,并能將相關(guān)信息傳遞給潛在客戶和當(dāng)前客戶。因此,智能數(shù)據(jù)可以看成是大數(shù)據(jù)過濾掉噪聲后得到的數(shù)據(jù),是能夠產(chǎn)生價值并被券商所高效利用來解決實際問題的數(shù)據(jù)。
按照數(shù)據(jù)的可使用程度,可將數(shù)據(jù)分為大數(shù)據(jù)、小數(shù)據(jù)和智能數(shù)據(jù)。大數(shù)據(jù)是企業(yè)簡單收集的所有數(shù)據(jù)的集合,這是包含噪聲的原始數(shù)據(jù)。小數(shù)據(jù)是包含非常具體屬性的數(shù)據(jù)集,用來確定當(dāng)前狀態(tài)和條件,它可通過大數(shù)據(jù)集生成。小數(shù)據(jù)是根據(jù)客戶的特定需求,有針對性地找出能給客戶提供決策支持的客觀依據(jù)。大數(shù)據(jù)提供了總體概況,而小數(shù)據(jù)提供了實時、特定信息。不同于大數(shù)據(jù),小數(shù)據(jù)是利用現(xiàn)有資源,券商可通過數(shù)據(jù)了解客戶投資需求和偏好、以及他們對于某投資行業(yè)的看法,通過分析客戶的反饋,提高服務(wù)質(zhì)量,還可以通過數(shù)據(jù)資源來分段和精選客戶。對于小數(shù)據(jù)利用價值的提升,將使得券商可以高效地利用現(xiàn)有資源,避免了購買大數(shù)據(jù)處理機器所帶來的財力超支。數(shù)據(jù)管理是大部分券商所面臨的最大挑戰(zhàn),即使是處理小數(shù)據(jù)也常常受到數(shù)據(jù)噪聲的困擾。
智能數(shù)據(jù)作為過濾掉噪聲的數(shù)據(jù),是在對原始數(shù)據(jù)進行清洗、整理并集成后得到的數(shù)據(jù),其獲取具有一定的難度,利用智能數(shù)據(jù),不但可以了解券商和客戶的當(dāng)前狀態(tài),還能預(yù)測將來一段時間內(nèi)的狀態(tài)。同時,還可以根據(jù)投資者情緒指數(shù)、交易量等信息,利用數(shù)據(jù)挖掘、文本挖掘技術(shù)預(yù)測股市的大致走勢,為客戶提供一定的參考依據(jù)。智能數(shù)據(jù)利用傳感器、測量技術(shù)以及包含預(yù)測模型的軟件技術(shù)監(jiān)測出即將發(fā)生故障的部位,并提醒工作人員提前做好應(yīng)對準備。
目前已有券商采用Hadoop的運行環(huán)境,其處理能力經(jīng)接近于實時處理,未來還需要在安全和性能方面提高效率,并提出高效的運營方案。智能數(shù)據(jù)對人機的要求都比較高,它需要良好的基礎(chǔ)設(shè)施以完成大型計算和存儲的功能,平臺要求并行和可擴展性,在部分服務(wù)器出現(xiàn)故障時仍能正常運轉(zhuǎn);在系統(tǒng)軟件中安裝具有預(yù)測性功能的模型,能根據(jù)行情不斷變化來調(diào)整系統(tǒng)的最優(yōu)值。同時,系統(tǒng)還需要能充分理解模型及運用并有處理實際數(shù)據(jù)能力的專門人才。
高頻交易是另外一個很好的例子。高頻交易利用計算機在短時間內(nèi)完成成千上萬次交易,每次僅獲取微薄利潤,成千上萬次利潤疊加就是相當(dāng)可觀的收入。但高頻交易并非無可挑剔,近幾年利用高頻交易得到的利潤在下降,部分原因是越來越多的人使用這種技術(shù)來消除系統(tǒng)的低效率,系統(tǒng)作為整體變得越來越高效,這意味著金融機構(gòu)不得不利用數(shù)據(jù)開發(fā)出更多的創(chuàng)意和創(chuàng)新來預(yù)測未來股市,幫助客戶更多盈利,并設(shè)計出他們樂于購買的產(chǎn)品。結(jié)構(gòu)化數(shù)據(jù)對于高頻交易的分析具有明顯優(yōu)勢,但隨著高頻交易所獲利潤的快速下降,分析人員開始從非結(jié)構(gòu)化數(shù)據(jù)中尋找市場機會。交易員正試圖尋找更好的方法來理解不斷加強的信息流,范圍從新聞報道到社交媒體等,將現(xiàn)實世界的事件轉(zhuǎn)化為市場洞察,從而增加交易效率和投資收益。
目前一些互聯(lián)網(wǎng)公司已對數(shù)據(jù)做戰(zhàn)略規(guī)劃,支付寶錢包增加了股票行情,直接提供股票報價,他們擁有最重要的客戶資源,比如阿里擁有大量的消費者數(shù)據(jù)、金融數(shù)據(jù)、物流數(shù)據(jù),可據(jù)此開發(fā)新產(chǎn)品和新商業(yè)模式。券商應(yīng)抓緊有效整合多方數(shù)據(jù),分析挖掘其中的業(yè)務(wù)價值,提升自身未來的競爭力,真正做到“大數(shù)據(jù)、小數(shù)據(jù)、智能數(shù)據(jù)、群數(shù)生輝;廣挖掘、深挖掘、互聯(lián)挖掘、多挖出金”。