國家信息中心常務副主任杜平:八類數(shù)據(jù)可產生真正的大數(shù)據(jù)價值

責任編輯:editor006

2015-11-07 22:27:40

摘自:人民網(wǎng)-中國共產黨新聞網(wǎng)

五中全會談到的信息化創(chuàng)新發(fā)展的工作,看起來著墨不多,但是實際上對于我們國際國內的經(jīng)驗做了總結。類就是互聯(lián)網(wǎng)數(shù)據(jù),這個我們比較熟悉,現(xiàn)在做的最熱鬧的可能就是這個,各種各樣的輿情分析都是基于互聯(lián)網(wǎng)數(shù)據(jù),因為它是公開的。

國家信息中心常務副主任杜平發(fā)言。(人民網(wǎng)記者于凱 攝)

國家信息中心常務副主任杜平發(fā)言。

五中全會談到的信息化創(chuàng)新發(fā)展的工作,看起來著墨不多,但是實際上對于我們國際國內的經(jīng)驗做了總結。下一步要貫徹落實好。

拓展網(wǎng)絡經(jīng)濟空間這里面有一個實施國家大數(shù)據(jù)戰(zhàn)略,形成信息資源開放共享。在創(chuàng)新宏觀調控方式里面提到一句話:運用大數(shù)據(jù)技術,提高經(jīng)濟運行,信息及時性和準確性。這兩點的交集是大數(shù)據(jù)的概念。大數(shù)據(jù)這幾年在社會上已經(jīng)引起很多的關注,而且在實踐上有很多的時效性已經(jīng)顯示出來,不像早些年大家還在討論這個概念,還在考慮它是否可以在中國這片土地上茁壯成長?,F(xiàn)在看起來,它已經(jīng)是現(xiàn)實。就我自己所從事的工作來講,我覺得有三個問題我們要關注。

第一,大數(shù)據(jù)的發(fā)展沒有基礎設施無法實現(xiàn),我們沒有新的數(shù)據(jù)庫技術,沒有云計算這樣一些東西也談不上。所以,基礎設施,可能很多地方容易走彎路,大家都認為,既然搞這個,我們都要建IDC,前幾年搞智慧城市、搞數(shù)據(jù)庫中間,基本上各地都想搶這班車。我想對于基礎設施,我們可能現(xiàn)在要考慮一個新的路徑和思路,就是創(chuàng)新??赡苁枪步ü蚕砉操I服務,或者向第三方購買服務,用云的方法或用公有云來解決。

第二,我覺得最重要的可能是數(shù)據(jù)源,數(shù)據(jù)源及獲取的方式問題如果不解決,我們會走很長一段時間的彎路。我覺得數(shù)據(jù)源可能有八類,每一類都不一樣。

第一類,政府信息,部門之間是共享的問題。這個我們采取的辦法現(xiàn)在是通過建立一些綜合聯(lián)動數(shù)據(jù)交換平臺,這兩年來,國務院也有明確要求,建一些公共的數(shù)據(jù)交換平臺,要求打通部門之間的信息孤島,要求上下可以聯(lián)動。

第二類就是政府公共數(shù)據(jù)公開,無論是政府機構,或者準政府機構,包括我們一些科研院所、大學,或者我們執(zhí)行國有公共職能,他們形成的公共資源,這個可能是要依法依規(guī),脫敏解密以后要公開,而且要采取基本免費的方式。

第三類應該是商務數(shù)據(jù),這個現(xiàn)在比較活躍的,商務數(shù)據(jù)比較多,這個可以考慮有價轉讓、同質交換、協(xié)議共享等等。因為畢竟商務數(shù)據(jù)是在商務生產者過程中間形成的,有成本進去,不是政府的投資。

第四類就是互聯(lián)網(wǎng)數(shù)據(jù),這個我們比較熟悉,現(xiàn)在做的最熱鬧的可能就是這個,各種各樣的輿情分析都是基于互聯(lián)網(wǎng)數(shù)據(jù),因為它是公開的。我們現(xiàn)在真正推動的大數(shù)據(jù)的使用,就是運用互聯(lián)網(wǎng),大量的互聯(lián)網(wǎng)數(shù)據(jù),形成了不同的算法,最后形成不同的產品。

第五類是通訊數(shù)據(jù)。無論是包括移動電話,包括微信等等,這種數(shù)據(jù)可能需要加密獲取,運用的時候脫敏。路徑都可以研究。

第六類是空間地理數(shù)據(jù),我們自己承擔國家空間地理信息庫的建設中間發(fā)現(xiàn),應該分類,基礎信息的公開,專業(yè)化的信息可以采取協(xié)議獲取的方式,或者如果你要做加工增值,還可以做個成本,可以去出售。

第七類是物聯(lián)網(wǎng)數(shù)據(jù),現(xiàn)在越來越多的,無論是工業(yè)數(shù)據(jù),包括智能家電、智能交感,凡是通過傳感器形成的,我覺得這種數(shù)據(jù)也是要分一下類,一類是政府公共的,通過公共監(jiān)測獲取的數(shù)據(jù)可能也要公開,如果不是,是企業(yè)家、企業(yè)自己形成的,通過平臺上形成的,可能這種數(shù)據(jù)我們還得去購買,或者通過協(xié)議。

第八類是金融數(shù)據(jù),目前采取的是征信體系里面,做信用評級的采取的是準入獲取。使用上是受到限制的,叫應用受限。

這些數(shù)據(jù)可以產生真正大數(shù)據(jù)價值的,不是統(tǒng)計,被統(tǒng)計的我個人理解不叫大數(shù)據(jù)。大數(shù)據(jù)是沒有被統(tǒng)計過的,我們值得研究一下這個事情。

第三個大的問題是大數(shù)據(jù)的挖掘,我覺得這個我不再說了,今天在座的很多企業(yè)家可能都會談到這個,現(xiàn)在的技術是非常多樣化,就是投入產出問題,就是怎么樣根據(jù)需求來打包,形成最好的產品,通過營銷出去,這個完全是一個市場競爭。但是,在市場競爭里面應該也有規(guī)則,我覺得還要相應建立一套規(guī)則,建立一套標準體系,如果實現(xiàn)共享的話,這個接口、標準不要五花八門,也對我們的監(jiān)管部門,比如說我們網(wǎng)信辦對數(shù)據(jù)的監(jiān)管也要考慮一下統(tǒng)一的標準,也好監(jiān)管。當然,大數(shù)據(jù)挖掘的產生應該是使用者付費。 

鏈接已復制,快去分享吧

企業(yè)網(wǎng)版權所有?2010-2024 京ICP備09108050號-6京公網(wǎng)安備 11010502049343號