10月8日,復旦大學大數據學院正式揭牌成立,復旦大學大數據研究院也同時成立。學院將以計算機科學、數學和統(tǒng)計學為基礎,與經濟金融、生命科學、醫(yī)療衛(wèi)生和社會管理等眾多學科領域進行深度交叉研究,有效推動相關學科的發(fā)展,直接面向產業(yè)需求建立跨學科、跨領域的研發(fā)團隊,集聚產業(yè)創(chuàng)新人才,著力創(chuàng)造具有巨大市場應用價值的科技成果。
據悉,該學院籌備期長達10個月。早在2015年初,復旦大學就開始醞釀成立大數據學院及研究院。如何在全社會高度關注“大數據”概念、不少大學和研究機構紛紛引入大數據研究的熱潮中獨樹一幟和起領跑作用?如何推動大數據研究更接地氣、避免“從概念到概念”“從計算到計算”?如何讓大數據研究帶動人才培養(yǎng)、打破“從學者到學者”的封閉內循環(huán)?如何讓大數據扎實落地、成為一級學科方向?復旦大數據學院和研究院的成立,力求對上述問題提供“復旦方案”。
■許憲春
對于政府統(tǒng)計機構來說,沒有什么比數據更重要的了。我們研究統(tǒng)計分類標準、統(tǒng)計調查方法、統(tǒng)計數據采集方式、統(tǒng)計數據加工處理方法、統(tǒng)計數據評估技術,都是為了獲取真實準確、完整及時、代表性強、分類科學、經濟適用的統(tǒng)計數據。
大數據時代的到來,既給政府統(tǒng)計帶來重大發(fā)展機遇,也帶來嚴峻挑戰(zhàn)。
一、大數據在政府統(tǒng)計中的應用
國家統(tǒng)計局高度重視大數據在政府統(tǒng)計中的應用。到目前為止,已經與17家大數據企業(yè)簽訂了戰(zhàn)略合作協議。當然,目前大數據在中國政府統(tǒng)計中的應用仍處于起步階段,主要表現在兩個方面:一是大數據成為政府統(tǒng)計數據的部分資料來源;二是大數據成為政府統(tǒng)計數據質量的部分評估依據。
(一)大數據成為政府統(tǒng)計數據的部分資料來源
目前,大數據已經成為中國政府統(tǒng)計數據的部分資料來源,以下是幾個有代表性的方面:
1.利用重點網上零售交易平臺數據測算網上零售額
為了掌握網上零售交易平臺的交易規(guī)模和結構,綜合測算網上零售數據,從今年1月份開始,國家統(tǒng)計局實施了月度網上零售交易平臺調查,調查范圍為42家重點網上零售交易平臺,包括京東商城、亞馬遜、當當網、淘寶網、天貓商城、酒仙網、美團網、中糧我買網、國美在線、大眾點評網等。據對上述42家重點網上零售交易平臺數據測算,今年1~8月份,全國網上零售額22400.9億元,同比增長36.5%。其中,實物商品網上零售額18653.4億元,增長35.6%,占全部網上零售額的83.3%;非實物商品網上零售額3747.5億元,增長41.1%,占全部網上零售額的16.7%。這對于宏觀管理部門和社會公眾了解網上零售情況具有重要的參考作用。
2.利用房屋交易網簽數據計算全國70個大中城市的新建住宅價格指數
房屋交易網簽數據是指買賣雙方簽訂購房合同后,房地產開發(fā)企業(yè)在房管部門進行備案,并在房產信息網上公布的相關信息,包含地址、樓層、價格、面積和金額等詳細信息,基本涵蓋了當月新建住宅的全部交易情況。從2011年1月份開始,國家統(tǒng)計局開始采用房屋交易網簽數據計算全國70個大中城市的新建住宅價格指數。這對于提高70個大中城市新建住宅價格指數的數據質量起到了重要作用。
3.利用卓創(chuàng)資訊公司提供的價格信息,開展流通領域重要生產資料市場價格監(jiān)測
國家統(tǒng)計局與卓創(chuàng)資訊公司開展合作,利用該企業(yè)提供的價格信息,開展流通領域重要生產資料市場價格監(jiān)測。從2014年1月開始,按旬共同向社會發(fā)布流通領域9大類50種重要生產資料市場價格的檢測結果。行業(yè)涵蓋黑色金屬、有色金屬、化工產品、煤炭、石油天然氣、非金屬建材、農產品、農業(yè)生產資料、林產品等領域。地區(qū)監(jiān)測范圍覆蓋北京、天津、河北、山西、內蒙古、遼寧、吉林、上海等24個省區(qū)市。這對于宏觀管理部門和社會公眾了解流通領域重要生產資料市場價格信息起到了重要作用。
(二)大數據成為政府統(tǒng)計數據質量的部分評估依據
國家統(tǒng)計局除了把大數據作為政府統(tǒng)計數據的部分資料來源外,也高度重視利用大數據評估政府統(tǒng)計數據質量。以下是目前比較有代表性的兩個方面:一是利用中國銀聯跨行銀行卡消費數據評估社會消費品零售總額數據質量;二是利用大型機械裝備企業(yè)物聯網數據評估固定資產投資數據質量。
二、大數據給政府統(tǒng)計帶來的機遇與挑戰(zhàn)
對于政府統(tǒng)計來說,大數據既帶來了重大發(fā)展機遇,也帶來嚴峻挑戰(zhàn)。
(一)大數據給政府統(tǒng)計帶來重大發(fā)展機遇
首先,大數據將不斷提高政府統(tǒng)計服務宏觀管理和社會公眾的能力。隨著大數據的不斷發(fā)展和完善,隨著政府統(tǒng)計機構開發(fā)應用大數據能力的不斷提升,政府統(tǒng)計產品的種類將會不斷豐富,政府統(tǒng)計數據的質量和時效性將會不斷提升,從而政府統(tǒng)計服務宏觀管理和社會公眾的能力會不斷提高。
其次,大數據將會推動政府統(tǒng)計發(fā)生革命性的變化。隨著大數據的發(fā)展和完善,隨著政府統(tǒng)計機構開發(fā)應用大數據技術的逐步成熟,政府統(tǒng)計將會發(fā)生革命性變化。一是現有的以周期性普查為基礎,以抽樣調查為主體,綜合運用全面調查、重點調查等方法,并充分利用行政記錄等資料的統(tǒng)計調查方法體系可能會發(fā)生重大變化。長期以來,抽樣調查方法,即在總體中抽選樣本、利用樣本推算總體的方法;普查和全面調查方法,即對總體中所有單位逐一進行調查的方法,在我國政府統(tǒng)計中發(fā)揮了重要作用。今后,在較長的時期內這些方法仍然會被政府統(tǒng)計所廣泛采用。但在大數據不斷發(fā)展和完善的情況下,某些領域、某些方面的大數據可能會取代抽樣調查、普查和全面調查方法,成為獲取統(tǒng)計數據的重要方法,而且這種獲取統(tǒng)計數據的方法將會變得越來越重要。二是政府統(tǒng)計中的數據采集方式可能會發(fā)生重大變化。長期以來,政府統(tǒng)計機構主要以企業(yè)填報、住戶記賬、調查員入戶等方式采集原始數據。在大數據不斷發(fā)展和完善的情況下,一部分原始數據將通過挖掘大數據的方式獲取,而且這種新的數據采集方式將會變得越來越重要。三是政府統(tǒng)計的數據處理模式可能會發(fā)生重大變化。在大數據不斷發(fā)展和完善的情況下,現行的對普查和全面調查數據進行直接審核、匯總、加工處理和對抽樣調查數據進行推算放大的數據處理模式可能會發(fā)生重大變化。
(二)大數據給政府統(tǒng)計帶來嚴峻挑戰(zhàn)
首先,大數據對政府統(tǒng)計能力帶來挑戰(zhàn)。從大數據本身的產生到發(fā)展完善,從政府統(tǒng)計對大數據的初步運用到成熟運用,需要一個較長的時期。在這個過程中,一方面,政府統(tǒng)計中傳統(tǒng)的統(tǒng)計調查方法、數據采集方式和數據處理模式將繼續(xù)運行,否則滿足不了宏觀管理和社會公眾的需求。另一方面,政府統(tǒng)計系統(tǒng)必須投入大量的人力和物力對大數據進行挖掘、加工處理和運用,否則也適應不了大數據時代宏觀管理和社會公眾的需求。這種雙軌運行的模式,對政府統(tǒng)計能力將是一個巨大的挑戰(zhàn)。
其次,大數據對傳統(tǒng)政府統(tǒng)計理念帶來挑戰(zhàn)。傳統(tǒng)的政府統(tǒng)計有一個約定俗成的理念:抽樣調查方法可降低調查成本,提高效率和數據質量。因為抽樣調查只對總體中部分抽中的樣本進行調查,并非對總體中的每一個單位都進行調查,所以調查單位明顯減少,可降低成本,節(jié)約時間,提高效率。同時,由于調查單位較少,政府統(tǒng)計機構有能力對基層統(tǒng)計調查人員進行較為扎實的培訓和指導,有精力對統(tǒng)計調查數據進行較為嚴格的檢查和審核,從而能夠提高統(tǒng)計調查數據質量。隨著大數據不斷發(fā)展完善,政府統(tǒng)計機構將會越來越多地通過大數據企業(yè)間接地獲取統(tǒng)計數據,不需要對總體中的具體單位進行直接調查,不需要調查員,從而也不需要對調查員進行培訓,抽樣調查所具有的調查成本低、能夠提高統(tǒng)計調查數據質量的優(yōu)點就不復存在了。(作者系國家統(tǒng)計局副局長)