《數(shù)據(jù)之巔:大數(shù)據(jù)革命,歷史、現(xiàn)實與未來》是開中國社會大數(shù)據(jù)之先河的徐子沛的第二本著述,如果說前一本開創(chuàng)性的《大數(shù)據(jù)》引發(fā)了大數(shù)據(jù)戰(zhàn)略、數(shù)據(jù)治國和開放數(shù)據(jù)的討論,“為華文世界開創(chuàng)了一個重要話題”,那《數(shù)據(jù)之巔》則在追根溯源,追述小數(shù)據(jù)的歷史與大數(shù)據(jù)的崛起過程,著重解析美國的實例,闡述歷史大架構下的數(shù)據(jù)文化以及數(shù)據(jù)治國理念的形成。歸根結底,作者是要提醒國人,當前信息技術的發(fā)展,已讓我國獲得了后發(fā)優(yōu)勢,但數(shù)據(jù)文化從來是中國文化的薄弱之處,想在大數(shù)據(jù)時代的全球競爭中勝出,必須把大數(shù)據(jù)從科技符號提升成為文化符號,在全社會倡導數(shù)據(jù)文化。
按徐子沛的看法,大數(shù)據(jù)時代是從本世紀10年代開始的,標志著人類社會正在向智能社會轉(zhuǎn)型,但追述大數(shù)據(jù)的興起過程,卻要從小數(shù)據(jù)開始。他選擇從美國的數(shù)據(jù)文化根基開始講起,通過闡述初數(shù)時代、內(nèi)戰(zhàn)時代、鍍金時代、進步時代、抽樣時代的數(shù)據(jù)文化特征,以數(shù)據(jù)分權、人口普查、土地丈量、數(shù)據(jù)遠征、數(shù)據(jù)審判等歷史事件為主線、系統(tǒng)梳理了美國數(shù)據(jù)文化的形成,闡述其數(shù)據(jù)治國之道。
無論是開國總統(tǒng)華盛頓,還是打贏南北戰(zhàn)爭的林肯,都高度重視統(tǒng)計。因“羅斯福新政”聞名于世的美國第31任總統(tǒng)富蘭克林?德拉諾?羅斯福更是“首倡要在公共政策的制定過程當中應用統(tǒng)計學的理論和方法”。高度重視統(tǒng)計,表明一個政府對收集社會各方面信息的科學性,此舉也必定有助于決策的科學性。
但是,現(xiàn)實發(fā)展不可能總是自然走向好的一面。對數(shù)據(jù)越是高度重視,越不可避免地會遇到一個常識性的“技術”問題,即數(shù)據(jù)的準確性。數(shù)據(jù)是否準確主要取決于兩大方面,一是統(tǒng)計標準的確立,二是統(tǒng)計過程的嚴謹。相較于后者,前者相對較為容易。之所以這么說,是因為統(tǒng)計過程的嚴謹與否,往往取決于統(tǒng)計人員的素質(zhì)以及相關制衡機制。很難想象,一個統(tǒng)計工作人員如果受到工作之外的強力干擾,仍會謹守數(shù)據(jù)的準確性。而如果缺乏外在有效監(jiān)督制約力量,統(tǒng)計很難不會朝向“趨利避害”的方向逐漸扭曲。這也就是說,統(tǒng)計做的是數(shù)字的工作,但歸根結底還是取決于人的素質(zhì),還有良好機制等系統(tǒng)機制的約束。
美國的數(shù)據(jù)權威之所以能夠得到較好的保證,拋開數(shù)屆政府堅持確立科學的統(tǒng)計標準外,還在于整個社會對統(tǒng)計數(shù)據(jù)的真實性和科學性存在諸多制衡機制,比如公開和辯論。公開,本身就是社會對統(tǒng)計工作監(jiān)督的重要內(nèi)容之一,其中又以輿論監(jiān)督為最。在強大的輿論監(jiān)督壓力下,統(tǒng)計瑕疵一旦被曝光,輕則被質(zhì)疑,重則可能引發(fā)官場地震。二百多年來,美國輿論對各類數(shù)據(jù)始終保持著習慣性“虎視眈眈”傳統(tǒng),絕大多數(shù)媒體還會通過民意調(diào)查等方式,從“民間”角度反證官方數(shù)據(jù)的準確性與合理性。當然,這種“民間發(fā)聲”也會被一些見風使舵的政客所利用,一些美國總統(tǒng)精于踩著民意統(tǒng)計步點,及時派“糖”以保個的支持率的實例屢見不鮮。不過,徐子沛并不認為這就是數(shù)據(jù)不可饒恕之積蔽,而是數(shù)據(jù)未來發(fā)展有必要努力克服的方向。
公開數(shù)據(jù),還是遏制特權的有效手段。在1843年前,美國“各地的執(zhí)法官為了提高(人口普查)數(shù)據(jù)的準確性,在普查完成之后,還在城市、村莊的顯要位置張貼普查結果,號召民眾補充和核對”。盡管后來出于隱私保護的考慮,對有關統(tǒng)計信息都有所遮蔽,但“國會的議員必須每年公開自己的財產(chǎn)情況,包括各類股票的數(shù)量和交易明細”卻一點不通融。奧巴馬就任總統(tǒng)后,“從上任的第一天起,他就在全國范圍內(nèi)推動數(shù)據(jù)開放運動”。數(shù)據(jù)公開力度,某種意義上也折射出一個社會的清廉度。
僅僅公開當然是不夠的,因為有的數(shù)據(jù)不是公開后便可一目了然,這就需要專業(yè)人士的深入研究乃至充分爭論。“在國會的聽證會上,每一個數(shù)據(jù)如果稍有含糊,每一個邏輯推理的鏈條如果斷裂,都有可能被虎視眈眈的競爭對手揪出來,受到質(zhì)疑和挑戰(zhàn)”。也只有經(jīng)常性地面臨被質(zhì)疑的強大壓力,才可能確保數(shù)據(jù)的生成過程始終嚴謹。
分析數(shù)據(jù),就是為了從數(shù)字中尋找可能的規(guī)律。一個過硬的數(shù)據(jù)體系,更有益于決策的造福于社會。數(shù)據(jù)不僅在美國政界大量開花結果,民間同樣收獲頗豐。如蓋洛普公司憑借“科學抽樣”不僅成功預測數(shù)屆總統(tǒng)人選,還為好萊塢電影《亂世佳人》提供全程指導并大獲成功。而被譽為“質(zhì)量管理之父”的愛德華?戴明通過抽樣檢查實現(xiàn)對產(chǎn)品質(zhì)量的控制,還推動了日本制造業(yè)在短時間內(nèi)的質(zhì)量騰飛。
歷史學家黃仁宇在《萬歷十五年》中有過一個著名論斷:中國人不善于用數(shù)目字管理,對古幣存世量的討論,大多含糊其辭。近幾十年來,情況有了較大改變。1983年我國出臺了首部《統(tǒng)計法》,現(xiàn)在施行的《統(tǒng)計法》歷經(jīng)1996年和2009年兩次修訂。社會各方越來越重視分析比較各類統(tǒng)計數(shù)據(jù)。不過,現(xiàn)實表明,我們的統(tǒng)計工作仍有大力提升的空間。順舉一例,據(jù)報,2013年全國31省區(qū)市的GDP之和約為63萬億,這個數(shù)據(jù)超出了全國GDP總量逾6.1萬億。事實上,像這樣巨大的統(tǒng)計“誤差”絕非孤例。出現(xiàn)這類統(tǒng)計誤差,原因不外乎兩個,一是統(tǒng)計標準不一,比如未能有效厘清對央企等特殊企業(yè)特殊行業(yè)的統(tǒng)計內(nèi)容;二是統(tǒng)計中摻有政績“水分”,這也是導致統(tǒng)計巨大“誤差”的重要原因。2002年,國務院前總理朱镕基為國家會計學院題寫校訓“不做假賬”,這無疑是對數(shù)字工作者的巨大鞭策。然而,在多年來的“唯GDP”崇拜下,扭轉(zhuǎn)數(shù)字出政績的歷史慣性不僅需要智慧,恐怕還更需要“橫刀立馬”的勇氣。
數(shù)據(jù)本身是沒有偏好的科學工具。除非這個原本枯燥的工作被賦予了太多的利益內(nèi)涵而又不受制約。簡言之,數(shù)據(jù)就像是鐵面無私的法官,其公信力往往取決于數(shù)據(jù)生成全過程的抗干擾能力。
隨著科學技術的飛速發(fā)展,特別隨著社交媒體的普及,每個網(wǎng)民在不知不覺中都變成了數(shù)據(jù)生產(chǎn)者。網(wǎng)民上網(wǎng)的過程,同時也是數(shù)據(jù)處理的過程,每個網(wǎng)民無形中變成了一臺臺數(shù)據(jù)處理器,所不同的是處理標差和側重點的不同。“從科技符號演變?yōu)槲幕枺纬梢环N文化話語體系,大數(shù)據(jù),正在撬動中國的制度創(chuàng)新、科技創(chuàng)新”。現(xiàn)在的問題是,面對海量的數(shù)字謎團,我們該如何從中尋找可能的內(nèi)在規(guī)律?