編者按:本文來自微信公眾號“伯凡時間”(ID:bofanstime),作者吳伯凡;36氪經(jīng)授權發(fā)布。
歐盟司法和消費者委員會曾經(jīng)推出過一個視頻,視頻里有三位主人公,一位是辦公室女職員,她正在網(wǎng)上預訂機票;一位是在機場候機大廳玩社交網(wǎng)站打發(fā)時間的年輕小伙子,他正要發(fā)布一張自己前天在某處party的照片,還有一位是在家中也許是給自己的孩子購買玩具的父親,他正在購買頁面中加入姓名銀行卡家庭住址等信息……
下一幕畫面是:這三位人士同時按下回車鍵,而他們的衣服也自動從身上脫落,女士赤條條坐在辦公室的格子間里,小伙子在空曠的候機大廳里全身赤裸,那位父親則光不溜秋地坐在自家沙發(fā)上,他們?nèi)藢Υ藴喨徊挥X,繼續(xù)做著接下來要做的事情,工作、見親人朋友等等。
視頻結尾打出兩行字:Online you reveal more than you think. Take control of your personal data——這條有點黑色幽默的視頻希望提醒人們,很多時候,我們都是這樣在網(wǎng)上“裸奔”,你的數(shù)據(jù)早已經(jīng)泄露了你的一切。
這條廣告用充滿視覺沖擊力的真實裸體,讓我們感覺到了暴露身份信息的可怕,不過看完之后,除了會心一笑,大多數(shù)人也還是該干嘛就干嘛,為了獲得網(wǎng)絡提供的便利性,在網(wǎng)上“裸奔”似乎早已成了人們愿意為之付出的代價了。
1
我們已經(jīng)生活在大數(shù)據(jù)時代。在2017年重讀發(fā)行于2013年的《大數(shù)據(jù)時代----生活、工作與思維的大變革》,可能我們依然會折服于它的諸多“先見之明”。這本書的作者有兩位,一位是《經(jīng)濟學人》雜志的數(shù)據(jù)編輯,大數(shù)據(jù)領域最受尊敬的發(fā)言人之一肯尼思·庫克耶,另一位是維克托·邁爾-舍恩伯格,他是牛津大學網(wǎng)絡學院互聯(lián)網(wǎng)研究所治理與監(jiān)管專業(yè)教授,被譽為“大數(shù)據(jù)時代的預言家”,他不僅為全球頂級企業(yè)提供咨詢,也是政府智囊,參與制定歐盟的互聯(lián)網(wǎng)官方政策。
這本書首先開宗明義,提出大數(shù)據(jù)思維是指一種意識,認為公開數(shù)據(jù)一旦處理得當,就能為千百萬人急需解決的問題提供答案。比如說,通過對Google關鍵詞搜索的及時分析,我們可以通過某地增多的“頭痛、發(fā)熱”搜索關鍵語,預測下一輪禽流感的出現(xiàn)。比如,我們?nèi)绻芗皶r地監(jiān)控手機數(shù)據(jù),幾年前發(fā)生新年踩踏事故的上海警察們也許可以早一點獲得警示,在可能出事的地方提前布置警力。
大數(shù)據(jù)讓網(wǎng)絡數(shù)據(jù)服務更精準于迎和用戶的喜好,不論是愛讀的新聞,愛讀的書,愛看的電視連續(xù)劇,還是你可能會喜歡的旅游目的地,大數(shù)據(jù)都能幫你一連串兒地接龍下去。
大數(shù)據(jù)發(fā)展的核心動力來源于人類測量、記錄和分析世界的渴望,人們一直以為,信息技術的變革重點在“T”(技術,technology)上,而不是在“I”(信息,information)上,而大數(shù)據(jù)思維者認為,是時候把聚光燈打向“I”,開始關注信息本身。
他們堅信,一切皆可“量化”:當文字變成數(shù)據(jù),當方位變成數(shù)據(jù),當溝通變成數(shù)據(jù),當世間萬物數(shù)據(jù)化,我們便可以通過數(shù)據(jù)的再利用、重組數(shù)據(jù)、可擴展數(shù)據(jù)、數(shù)據(jù)的折舊值、數(shù)據(jù)廢氣、開放數(shù)據(jù)等作為進行“取之不盡,用之不竭”的數(shù)據(jù)創(chuàng)新。
2
在我們現(xiàn)在這個時代,大量信息被廉價地捕捉和記錄,數(shù)據(jù)經(jīng)常會得到被動地收集,人們無須投入太多精力甚至不需要認識這些數(shù)據(jù)。大部分數(shù)據(jù)的直接價值對收集者是顯而易見的,亞馬遜記錄下客戶購買的書藉和他們?yōu)g覽過的頁面,便可以利用這些數(shù)據(jù)來為客戶提供個性化的建議。Facebook跟蹤用戶的“狀態(tài)更新”和“喜好”,以確定最佳的廣告位從而賺取收入----這就是數(shù)據(jù)的再利用。
重組數(shù)據(jù)指將兩個或多個數(shù)據(jù)源以一種新穎的方法結合起來,比如將某個房地產(chǎn)網(wǎng)站信息和價格添加在社區(qū)地圖上,同時聚合大量信息,如社區(qū)近期交易和物業(yè)規(guī)格,以此來預測區(qū)域內(nèi)具體每套信宅的價值。促成數(shù)據(jù)再利用的方法之一,就是從一開始就設計好它的可擴展性。
比如,有些零售商在店內(nèi)安裝了監(jiān)控攝像頭,這樣不僅能認出商店扒手,還能跟蹤在商店里購物的客戶和他們停留的位置。之前,監(jiān)控報像機僅僅出于安全保衛(wèi),現(xiàn)在零售商則可以利用得到的信息設計店面的最佳布局并判斷營銷活動的有效性----監(jiān)控攝像機從一項純粹的成本支出成為了一項可以增加收入的投資。
數(shù)據(jù)折舊值和數(shù)據(jù)廢氣是值得重點講講的兩項數(shù)據(jù)創(chuàng)新。隨著數(shù)據(jù)存儲成本的大幅下降,企業(yè)擁有了更強的經(jīng)濟動機來保存數(shù)據(jù)。隨著時間的推移,大多數(shù)數(shù)據(jù)會失去一部分基本用途。比如說亞馬遜通常不會基于你十年前買的書來向你推薦,因為系統(tǒng)默認為你十年前的書你現(xiàn)在可能已經(jīng)對它不感興趣了。
亞馬遜認為舊數(shù)據(jù)的存在毀壞了新數(shù)據(jù)的價值,所以亞馬遜決定只使用仍然有生產(chǎn)價值的數(shù)據(jù),這就需要不斷更新數(shù)據(jù)庫并淘汰無用信息。然而亞馬遜發(fā)現(xiàn)僅僅依據(jù)時間來判斷顯然不夠,因此亞馬遜公司建立了復雜的模型來幫助自己分離有用和無用的數(shù)據(jù)。
比如,如果客戶瀏覽或購買了一本基于以往購買記錄而推薦的書,電子商務公司就認為這項舊的購買記錄仍然代表著客戶的喜好。這樣,他們就能夠評價舊數(shù)據(jù)的有用性,并使模型的“折舊率”更具體。
然而,并非所有數(shù)據(jù)都會貶值。有些公司提倡盡可能長時間地保存數(shù)據(jù),即使監(jiān)管部門或公眾要求它們短時間內(nèi)刪除或隱匿這些信息。比如谷歌公司一直以來都拒絕將互聯(lián)網(wǎng)協(xié)議地址從舊的搜索查詢中完全去除,它只是在一年半后刪除了最后四位數(shù)以隱匿搜索查詢。
谷歌希望得到每年的同比數(shù)據(jù),如假日購物搜索等。此外,通過了解搜索者的位置,可以幫助改善搜索結果的相關性。像很多紐約人會搜索“火雞”,但經(jīng)常會搜索到與“火雞”無關的關于“土耳其”的網(wǎng)頁,因為英文中這兩個詞拼法是一樣的。
通過算法可以將他們想查看的網(wǎng)頁放在排名靠前的位置,來方便其他紐約人查找。即使數(shù)據(jù)用于基本用途的價值會減少,但潛在價值卻依然強大。潛在價值表明,組織機構應收集盡可能多的使用數(shù)據(jù)并保存盡可能長的時間,這樣一來,由數(shù)據(jù)再利用而產(chǎn)生的任何商業(yè)價值,原始數(shù)據(jù)擁有者都能從中分一杯羹。
3
“數(shù)據(jù)廢氣” 是一個用來描述人們在網(wǎng)上留下數(shù)字軌跡的藝術詞匯,它指用戶在線交互留下的副產(chǎn)品,包括瀏覽了哪些頁面、停留了多久、鼠標光標停留的位置、輸入了什么信息等等。許多公司利用“數(shù)據(jù)廢氣”完善自己的服務和功能。
谷歌是這方面的領導者,它將不斷地“從數(shù)據(jù)中學習”這個原則應用到許多服務當中,用戶執(zhí)行的每一個動作都被認為是一個“信號”,谷歌對這些“信號”進行分析并且反聵給系統(tǒng)。“數(shù)據(jù)廢氣”成為許多電腦化服務背后的機制,如拼寫檢查、語音識別、垃圾郵件過濾、翻譯等,當用戶指出語音識別程序誤解了他們的意思時,他們實際上有效地“訓練”了這個系統(tǒng),讓它變得更好。
在Facebook早期,數(shù)據(jù)科學家們研究了“數(shù)據(jù)廢氣”的豐富信息,發(fā)現(xiàn)人們會采用某種行動如回貼、點擊圖標等,人們采取這些行動最重要的預測指標就是他們看到了周圍的朋友們也在這么做。于是Facebook馬上重新設計了它的系統(tǒng),使每個用戶的活動變得可見并廣播出去,這為網(wǎng)站的良性循環(huán)做出了新的貢獻。
漸漸的,這個想法從互聯(lián)網(wǎng)行業(yè)傳播至可以收集用戶反聵的任何公司。我們可能會認為谷歌和亞馬遜這些網(wǎng)站是大數(shù)據(jù)的先驅(qū)者,但實際上,政府才是大規(guī)模信息的原始采集者,并且還在與私營企業(yè)競爭他們所控制的大量數(shù)據(jù)。政府與私營企業(yè)數(shù)據(jù)持有之間的主要區(qū)別就是,政府可以強迫人們?yōu)樗麄兲峁┬畔?,而不必加以說服或支付報酬。
因此,政府將繼續(xù)收集和積累大量的數(shù)據(jù)。大數(shù)據(jù)對公共部門的適用性和對商業(yè)實體是一樣的:大部分的數(shù)據(jù)價值都是潛在的,需要通過創(chuàng)新的分析來釋放,但是,由于政府在獲取數(shù)據(jù)中所處的特別地位,因此他們在數(shù)據(jù)使用上往往效率很低。
4
近年來,有一個想法在歐美國家得到了公認,即提取政府數(shù)據(jù)價值最好的辦法是允許私營部門和社會大眾訪問。這種想法基于的原則是:國家收集數(shù)據(jù)時,代表的是它的公民,因此它也理應提供一個讓公民查看的入口,少數(shù)可能會危害到國家安全或他人隱私權的情況除外。
主張開放數(shù)據(jù)入口的人認為,政府只是他們所收集信息的托管人,私營部門和社會對數(shù)據(jù)的利用會比政府更具有創(chuàng)新性。開放數(shù)據(jù)倡導者呼吁建立專門的官方機構來公布民用和商業(yè)數(shù)據(jù),而且數(shù)據(jù)必須以標準的可機讀形式展現(xiàn),以方便人們處理。
2008年1月21日,奧巴馬在就職總統(tǒng)的第一天發(fā)表了一份總統(tǒng)備忘錄,命令美國聯(lián)邦機構的負責人公布盡可能多的數(shù)據(jù),奧巴馬的指令促成了data.org網(wǎng)站的建立,這便是美國聯(lián)邦政府的公開信息資料庫。這個網(wǎng)站從2009年的47個數(shù)據(jù)集迅速發(fā)展起來,到2012年7月三周年時,數(shù)據(jù)集已達到45萬個左右,涵蓋了172個機構。
英國隨后也做出實質(zhì)性轉(zhuǎn)變,以往政府信息都封鎖在英國皇家版權手中,使用起來非常困難和昂貴,而現(xiàn)在英國政府已經(jīng)頒布相關規(guī)定鼓勵信息公開,并支持創(chuàng)建萬維網(wǎng)的發(fā)明者蒂姆·伯納斯參與指導開放式數(shù)據(jù)中心。
其它國家如澳大利亞、巴西、智利等也相繼出臺了并實施了開放數(shù)據(jù)策略。一些國際組織也加入了開放數(shù)據(jù)的熱潮,如世界銀行就公開了數(shù)百個之前被限制的關于經(jīng)濟和社會指標方面的數(shù)據(jù)集。
大數(shù)據(jù)價值鏈有三大構成,分別是:第一基于數(shù)據(jù)的公司比如Twitter,第二基于技能的公司它們提供咨詢技術供應和數(shù)據(jù)分析,第三基于思維的公司,比如今日頭條這樣的公司。那么,誰在這個大數(shù)據(jù)價值鏈中獲益最大呢?答案是那些擁有大數(shù)據(jù)思維或者說創(chuàng)新性思維的人。
隨著大數(shù)據(jù)成為我們生活的一部分,大數(shù)據(jù)工具變得更容易和更方便使用,越來越多掌握這些技能,這些技能的價值就會相對減少,就像20世紀六十年代之后計算機編程變得越來越普遍一樣。現(xiàn)在歐美之外的外包公司使得計算機編程技術越來越廉價,如今它成了世界貧困人口致富的驅(qū)動力,而不再代表著高端技術。
現(xiàn)今,我們正處在大數(shù)據(jù)時代的早期,思維和技能是最有價值的,但是最終,大部分的價值還是必須從數(shù)據(jù)本身中挖掘。在未來,我們可以利用數(shù)據(jù)據(jù)做更多的事情,而數(shù)據(jù)擁有者們也會真正意識到他們所擁有的財富。因此,他們可能會把他們手中所擁有的數(shù)據(jù)抓得更緊,也會以更高的價格將其出售。
數(shù)據(jù)就是金礦,但是讓數(shù)據(jù)主宰一切的憂慮也顯而易見,那么,在大數(shù)據(jù)時代,我們更要思考應該做什么,不應該做什么?請關注伯凡時間,會就這個話題繼續(xù)展開討論。
編者按:本文來自微信公眾號“伯凡時間”(ID:bofanstime),作者吳伯凡;36氪經(jīng)授權發(fā)布。
歐盟司法和消費者委員會曾經(jīng)推出過一個視頻,視頻里有三位主人公,一位是辦公室女職員,她正在網(wǎng)上預訂機票;一位是在機場候機大廳玩社交網(wǎng)站打發(fā)時間的年輕小伙子,他正要發(fā)布一張自己前天在某處party的照片,還有一位是在家中也許是給自己的孩子購買玩具的父親,他正在購買頁面中加入姓名銀行卡家庭住址等信息……
下一幕畫面是:這三位人士同時按下回車鍵,而他們的衣服也自動從身上脫落,女士赤條條坐在辦公室的格子間里,小伙子在空曠的候機大廳里全身赤裸,那位父親則光不溜秋地坐在自家沙發(fā)上,他們?nèi)藢Υ藴喨徊挥X,繼續(xù)做著接下來要做的事情,工作、見親人朋友等等。
視頻結尾打出兩行字:Online you reveal more than you think. Take control of your personal data——這條有點黑色幽默的視頻希望提醒人們,很多時候,我們都是這樣在網(wǎng)上“裸奔”,你的數(shù)據(jù)早已經(jīng)泄露了你的一切。
這條廣告用充滿視覺沖擊力的真實裸體,讓我們感覺到了暴露身份信息的可怕,不過看完之后,除了會心一笑,大多數(shù)人也還是該干嘛就干嘛,為了獲得網(wǎng)絡提供的便利性,在網(wǎng)上“裸奔”似乎早已成了人們愿意為之付出的代價了。
1
我們已經(jīng)生活在大數(shù)據(jù)時代。在2017年重讀發(fā)行于2013年的《大數(shù)據(jù)時代----生活、工作與思維的大變革》,可能我們依然會折服于它的諸多“先見之明”。這本書的作者有兩位,一位是《經(jīng)濟學人》雜志的數(shù)據(jù)編輯,大數(shù)據(jù)領域最受尊敬的發(fā)言人之一肯尼思·庫克耶,另一位是維克托·邁爾-舍恩伯格,他是牛津大學網(wǎng)絡學院互聯(lián)網(wǎng)研究所治理與監(jiān)管專業(yè)教授,被譽為“大數(shù)據(jù)時代的預言家”,他不僅為全球頂級企業(yè)提供咨詢,也是政府智囊,參與制定歐盟的互聯(lián)網(wǎng)官方政策。
這本書首先開宗明義,提出大數(shù)據(jù)思維是指一種意識,認為公開數(shù)據(jù)一旦處理得當,就能為千百萬人急需解決的問題提供答案。比如說,通過對Google關鍵詞搜索的及時分析,我們可以通過某地增多的“頭痛、發(fā)熱”搜索關鍵語,預測下一輪禽流感的出現(xiàn)。比如,我們?nèi)绻芗皶r地監(jiān)控手機數(shù)據(jù),幾年前發(fā)生新年踩踏事故的上海警察們也許可以早一點獲得警示,在可能出事的地方提前布置警力。
大數(shù)據(jù)讓網(wǎng)絡數(shù)據(jù)服務更精準于迎和用戶的喜好,不論是愛讀的新聞,愛讀的書,愛看的電視連續(xù)劇,還是你可能會喜歡的旅游目的地,大數(shù)據(jù)都能幫你一連串兒地接龍下去。
大數(shù)據(jù)發(fā)展的核心動力來源于人類測量、記錄和分析世界的渴望,人們一直以為,信息技術的變革重點在“T”(技術,technology)上,而不是在“I”(信息,information)上,而大數(shù)據(jù)思維者認為,是時候把聚光燈打向“I”,開始關注信息本身。
他們堅信,一切皆可“量化”:當文字變成數(shù)據(jù),當方位變成數(shù)據(jù),當溝通變成數(shù)據(jù),當世間萬物數(shù)據(jù)化,我們便可以通過數(shù)據(jù)的再利用、重組數(shù)據(jù)、可擴展數(shù)據(jù)、數(shù)據(jù)的折舊值、數(shù)據(jù)廢氣、開放數(shù)據(jù)等作為進行“取之不盡,用之不竭”的數(shù)據(jù)創(chuàng)新。
2
在我們現(xiàn)在這個時代,大量信息被廉價地捕捉和記錄,數(shù)據(jù)經(jīng)常會得到被動地收集,人們無須投入太多精力甚至不需要認識這些數(shù)據(jù)。大部分數(shù)據(jù)的直接價值對收集者是顯而易見的,亞馬遜記錄下客戶購買的書藉和他們?yōu)g覽過的頁面,便可以利用這些數(shù)據(jù)來為客戶提供個性化的建議。Facebook跟蹤用戶的“狀態(tài)更新”和“喜好”,以確定最佳的廣告位從而賺取收入----這就是數(shù)據(jù)的再利用。
重組數(shù)據(jù)指將兩個或多個數(shù)據(jù)源以一種新穎的方法結合起來,比如將某個房地產(chǎn)網(wǎng)站信息和價格添加在社區(qū)地圖上,同時聚合大量信息,如社區(qū)近期交易和物業(yè)規(guī)格,以此來預測區(qū)域內(nèi)具體每套信宅的價值。促成數(shù)據(jù)再利用的方法之一,就是從一開始就設計好它的可擴展性。
比如,有些零售商在店內(nèi)安裝了監(jiān)控攝像頭,這樣不僅能認出商店扒手,還能跟蹤在商店里購物的客戶和他們停留的位置。之前,監(jiān)控報像機僅僅出于安全保衛(wèi),現(xiàn)在零售商則可以利用得到的信息設計店面的最佳布局并判斷營銷活動的有效性----監(jiān)控攝像機從一項純粹的成本支出成為了一項可以增加收入的投資。
數(shù)據(jù)折舊值和數(shù)據(jù)廢氣是值得重點講講的兩項數(shù)據(jù)創(chuàng)新。隨著數(shù)據(jù)存儲成本的大幅下降,企業(yè)擁有了更強的經(jīng)濟動機來保存數(shù)據(jù)。隨著時間的推移,大多數(shù)數(shù)據(jù)會失去一部分基本用途。比如說亞馬遜通常不會基于你十年前買的書來向你推薦,因為系統(tǒng)默認為你十年前的書你現(xiàn)在可能已經(jīng)對它不感興趣了。
亞馬遜認為舊數(shù)據(jù)的存在毀壞了新數(shù)據(jù)的價值,所以亞馬遜決定只使用仍然有生產(chǎn)價值的數(shù)據(jù),這就需要不斷更新數(shù)據(jù)庫并淘汰無用信息。然而亞馬遜發(fā)現(xiàn)僅僅依據(jù)時間來判斷顯然不夠,因此亞馬遜公司建立了復雜的模型來幫助自己分離有用和無用的數(shù)據(jù)。
比如,如果客戶瀏覽或購買了一本基于以往購買記錄而推薦的書,電子商務公司就認為這項舊的購買記錄仍然代表著客戶的喜好。這樣,他們就能夠評價舊數(shù)據(jù)的有用性,并使模型的“折舊率”更具體。
然而,并非所有數(shù)據(jù)都會貶值。有些公司提倡盡可能長時間地保存數(shù)據(jù),即使監(jiān)管部門或公眾要求它們短時間內(nèi)刪除或隱匿這些信息。比如谷歌公司一直以來都拒絕將互聯(lián)網(wǎng)協(xié)議地址從舊的搜索查詢中完全去除,它只是在一年半后刪除了最后四位數(shù)以隱匿搜索查詢。
谷歌希望得到每年的同比數(shù)據(jù),如假日購物搜索等。此外,通過了解搜索者的位置,可以幫助改善搜索結果的相關性。像很多紐約人會搜索“火雞”,但經(jīng)常會搜索到與“火雞”無關的關于“土耳其”的網(wǎng)頁,因為英文中這兩個詞拼法是一樣的。
通過算法可以將他們想查看的網(wǎng)頁放在排名靠前的位置,來方便其他紐約人查找。即使數(shù)據(jù)用于基本用途的價值會減少,但潛在價值卻依然強大。潛在價值表明,組織機構應收集盡可能多的使用數(shù)據(jù)并保存盡可能長的時間,這樣一來,由數(shù)據(jù)再利用而產(chǎn)生的任何商業(yè)價值,原始數(shù)據(jù)擁有者都能從中分一杯羹。
3
“數(shù)據(jù)廢氣” 是一個用來描述人們在網(wǎng)上留下數(shù)字軌跡的藝術詞匯,它指用戶在線交互留下的副產(chǎn)品,包括瀏覽了哪些頁面、停留了多久、鼠標光標停留的位置、輸入了什么信息等等。許多公司利用“數(shù)據(jù)廢氣”完善自己的服務和功能。
谷歌是這方面的領導者,它將不斷地“從數(shù)據(jù)中學習”這個原則應用到許多服務當中,用戶執(zhí)行的每一個動作都被認為是一個“信號”,谷歌對這些“信號”進行分析并且反聵給系統(tǒng)。“數(shù)據(jù)廢氣”成為許多電腦化服務背后的機制,如拼寫檢查、語音識別、垃圾郵件過濾、翻譯等,當用戶指出語音識別程序誤解了他們的意思時,他們實際上有效地“訓練”了這個系統(tǒng),讓它變得更好。
在Facebook早期,數(shù)據(jù)科學家們研究了“數(shù)據(jù)廢氣”的豐富信息,發(fā)現(xiàn)人們會采用某種行動如回貼、點擊圖標等,人們采取這些行動最重要的預測指標就是他們看到了周圍的朋友們也在這么做。于是Facebook馬上重新設計了它的系統(tǒng),使每個用戶的活動變得可見并廣播出去,這為網(wǎng)站的良性循環(huán)做出了新的貢獻。
漸漸的,這個想法從互聯(lián)網(wǎng)行業(yè)傳播至可以收集用戶反聵的任何公司。我們可能會認為谷歌和亞馬遜這些網(wǎng)站是大數(shù)據(jù)的先驅(qū)者,但實際上,政府才是大規(guī)模信息的原始采集者,并且還在與私營企業(yè)競爭他們所控制的大量數(shù)據(jù)。政府與私營企業(yè)數(shù)據(jù)持有之間的主要區(qū)別就是,政府可以強迫人們?yōu)樗麄兲峁┬畔?,而不必加以說服或支付報酬。
因此,政府將繼續(xù)收集和積累大量的數(shù)據(jù)。大數(shù)據(jù)對公共部門的適用性和對商業(yè)實體是一樣的:大部分的數(shù)據(jù)價值都是潛在的,需要通過創(chuàng)新的分析來釋放,但是,由于政府在獲取數(shù)據(jù)中所處的特別地位,因此他們在數(shù)據(jù)使用上往往效率很低。
4
近年來,有一個想法在歐美國家得到了公認,即提取政府數(shù)據(jù)價值最好的辦法是允許私營部門和社會大眾訪問。這種想法基于的原則是:國家收集數(shù)據(jù)時,代表的是它的公民,因此它也理應提供一個讓公民查看的入口,少數(shù)可能會危害到國家安全或他人隱私權的情況除外。
主張開放數(shù)據(jù)入口的人認為,政府只是他們所收集信息的托管人,私營部門和社會對數(shù)據(jù)的利用會比政府更具有創(chuàng)新性。開放數(shù)據(jù)倡導者呼吁建立專門的官方機構來公布民用和商業(yè)數(shù)據(jù),而且數(shù)據(jù)必須以標準的可機讀形式展現(xiàn),以方便人們處理。
2008年1月21日,奧巴馬在就職總統(tǒng)的第一天發(fā)表了一份總統(tǒng)備忘錄,命令美國聯(lián)邦機構的負責人公布盡可能多的數(shù)據(jù),奧巴馬的指令促成了data.org網(wǎng)站的建立,這便是美國聯(lián)邦政府的公開信息資料庫。這個網(wǎng)站從2009年的47個數(shù)據(jù)集迅速發(fā)展起來,到2012年7月三周年時,數(shù)據(jù)集已達到45萬個左右,涵蓋了172個機構。
英國隨后也做出實質(zhì)性轉(zhuǎn)變,以往政府信息都封鎖在英國皇家版權手中,使用起來非常困難和昂貴,而現(xiàn)在英國政府已經(jīng)頒布相關規(guī)定鼓勵信息公開,并支持創(chuàng)建萬維網(wǎng)的發(fā)明者蒂姆·伯納斯參與指導開放式數(shù)據(jù)中心。
其它國家如澳大利亞、巴西、智利等也相繼出臺了并實施了開放數(shù)據(jù)策略。一些國際組織也加入了開放數(shù)據(jù)的熱潮,如世界銀行就公開了數(shù)百個之前被限制的關于經(jīng)濟和社會指標方面的數(shù)據(jù)集。
大數(shù)據(jù)價值鏈有三大構成,分別是:第一基于數(shù)據(jù)的公司比如Twitter,第二基于技能的公司它們提供咨詢技術供應和數(shù)據(jù)分析,第三基于思維的公司,比如今日頭條這樣的公司。那么,誰在這個大數(shù)據(jù)價值鏈中獲益最大呢?答案是那些擁有大數(shù)據(jù)思維或者說創(chuàng)新性思維的人。
隨著大數(shù)據(jù)成為我們生活的一部分,大數(shù)據(jù)工具變得更容易和更方便使用,越來越多掌握這些技能,這些技能的價值就會相對減少,就像20世紀六十年代之后計算機編程變得越來越普遍一樣?,F(xiàn)在歐美之外的外包公司使得計算機編程技術越來越廉價,如今它成了世界貧困人口致富的驅(qū)動力,而不再代表著高端技術。
現(xiàn)今,我們正處在大數(shù)據(jù)時代的早期,思維和技能是最有價值的,但是最終,大部分的價值還是必須從數(shù)據(jù)本身中挖掘。在未來,我們可以利用數(shù)據(jù)據(jù)做更多的事情,而數(shù)據(jù)擁有者們也會真正意識到他們所擁有的財富。因此,他們可能會把他們手中所擁有的數(shù)據(jù)抓得更緊,也會以更高的價格將其出售。
數(shù)據(jù)就是金礦,但是讓數(shù)據(jù)主宰一切的憂慮也顯而易見,那么,在大數(shù)據(jù)時代,我們更要思考應該做什么,不應該做什么?請關注伯凡時間,會就這個話題繼續(xù)展開討論。