《時代周刊》:用形象化的老辦法對付大數(shù)據(jù)

責(zé)任編輯:editor007

2016-01-28 17:03:21

摘自:東方財富網(wǎng)

威廉-普萊費爾(William Playfair)生于1759年,在家里排行老四,父親是上進(jìn)的蘇格蘭大臣。正如普萊費爾所發(fā)現(xiàn)的那樣,超過某一界限挖掘數(shù)據(jù)意義的最佳辦法就是使數(shù)據(jù)形象化。

威廉-普萊費爾(William Playfair)生于1759年,在家里排行老四,父親是上進(jìn)的蘇格蘭大臣。他年紀(jì)輕輕便當(dāng)上瓦特的個人助理,隨后從事制圖、會計、工程、經(jīng)濟、銀匠、土地投機、記者等多種職業(yè),取得大小不等的成功。最終他在貧困中去世。

不過在此過程中,他差不多是不聲不響地一手創(chuàng)立了統(tǒng)計圖表學(xué),發(fā)明了柱狀圖、線形圖和扇形圖。1786年他出版《商業(yè)和政治地圖集》,該書以一副英國歷史進(jìn)出口圖開場,放在今天的話與本刊的排版看上去并不太脫節(jié)。用他自己的話說,“普萊費爾是將幾何原理用于財政事務(wù)之第一人”。

他生不逢時。如果他活在當(dāng)今時代,普萊費爾很可能身居硅谷一家受熱捧創(chuàng)業(yè)公司的首席數(shù)據(jù)官高位。我們周圍的世界發(fā)生著看不見但影響巨大的轉(zhuǎn)變,即從信息稀缺到信息過剩的無聲顛覆。人類進(jìn)化首先面臨的是食物短缺,如今我們卻遭受著普遍肥胖之苦。

與之大同小異的是,過去我們獲得信息很困難,現(xiàn)在到處都是海量的信息。谷歌前CEO斯密特曾經(jīng)估計,人類每兩天所創(chuàng)造的數(shù)據(jù)量就相當(dāng)于有史以來到2003年的數(shù)據(jù)量總和。他說這話是在五年前。我們從認(rèn)識上還未進(jìn)化到這一步。

估計人類創(chuàng)造的總數(shù)據(jù)量是技術(shù)人員的一大愛好。確切數(shù)字雖然各不相同,但誰都承認(rèn)大得驚人。只需想想你的智能手機就夠了:沒錯,它是一個通訊設(shè)備,但它也是把你周圍的世界轉(zhuǎn)化為數(shù)據(jù)的工具。你看到某個東西,把它拍下來或者錄下來,然后上傳到云端,以字節(jié)的方式永遠(yuǎn)存在。每一天人們發(fā)布五億條推文,在Instagram分享7000萬張照片,在Facebook觀看40億條視頻。每一分鐘我們向YouTube上傳300小時的新內(nèi)容。

創(chuàng)造數(shù)據(jù)的不僅是人。還有被稱為物聯(lián)網(wǎng)的新現(xiàn)象。汽車、自動售貨機、眼鏡、計步器等裝上傳感器和傳輸器,與云端或彼此之間通訊。這些物體也像人類一樣在數(shù)字世界留下痕跡。市場研究機構(gòu)IDC在2014年的報告中估計,數(shù)字世界的規(guī)模將從2013年的10萬億吉字節(jié)增長到2020年的44萬億或44澤字節(jié)。

我們擁有豐富的數(shù)據(jù),但從中獲得的回報卻迅速減少,因為擁有的數(shù)據(jù)越多,就越難從中挖掘出意義。頗具諷刺意味的是,信息過多差不多也像信息不足一樣難以分析和理解。于是,新技術(shù)讓我們的世界充斥著越來越多的復(fù)雜信息,我們最終就越需要有著悠久歷史的人類努力,即始終致力于使復(fù)雜的東西可以理解、從混亂中求得意義的藝術(shù),尤其是視覺藝術(shù)。

正如普萊費爾所發(fā)現(xiàn)的那樣,超過某一界限挖掘數(shù)據(jù)意義的最佳辦法就是使數(shù)據(jù)形象化。試想Instagram的海量照片。去年紐約市立大學(xué)教授曼努維奇(Lev Manovich)對來自紐約、圣保羅、柏林、曼谷、莫斯科5座城市的12萬張照片進(jìn)行了視覺分析。他和他的研究團(tuán)隊從中選取自拍照片,估計照片上的人的年齡和性別。然后他們對照片運用面部分析算法,對所有數(shù)據(jù)進(jìn)行統(tǒng)計分析,最后放到selfiecity.net制成互動圖表。

結(jié)果這些毫無意義的原始數(shù)據(jù)現(xiàn)在具有了意義。你可以按照城市、性別、心情、是否歪腦袋、是否戴眼鏡、睜開還是閉上眼睛瀏覽照片。你可以提出問題并得到答案:誰自拍用的多,男人還是女人?(答案是女人)。哪里的人笑得最多?(曼谷)哪里的老年人愛自拍?(紐約)……

如果你把數(shù)據(jù)形象化看作我們抵抗信息海洋的防洪堤,那么隨著數(shù)據(jù)日益增多,防洪堤的壓力總是不斷上升,而壓力上升又改變了數(shù)據(jù)形象化的方式和作用,這一點甚至普萊費爾也不曾料到。

形象化從對統(tǒng)計數(shù)據(jù)集的分析呈現(xiàn)發(fā)展為實時數(shù)據(jù)的不斷變化圖景。在Bostonography你可以像上帝一樣鳥瞰波士頓所有按照當(dāng)前時速進(jìn)行顏色編碼的公交車位置。Crimemapping.com實時顯示按照報案地點分類的案發(fā)地情況,用不同表情符號代表不同性質(zhì)的案件。fbomb.co網(wǎng)站提供上推特的人何時何地如何說國罵的全球?qū)崟r圖景。

從“紐約出租:生命中的一天”(NYC Taxis: A Day in the Life)可以得見美觀、免費的數(shù)據(jù)豐富性。一位名叫Chris Whong的黑客根據(jù)《信息自由法》從出租車與電召車委員會(TLC)下載50G紐約市出租車數(shù)據(jù),利用這些數(shù)據(jù)制作了2013年某一天任意出租車的路線和收入圖。你可以選擇一輛車快進(jìn)(或以正常速度——如果你有時間)觀看它在曼哈頓大街上行駛,像勤勞的小精靈吃豆子那樣在身后留下一條藍(lán)線。

數(shù)據(jù)形象化并非總是為了鬧著玩。今年4月30日在Kickstarter發(fā)布的一個眾籌項目將從OpenSecrets.org抓去競選資金數(shù)據(jù)并以多種方式自動圖像化,清楚、簡潔地顯示政治家獲得的資金數(shù)量和來源。這是超越透明性的下一個必要步驟:不僅公布信息,而且要公布該信息的意義。今年數(shù)據(jù)圖像化最引人注目、最具革命性的實驗之一是紀(jì)錄片制作人、數(shù)據(jù)專家霍洛蘭(Neil)的“二戰(zhàn)死難者”(The Fallen of World War II)互動視頻。該實驗利用圖表圖像講述歷史:表示成千上萬死難者的幾乎獨家的抽象數(shù)據(jù)形象化地帶領(lǐng)我們回顧二戰(zhàn)和“大屠殺”。

視頻六分鐘左右鏡頭急劇仰拍現(xiàn)出摩天大樓似的柱狀圖,表示前蘇聯(lián)軍隊870萬人的傷亡。初一看似乎極不可能,但隨著鏡頭回?fù)u,在二戰(zhàn)的巨大災(zāi)難中又合情合理。在這種不動聲色的敘述中,人類的死亡更顯觸目驚心。

之后的視頻同樣攝影手法反復(fù)出現(xiàn):冷冰冰的抽象數(shù)據(jù)變?yōu)橐曈X藝術(shù),讓我們感同身受,增加知識。現(xiàn)階段人類遭遇普萊費爾也發(fā)現(xiàn)無法理解的海量數(shù)據(jù)。我們也覺得數(shù)據(jù)多得無法理解,而這些數(shù)據(jù)又可能使得我們的世界不可理解。不過我們并非毫無辦法。信息不僅需要自由,它還需要看得見摸得著。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號-6京公網(wǎng)安備 11010502049343號