穹頂之上:未來(lái)大數(shù)據(jù)時(shí)代中的高級(jí)數(shù)據(jù)學(xué)

責(zé)任編輯:editor007

作者:花滿樓

2015-03-03 17:35:27

摘自:Medium

為了充分實(shí)現(xiàn)大數(shù)據(jù)所能帶給人類的福祉,我們必須將社會(huì)學(xué)以及一切與人類有關(guān)的學(xué)問(wèn)重視起來(lái),將其置于與數(shù)學(xué)以及計(jì)算科學(xué)同等重要的位置上。

大數(shù)據(jù)

為了充分實(shí)現(xiàn)大數(shù)據(jù)所能帶給人類的福祉,我們必須將社會(huì)學(xué)以及一切與人類有關(guān)的學(xué)問(wèn)重視起來(lái),將其置于與數(shù)學(xué)以及計(jì)算科學(xué)同等重要的位置上。

21 世紀(jì),這是一個(gè)多么適合上演奇跡的時(shí)代,不僅僅是因?yàn)樗菀兹?shí)現(xiàn)人們?cè)?jīng)的夢(mèng)想,更是因?yàn)樵谥T多科技和媒體領(lǐng)域,人們普遍都感覺到自己已經(jīng)被其進(jìn)步的速度帶得飛離地面,覺得每一個(gè)今天都已然成了明天。毫無(wú)疑問(wèn),我們已經(jīng)生活在了大數(shù)據(jù)的時(shí)代,人類歷史截止到 2010 年所產(chǎn)生的所有數(shù)據(jù),匯集起來(lái),將我們推向了一個(gè)更加壯闊宏偉的大數(shù)據(jù)的未來(lái)。

我的夢(mèng)想,是希望擁抱一個(gè)充滿了更多具有明確意義數(shù)據(jù)的時(shí)代中。為了實(shí)現(xiàn)這一點(diǎn),我們應(yīng)該對(duì)數(shù)據(jù)進(jìn)行收集、分類、分析、解讀、并將其聯(lián)系組合起來(lái)。我們更要將數(shù)據(jù)視覺化,能夠更加明確的表達(dá)出來(lái),要讓人們更加方便地進(jìn)入數(shù)據(jù)。但是如今,那些所謂的「數(shù)據(jù)科學(xué)家」,更加傾向于在數(shù)學(xué)領(lǐng)域舞槍弄棒,他們普遍擁有計(jì)算機(jī)科學(xué)背景,卻無(wú)法真正充分實(shí)現(xiàn)大數(shù)據(jù)所蘊(yùn)含的潛力。

在我們開始對(duì)真正的大數(shù)據(jù)進(jìn)行解讀之前,讓我先來(lái)澄清我口中的「大數(shù)據(jù)」的概念,它反映出來(lái)了兩個(gè)各自獨(dú)立,卻又相互聯(lián)系的概念。

第一層的 data,小寫的 data,復(fù)數(shù)的 data。它是所有我們理解和衡量這個(gè)世界以及我們自身,有關(guān)定量乃至定性的范疇。

第二曾的 Data,大寫的 Data,也是單數(shù)的 Data。這個(gè)數(shù)據(jù)比所有的部分集合到一起更加的綜合龐大,這是所有一個(gè)將結(jié)果和行動(dòng)打包起來(lái)的集合概念,直接對(duì)結(jié)果和行動(dòng)之間的關(guān)系提供解釋。

除了單純的收集、儲(chǔ)存、分類這些數(shù)據(jù)之外,我想說(shuō)將數(shù)據(jù)情景化、故事化、視覺化同樣是非常重要的工具,有助于我們來(lái)了解和描述事物之間的關(guān)系。而在這些工具之間的相互轉(zhuǎn)換、組合、搭配,才是真正數(shù)據(jù)學(xué)的奧義所在。更重要的是,數(shù)據(jù)學(xué)并不僅僅簡(jiǎn)單的指代某種存儲(chǔ)、命令、以及解讀數(shù)字的能力,它更不可能是單單靠一個(gè)人就能夠辦到的事。

從供給方入手,這是在產(chǎn)出的每一個(gè)步驟環(huán)節(jié)都涉及大數(shù)據(jù)整合利用的過(guò)程,而在消費(fèi)方的角度來(lái)看,它只看到最終產(chǎn)品的適用性。無(wú)論哪一方,大數(shù)據(jù)之于他們,就意味著要在生產(chǎn)和消費(fèi)的過(guò)程中不斷地去深刻理解和解決各種深層次的問(wèn)題,這其中包括了戰(zhàn)略方向、數(shù)據(jù)收集、過(guò)濾、分析、以及演示。

如果要總結(jié)現(xiàn)狀的話,應(yīng)該是這樣的:那是我們想要去測(cè)量的東西,但是不知道該收集什么數(shù)據(jù)。那是我們想要收集的數(shù)據(jù),但是我們不知道該如何收集;即便我們已經(jīng)收集到了我們想要的數(shù)據(jù),但是因?yàn)樗鼈儾皇菧?zhǔn)確的所以無(wú)法真正投入應(yīng)用;更無(wú)法對(duì)其進(jìn)行解讀;如果我們錯(cuò)誤解讀了這些數(shù)據(jù),就會(huì)產(chǎn)生太多雜亂的聲音和誤導(dǎo)人的信號(hào);之所以我們會(huì)錯(cuò)誤的解讀,是因?yàn)槲覀儫o(wú)法正確的對(duì)數(shù)據(jù)之間的關(guān)系進(jìn)行分類,無(wú)法分清楚什么是相互關(guān)聯(lián)影響,什么又是因果關(guān)系;進(jìn)而我們想要利用這樣的數(shù)據(jù)成為行事的依據(jù),就在一開始埋下了錯(cuò)誤的根源。

如果我們沒(méi)有形成、并且掌握真正的數(shù)據(jù)學(xué),我們很有可能遭遇一下的狀況:我們不收集它;我們忽視它、我們看著它,卻不知道應(yīng)用;我們錯(cuò)誤地應(yīng)用;我們從中提取出來(lái)錯(cuò)誤的信息,我們?yōu)榱酥С皱e(cuò)誤的觀點(diǎn),強(qiáng)行扭曲它使之成為有力的佐證。

而即將出現(xiàn)的高級(jí)數(shù)據(jù)學(xué)就能夠幫我們解決上述的問(wèn)題?,F(xiàn)如今,每一個(gè)人都能夠張口就給出幾個(gè)數(shù)據(jù),或者將其編進(jìn)一個(gè)巨大的 EXCEL 表格,但是我們僅僅止步于此,面對(duì)成噸的數(shù)據(jù),我們提取不出來(lái)任何有意義的信息。如果在這穹頂之上,能夠真正納入以下三個(gè)方面,那才真正能夠?qū)崿F(xiàn)高級(jí)數(shù)據(jù)學(xué)的內(nèi)涵和意義:分別為「情境化」、「敘述」、「設(shè)計(jì)以及視覺化」。下面進(jìn)行分別的介紹:

「情境化」意味著一個(gè)將所發(fā)現(xiàn)的數(shù)據(jù)置于合理的角度,使之與周遭能夠聯(lián)系起來(lái)的過(guò)程。

「情境化」在之前往往是社會(huì)學(xué)領(lǐng)域使用的一款工具。無(wú)論是社會(huì)學(xué)家、人類學(xué)家、經(jīng)濟(jì)學(xué)家、政治學(xué)家、心理學(xué)家、地質(zhì)學(xué)家家、歷史學(xué)家、考古學(xué)家,都在利用這個(gè)工具更好的理解他們所掌握的一切,面對(duì)學(xué)科內(nèi)種種的存疑提供盡可能準(zhǔn)確、合理的解釋。同樣,心理學(xué)、文學(xué)、宗教、藝術(shù)、歷史、文化、以及語(yǔ)言在理解和記錄我們的世界的過(guò)程中,自然而然實(shí)現(xiàn)了我們所說(shuō)的「情境化」。

即便之前有了這么多領(lǐng)域的研究和應(yīng)用,但是「情境化」依然沒(méi)有被納入到數(shù)據(jù)分析和挖掘的范疇中,更別說(shuō)數(shù)據(jù)在收集之后所形成的決策上了。專注于去細(xì)分性別、姓名、教育背景、種族、宗教、家族歷史、個(gè)人經(jīng)歷以及地理位置之間到底有著怎樣的區(qū)別,這是「情境化」的關(guān)鍵。

如果將社會(huì)學(xué)中的研究方法和框架抽離出來(lái),應(yīng)用到數(shù)據(jù)學(xué)上,那么就能夠回答以下這些關(guān)鍵問(wèn)題:

是誰(shuí)創(chuàng)造了數(shù)據(jù),基于何種原因,在何種條件之下,有怎樣的目的?在「數(shù)據(jù)抽離」的過(guò)程中,存在著哪些阻礙,切入點(diǎn),以及背景前提影響著「數(shù)據(jù)抽離」本身?

是誰(shuí)在收集、分析、解讀、解釋、以及視覺化這些數(shù)據(jù)?他們的目標(biāo)是什么?看得見和看不見的偏見又是什么?他們?cè)谶M(jìn)入這個(gè)領(lǐng)域時(shí)都擁有怎樣的個(gè)人背景?

誰(shuí)是最終受眾?你究竟能夠找到怎樣的方式,將你的研究成果能夠更好地讓這些受眾理解,如果他們不理解、不認(rèn)同的話你該怎么辦?

現(xiàn)代思潮、地理位置、以及受眾本身的個(gè)人信仰,這些東西將如何作用于上述的交流過(guò)程中?是否會(huì)影響他們理解你的觀點(diǎn)?

「敘述」,是一種能夠通過(guò)故事表達(dá),從而完成解釋、說(shuō)服以及激勵(lì)等作用的藝術(shù)。

敘述有很多形式,比如電影、廣播、報(bào)告等等。至于回到我們的數(shù)據(jù)學(xué)應(yīng)用范疇,那么我希望將其定義稍微往外面擴(kuò)展一些,將講述故事的源頭轉(zhuǎn)移到數(shù)據(jù)上面。

自從文明誕生以來(lái),我們就非常重視這種講述的技巧,你可以在教育系統(tǒng)中看到,公眾演講中看到,甚至在自我表達(dá)中都能見識(shí)到這種技巧。所以,讓數(shù)據(jù)變得更加有意義的重要方面之一,就是要讓數(shù)據(jù)轉(zhuǎn)化為更加富有情節(jié)和感染力的敘述。別再待在冷冰冰的數(shù)字殿堂里面轉(zhuǎn)悠了,去找那些會(huì)講故事的人,去找那些英文專業(yè)畢業(yè)的文科生,哲學(xué)家,讓他們來(lái)審視你的數(shù)據(jù),他們會(huì)說(shuō)出你完全想不到的另外一種解讀方式。在此,我特別想引用 Google 公司曾經(jīng)的哲學(xué)家,戴蒙·赫洛維茲(Damon Horowitz)博士曾經(jīng)說(shuō)過(guò)的一段話。他擁有哥倫比亞大學(xué)的文學(xué)學(xué)士學(xué)位、麻省理工大學(xué)媒體實(shí)驗(yàn)室的理科碩士學(xué)位、以及斯坦福大學(xué)的哲學(xué)博士學(xué)位。他是這么說(shuō)的:

如果真的想要在人工智能領(lǐng)域獲得成就,我想最重要的一步并非是再建起一個(gè)什么人工智能中心實(shí)驗(yàn)室,真正應(yīng)該做的是要去打造一個(gè)表現(xiàn)更加理想的思想者,在這個(gè)目的驅(qū)使下,我們應(yīng)該去學(xué)習(xí)哲學(xué)。我很高興自己能夠辭掉科技公司的職位,跑去學(xué)了個(gè)哲學(xué)專業(yè)的博士回來(lái)。這是我有生所做的最正確的決定之一。

「設(shè)計(jì)」,是一個(gè)將復(fù)雜的事物變得易于理解的過(guò)程。

設(shè)計(jì)是一個(gè)用于交流的奇妙工具,它能化腐朽為神奇。一個(gè)完全沒(méi)有接受過(guò)教育的人,在面對(duì)精美設(shè)計(jì)的時(shí)候,是可以完全感知并接收到信息的。設(shè)計(jì)所擁有的簡(jiǎn)潔、親和、示范性、以及其目的性,使得它能夠讓數(shù)據(jù)發(fā)揮更大的作用。自從人類早期,設(shè)計(jì)就成為人們將抽象概念和想法轉(zhuǎn)換成具體信息的一種方式,比如他們用顏料涂抹在洞穴的墻壁上。它是我們?nèi)怂猿蔀槿说木唧w體現(xiàn)。維克托·帕涅克(Victor Papanek)在他 1971 年發(fā)表的書《Design for the Real World》里面這么說(shuō)道:所謂設(shè)計(jì)的關(guān)鍵就是研究它是如何與人交互的方式。從這個(gè)意義上來(lái)說(shuō),將設(shè)計(jì)的學(xué)問(wèn)融入到大數(shù)據(jù)中,將進(jìn)一步發(fā)揮大數(shù)據(jù)造福世界的能力!

穹頂之上,它不僅僅意味著數(shù)字的堆砌和排列,而關(guān)鍵是如何去使用它們!

數(shù)據(jù)從目前來(lái)看,并不能稱得上有趣。但是在設(shè)計(jì)和視覺化的幫助下,它是可以做到這一點(diǎn)的。當(dāng)我們將 Data (大寫的數(shù)據(jù))與故事和意愿相結(jié)合,我們會(huì)變得更加優(yōu)秀,聰慧,敏捷,并且能夠做出更加有效的預(yù)見性決策。當(dāng)我們?cè)诿鎸?duì)受眾的時(shí)候能夠拿出足夠的簡(jiǎn)潔、用心、以及同情,我們會(huì)獲得更多的目光,更多的人會(huì)愿意加入進(jìn)來(lái)。如果我們能夠收集正確的數(shù)據(jù),過(guò)濾、分析以及通過(guò)某種智能的方式將其情境化,在基于某種邏輯的前提下去敘述它們,并且使之視覺化,那么無(wú)論是小寫的 data,又或者大寫的 Data,都能夠在社會(huì)的各個(gè)層面轉(zhuǎn)化成更加有用的事物。

當(dāng)“數(shù)據(jù)學(xué)”升級(jí)為“高級(jí)數(shù)據(jù)學(xué)”,其中包括了以上三個(gè)層面的知識(shí):“情境化”、“敘述”和“設(shè)計(jì)”。那么我們的社會(huì),無(wú)論是政府政策、體育、金融、醫(yī)療、經(jīng)濟(jì)、商業(yè)、又或者是政治或者教育,都將被它改造。在這個(gè)轉(zhuǎn)變的過(guò)程中,越來(lái)越多的人將帶著自己的知識(shí)背景加入進(jìn)來(lái)。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號(hào)-6京公網(wǎng)安備 11010502049343號(hào)