大數(shù)據(jù)時(shí)代下的新科研

責(zé)任編輯:editor004

2014-11-06 11:12:39

摘自:科技日?qǐng)?bào)

“大數(shù)據(jù)的概念聽(tīng)上去和云計(jì)算一樣,有些‘高大上’,但是大數(shù)據(jù)絕不是一個(gè)空泛的口號(hào),事實(shí)上它不僅改變了人們的生存面貌,更為科學(xué)研究帶來(lái)重大的機(jī)遇?!崩杞ㄝx說(shuō),“在商業(yè)領(lǐng)域,數(shù)據(jù)集  市作為在云計(jì)算技術(shù)支持下的數(shù)據(jù)共享、交換與交易的模式,在國(guó)內(nèi)外呈現(xiàn)快速發(fā)展的趨勢(shì)。

“大數(shù)據(jù)的概念聽(tīng)上去和云計(jì)算一樣,有些‘高大上’,但是大數(shù)據(jù)絕不是一個(gè)空泛的口號(hào),事實(shí)上它不僅改變了人們的生存面貌,更為科學(xué)研究帶來(lái)重大的機(jī)遇。”中國(guó)科學(xué)院遙感與數(shù)字地球所研究員郭華東說(shuō)。

依托海量的數(shù)據(jù)狀態(tài)和云級(jí)別的數(shù)據(jù)處理能力,大數(shù)據(jù)以其Volume(大量)、Velocity(高速)、Variety(多樣)、Veracity(真實(shí))的4V特點(diǎn),帶來(lái)了一場(chǎng)全方位的思維變革、產(chǎn)業(yè)變革和管理變革。郭華東表示:“它把我們的科學(xué)研究各個(gè)領(lǐng)域以及各個(gè)環(huán)節(jié)都推到了一個(gè)前所未有的‘大數(shù)據(jù)時(shí)代’。”近日,以“科學(xué)大數(shù)據(jù)的前沿問(wèn)題”為主題的第507次香山科學(xué)會(huì)議在北京香山飯店舉行,會(huì)議邀請(qǐng)了來(lái)自全國(guó)各地多學(xué)科跨領(lǐng)域的專(zhuān)家學(xué)者,共同探討大數(shù)據(jù)時(shí)代下科學(xué)研究的基礎(chǔ)設(shè)施、創(chuàng)新模式與共享機(jī)制以及人才培養(yǎng)等問(wèn)題。

大數(shù)據(jù)讓科研面臨新挑戰(zhàn)

在中國(guó)科學(xué)院計(jì)算機(jī)網(wǎng)絡(luò)信息中心主任黃向陽(yáng)看來(lái),計(jì)算機(jī)技術(shù)、以互聯(lián)網(wǎng)為代表的通信技術(shù)和以物聯(lián)網(wǎng)為代表的傳感技術(shù)的持續(xù)創(chuàng)新和廣泛應(yīng)用使人類(lèi)的數(shù)據(jù)化能力和范圍快速擴(kuò)張。“以大科學(xué)裝置為代表的機(jī)構(gòu)內(nèi)部產(chǎn)生的數(shù)據(jù)量能夠被測(cè)量和記錄的越來(lái)越多,而我們對(duì)事物、現(xiàn)象等的測(cè)量、記錄也更加頻繁和細(xì)致。”他說(shuō)。

“如今,這種擴(kuò)張讓我們看到大量從宏觀(guān)到微觀(guān)、從自然到社會(huì)的觀(guān)察,計(jì)算、傳播等儀器設(shè)備和活動(dòng)都在快速產(chǎn)生著海量、多樣的數(shù)據(jù)。”黃向陽(yáng)說(shuō),“比如高通量科學(xué)儀器、望遠(yuǎn)鏡、衛(wèi)星、加速器、傳感器網(wǎng)絡(luò)、醫(yī)療成像設(shè)備、測(cè)序儀等各種科研儀器和裝置、模擬方法、智能終端以及各種應(yīng)用等,這些都使得科研領(lǐng)域被推到了一個(gè)前所未有的‘大數(shù)據(jù)’時(shí)代。”

海量數(shù)據(jù)的劇增,勢(shì)必讓量變引起質(zhì)變,黃向陽(yáng)表示,不斷增加的數(shù)據(jù)引發(fā)人們思維和行為模式的變革,而在科學(xué)研究領(lǐng)域,這也將直接為科研模式帶來(lái)極大的改變。“繼實(shí)驗(yàn)科學(xué)、理論科學(xué)、計(jì)算科學(xué)之后出現(xiàn)了第四種研究范式,即‘數(shù)據(jù)密集型科學(xué)’,成為大數(shù)據(jù)時(shí)代下的新模式。”

“我們有理由相信,大數(shù)據(jù)為科學(xué)研究帶來(lái)了重大機(jī)遇,比如當(dāng)所能利用的數(shù)據(jù)增加時(shí),人們將可以做很多在小數(shù)據(jù)基礎(chǔ)上無(wú)法完成的事情。”黃向陽(yáng)說(shuō)。

取之于科學(xué)用之于科學(xué)

中國(guó)科學(xué)院高能物理研究所計(jì)算中心主任陳剛說(shuō):“中國(guó)的髙能物理實(shí)驗(yàn)每年產(chǎn)生的數(shù)據(jù)也達(dá)到PB級(jí)(百萬(wàn)GB級(jí)——編者注)。高能物理實(shí)驗(yàn)是典型的大科學(xué)裝置和大科學(xué)研究項(xiàng)目,這意味著跨國(guó)家跨地域的國(guó)際合作。這樣的大科學(xué)項(xiàng)目需要將實(shí)驗(yàn)數(shù)據(jù)收集和存儲(chǔ)起來(lái),并通過(guò)高速網(wǎng)絡(luò)分發(fā)給處于不同國(guó)家或機(jī)構(gòu)的合作者。這對(duì)高速網(wǎng)絡(luò)提出了巨大挑戰(zhàn)。”陳剛表示,正因如此,高能物理需要建設(shè)專(zhuān)用高速網(wǎng)絡(luò)并采用新的網(wǎng)絡(luò)技術(shù)來(lái)實(shí)現(xiàn)數(shù)據(jù)的全球共享。

“通俗的說(shuō),科學(xué)大數(shù)據(jù)是科學(xué)工程研究中的海量數(shù)據(jù)。”中國(guó)科學(xué)院遙感與數(shù)字地球研究所研究員王力哲說(shuō)。在他看來(lái),大數(shù)據(jù)“無(wú)處不在,且蘊(yùn)含著巨大的經(jīng)濟(jì)價(jià)值”,它既是一門(mén)多學(xué)科融合的一個(gè)交叉學(xué)科,也在反過(guò)來(lái)影響和改變著更多的科學(xué)領(lǐng)域。

王力哲以我國(guó)人口密度對(duì)比線(xiàn)——“胡煥庸線(xiàn)”的形成機(jī)理分析作為一個(gè)實(shí)例來(lái)解釋科學(xué)大數(shù)據(jù)知識(shí)發(fā)現(xiàn)的理論方法:“‘胡煥庸線(xiàn)’的形成涉及多方面自然、社會(huì)、經(jīng)濟(jì)因素的影響,個(gè)體空間行為—空間過(guò)程—空間格局的相互作用機(jī)理模型極其復(fù)雜;這項(xiàng)研究伴隨著超長(zhǎng)序列的海量空間數(shù)據(jù)和社會(huì)經(jīng)濟(jì)數(shù)據(jù),包括地理、氣候、遙感、 人口、工農(nóng)業(yè)生產(chǎn)、資源、環(huán)境、商業(yè)、教育、交通等等。”他表示,“而空間大數(shù)據(jù)時(shí)代的到來(lái),使用超長(zhǎng)時(shí)空序列的、多源、異構(gòu)的自然、社會(huì)、經(jīng)濟(jì)空間大數(shù)據(jù),進(jìn)行空間大數(shù)據(jù)分析和知識(shí)發(fā)現(xiàn),能夠?yàn)檠芯?lsquo;胡煥庸線(xiàn)’形成機(jī)理進(jìn)而為‘新型城鎮(zhèn)化建設(shè)’這一重大國(guó)家需求提供理論決策支持。”

在天文領(lǐng)域,大數(shù)據(jù)也在為挖掘有價(jià)值的信息及規(guī)律發(fā)揮著重要的作用。中國(guó)科學(xué)院國(guó)家天文臺(tái)研究員趙永恒說(shuō):“隨著全球各個(gè)大型巡天觀(guān)測(cè)項(xiàng)目的開(kāi)展,天文學(xué)研究的模式正在從以往的小樣本向著大數(shù)據(jù)模式轉(zhuǎn)變,海量的天文數(shù)據(jù)給天文學(xué)家?guī)?lái)了巨大的機(jī)遇和挑戰(zhàn),天文學(xué)的研究也越來(lái)越離不開(kāi)大數(shù)據(jù)集的統(tǒng)計(jì)分析,即數(shù)據(jù)挖掘和知識(shí)發(fā)現(xiàn)。”

他表示,現(xiàn)如今,對(duì)這些海量天文大數(shù)據(jù)進(jìn)行數(shù)據(jù)處理與分析已經(jīng)超越了當(dāng)前的計(jì)算能力。“如何對(duì)天文大數(shù)據(jù)進(jìn)行高效和及時(shí)的處理從而加速天文學(xué)研究的科學(xué)產(chǎn)出已成為天文觀(guān)測(cè)和天文研究迫切需要解決的難題,而大數(shù)據(jù)無(wú)疑可以幫助天文學(xué)家重新審視和了解我們的宇宙。”

大數(shù)據(jù)管理帶來(lái)新思考

盡管大數(shù)據(jù)時(shí)代的到來(lái)為諸多科研領(lǐng)域帶來(lái)新的曙光,然而如何將科學(xué)數(shù)據(jù)變成創(chuàng)新資源,并在數(shù)據(jù)共享的積極作用下有效保障國(guó)家安全與個(gè)人隱私,成為人們關(guān)心的話(huà)題。

“尤其像現(xiàn)在,科學(xué)數(shù)據(jù)的應(yīng)用邊界,已經(jīng)從傳統(tǒng)的科研和教育領(lǐng)域,向社會(huì)經(jīng)濟(jì)和商業(yè)領(lǐng)域延伸,因此這仍然是一個(gè)復(fù)雜的、系統(tǒng)的問(wèn)題。”中科院網(wǎng)絡(luò)信息中心科學(xué)數(shù)據(jù)中心主任黎建輝說(shuō)。

據(jù)他介紹,為此,國(guó)際國(guó)內(nèi)均在做一些有益的探索和嘗試。“在學(xué)術(shù)領(lǐng)域,新的數(shù)據(jù)出版模式正在逐步形成。”黎建輝說(shuō),“在商業(yè)領(lǐng)域,數(shù)據(jù)集

市作為在云計(jì)算技術(shù)支持下的數(shù)據(jù)共享、交換與交易的模式,在國(guó)內(nèi)外呈現(xiàn)快速發(fā)展的趨勢(shì)。”

在浩瀚的數(shù)據(jù)海洋里挖掘和捕捉能夠推動(dòng)人類(lèi)進(jìn)步的信息,與此同時(shí)還要保障一系列的數(shù)據(jù)安全隱患,在復(fù)旦大學(xué)上海數(shù)據(jù)科學(xué)實(shí)驗(yàn)室主任朱揚(yáng)勇看來(lái),培養(yǎng)數(shù)據(jù)科學(xué)家十分重要。“這里說(shuō)的是數(shù)據(jù)科學(xué)家而非傳統(tǒng)的信息科學(xué)家,他們關(guān)注對(duì)數(shù)據(jù)現(xiàn)象和規(guī)律的研究,并開(kāi)始出現(xiàn)在領(lǐng)先的企業(yè)和大學(xué)中,發(fā)揮著他們的巨大作用。”

合格的大數(shù)據(jù)人才需要具備哪些品質(zhì)?王力哲表示:“數(shù)據(jù)科學(xué)是一個(gè)多學(xué)科融合的交叉學(xué)科;數(shù)據(jù)科學(xué)是以數(shù)據(jù)為研究對(duì)象,以信息論、統(tǒng)計(jì)學(xué)、數(shù)據(jù)理論、數(shù)學(xué)分析等理論為研究手段,以獲取海量數(shù)據(jù)中蘊(yùn)含的知識(shí)為目標(biāo)的一門(mén)學(xué)科。” 也正因此,他認(rèn)為從事大數(shù)據(jù)研究勢(shì)必應(yīng)該是復(fù)合型人才。

“除此之外,他還要關(guān)注國(guó)際數(shù)據(jù)科學(xué)領(lǐng)域熱點(diǎn)議題,關(guān)心數(shù)據(jù)及其涉及的一系列政策、標(biāo)準(zhǔn)、技術(shù)、方法和國(guó)際發(fā)展態(tài)勢(shì)。”中國(guó)科學(xué)院地理科學(xué)與資源研究所研究員劉闖表示,“世界性的數(shù)據(jù)科學(xué)領(lǐng)域?qū)W術(shù)帶頭人正在一些熱點(diǎn)議題中涌現(xiàn)出來(lái)。”

她認(rèn)為,數(shù)據(jù)領(lǐng)域國(guó)家化人才還應(yīng)對(duì)數(shù)據(jù)領(lǐng)域熱點(diǎn)問(wèn)題把握準(zhǔn)確,有一定超前的戰(zhàn)略思想,并在這些問(wèn)題上有“開(kāi)放的、獨(dú)特的學(xué)術(shù)業(yè)績(jī)”。

“我國(guó)在數(shù)據(jù)領(lǐng)域培養(yǎng)國(guó)家化人才方面與大國(guó)地位差距甚遠(yuǎn),特別是一些關(guān)鍵性領(lǐng)域尚屬空白。在這個(gè)方面,我們還有很多工作要做。”劉闖說(shuō)。

聲音連線(xiàn)

大數(shù)據(jù)或許可以“創(chuàng)造大腦”

10月26日,由復(fù)旦大學(xué)主辦的浦江創(chuàng)新論壇·未來(lái)科學(xué)論壇上,多位國(guó)內(nèi)外頂尖科學(xué)家齊聚一堂,圍繞“關(guān)注未來(lái):拓展認(rèn)知的疆界”這一主題,就當(dāng)今時(shí)代科學(xué)發(fā)展最具吸引力的重大領(lǐng)域展開(kāi)了精彩的討論。

據(jù)中新社報(bào)道,中國(guó)科學(xué)院院士,北京航空航天大學(xué)校長(zhǎng)懷進(jìn)鵬在論壇上公布了一個(gè)有趣的科學(xué)設(shè)想:大數(shù)據(jù)也許可以“創(chuàng)造大腦”。從神經(jīng)科學(xué)來(lái)認(rèn)知腦,也許通過(guò)數(shù)據(jù)人類(lèi)可以創(chuàng)造一個(gè)腦。孩子學(xué)習(xí)識(shí)物的時(shí)候,不需要一兩百?gòu)?、而是通過(guò)20張左右的圖片,他就能學(xué)會(huì)區(qū)別什么是馬,什么是牛,什么是車(chē),這與大數(shù)據(jù)識(shí)別有著相似之處。

懷進(jìn)鵬設(shè)想,通過(guò)研究從數(shù)據(jù)科學(xué)到電腦到智腦的演化,也許能從無(wú)數(shù)據(jù)到大數(shù)據(jù)建立人腦圖譜,在移動(dòng)計(jì)算和現(xiàn)有的大數(shù)據(jù)當(dāng)中嘗試“創(chuàng)造大腦”,創(chuàng)造一個(gè)部分的功能或者仿真一個(gè)功能,使電腦向智腦轉(zhuǎn)換。

今天的時(shí)代是一個(gè)用戶(hù)產(chǎn)生內(nèi)容的時(shí)代,但是對(duì)于大數(shù)據(jù)的運(yùn)用,基本還停留在淺顯的層面,如通過(guò)網(wǎng)頁(yè)瀏覽量數(shù)據(jù)分析用戶(hù)的喜好、需求等。更多的數(shù)據(jù)依然是無(wú)序、不可被分析的狀態(tài)。

懷進(jìn)鵬說(shuō),如果能建立一種智能模式,“教會(huì)”電腦掌握從數(shù)據(jù)的無(wú)序到有序關(guān)聯(lián),以便認(rèn)識(shí)人的一部分世界,通過(guò)建立一系列融合關(guān)聯(lián),讓電腦學(xué)會(huì)構(gòu)成一個(gè)時(shí)間段的社會(huì)理解,用芯片或者機(jī)器創(chuàng)造“一天的宇宙”。

加入電腦能夠形成跨語(yǔ)言之間的遷移學(xué)習(xí),最后形成自主生長(zhǎng)和所派生的復(fù)雜結(jié)構(gòu)下相互數(shù)據(jù)、信息和知識(shí)之間的關(guān)聯(lián),以便對(duì)智腦的理解有附加的幫助,在這樣的方式下通過(guò)數(shù)據(jù)分析出傳播學(xué)、社會(huì)學(xué)的新特征?;蛟S還可以了解人是如何學(xué)習(xí)和記憶的,如何認(rèn)知和增長(zhǎng)智力、形成自主學(xué)習(xí)的,甚至了解情感形成的過(guò)程。

“也許通過(guò)數(shù)據(jù),我們可以創(chuàng)造一個(gè)腦,因?yàn)榛跀?shù)據(jù)的科學(xué)可以使得機(jī)器更聰明,也可以使得社會(huì)更理性。”懷進(jìn)鵬展望說(shuō)。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號(hào)-6京公網(wǎng)安備 11010502049343號(hào)