天文學(xué)是最早的數(shù)據(jù)驅(qū)動學(xué)科,云計算與大數(shù)據(jù)技術(shù)是制約學(xué)科發(fā)展的關(guān)鍵因素。除了海量天文數(shù)據(jù),在線服務(wù)、軟件工具、數(shù)據(jù)處理系統(tǒng)、分析挖掘環(huán)境等也都是推動天文科研、科普的重要因素。
海量的數(shù)據(jù)與先進(jìn)的信息技術(shù)“融合”,在天文學(xué)領(lǐng)域結(jié)出碩果的同時,將在更廣闊的空間發(fā)揮引領(lǐng)和示范作用。比如,分布式海量數(shù)據(jù)存儲、大規(guī)模計算、新一代應(yīng)用架構(gòu)、機器學(xué)習(xí)和人工智能等方面的技術(shù),幫助中國科學(xué)院國家天文臺逐步實現(xiàn)數(shù)據(jù)資源上云,其中包括在貴州最新落成的FAST(中國天眼)觀測的數(shù)據(jù)。
FAST是由中國人創(chuàng)造的世界上最大的單口徑射電望遠(yuǎn)鏡,它為我國天文學(xué)研究者提供了先進(jìn)的儀器設(shè)備,同時也帶來了海量大數(shù)據(jù)。有統(tǒng)計顯示,F(xiàn)AST進(jìn)入正式科學(xué)觀測后,每天將產(chǎn)生高達(dá)50TB的數(shù)據(jù)。
在FAST早期觀測時,國家天文臺采用的是漂移掃描的觀測模式,這個模式有一個19波束的接收機,帶寬400兆赫茲,通過1G的頻率進(jìn)行采集,它的原始數(shù)據(jù)的產(chǎn)生率是38個GB每秒,壓縮后會小到原來的1/5到1/6,也就是大約6個GB每秒。
國內(nèi)除了FAST,還有“悟空”衛(wèi)星等,在國際上我國也有很多大型天文望遠(yuǎn)鏡觀測項目,如跨越南非和澳大利亞的一平方千米的天線陣,據(jù)稱它的原始數(shù)據(jù)產(chǎn)生率將會超過十個PB每秒,將超過目前全球互聯(lián)網(wǎng)的帶寬,這都將給天文學(xué)帶來海量數(shù)據(jù)。
人類從哪里來,宇宙有哪些奧秘,這些其實是生命起源的最基本問題。研究這些基本問題的天文學(xué)是一個開放的學(xué)科,數(shù)據(jù)都向全世界開放共享。國際合作是天文學(xué)的“基因”,天文大數(shù)據(jù)將大大推動計算科學(xué)的發(fā)展。云計算技術(shù)發(fā)展到一定程度,世界上就會有更多人可以參與到人類這些基本問題的研究中來,產(chǎn)生全球共享的效應(yīng)。
以郭守敬望遠(yuǎn)鏡為例,它是我國天文學(xué)領(lǐng)域第一個國家大科學(xué)工程項目,也是世界上光譜巡天效率最高的望遠(yuǎn)鏡。自2009年落成以來,已經(jīng)獲得超過700萬天體的光譜,是世界上最大的天體光譜庫。目前,郭守敬望遠(yuǎn)鏡的產(chǎn)品數(shù)據(jù)已經(jīng)完成上云,并通過對外公開數(shù)據(jù)發(fā)布網(wǎng)站向全世界開放。上云完成后,將大大提升郭守敬望遠(yuǎn)鏡觀測數(shù)據(jù)的顯示度和利用率。
在大數(shù)據(jù)時代,如何訪問和使用這些海量的信息成為了全世界天文學(xué)家面臨的難題。虛擬天文臺之父、美國約翰·霍普金斯大學(xué)的Alex Szalay教授提出了“虛擬天文臺”的設(shè)想。
虛擬天文臺是通過信息技術(shù),將全球范圍內(nèi)的天文數(shù)據(jù)無縫透明連接在一起,從而形成數(shù)據(jù)密集型網(wǎng)絡(luò)化天文研究與科普教育的平臺。多年來,我也一直致力于中國虛擬天文臺的研究和建設(shè)。
由中國虛擬天文臺與微軟研究院合作完成的“WWT北京社區(qū)”,成為了WWT官方中文門戶,正為全球的中文用戶提供各種信息和資源。
大數(shù)據(jù)時代,虛擬天文臺拉近了公眾與宇宙之間的距離,而中國虛擬天文臺和星明天文臺推出的“公眾超新星搜尋項目”,則為普通公眾在欣賞宇宙之美的同時,有了參與天文新發(fā)現(xiàn)的可能。也許將來國內(nèi)有更多擁有天文設(shè)備的愛好者、組織團體加入到該項目中,尋找更多類型的天體,也將不斷充實虛擬天文臺為公眾服務(wù)的內(nèi)容和功能。借助大數(shù)據(jù)帶來的科技進(jìn)步,全民搜星的時代或許很快就會來臨。