“系統(tǒng)平臺(tái)建設(shè)”是“十五”期間中國(guó)科學(xué)院知識(shí)創(chuàng)新工程信息化建設(shè)專項(xiàng)中“科學(xué)數(shù)據(jù)庫(kù)及其應(yīng)用系統(tǒng)”重大項(xiàng)目的一個(gè)子項(xiàng)目。其主要工作內(nèi)容包括三個(gè)部分:軟硬件環(huán)境建設(shè)、系統(tǒng)平臺(tái)軟件開發(fā)、應(yīng)用系統(tǒng)開發(fā)。
科學(xué)數(shù)據(jù)庫(kù)系統(tǒng)平臺(tái)軟硬件環(huán)境建設(shè)與服務(wù)
系統(tǒng)平臺(tái)軟硬件環(huán)境建設(shè)對(duì)科學(xué)數(shù)據(jù)庫(kù)中海量數(shù)據(jù)資源的保藏、管理、服務(wù)和應(yīng)用具有重大的意義和作用。經(jīng)過詳細(xì)的調(diào)研和論證,軟硬件環(huán)境的建設(shè)方案選擇了以數(shù)據(jù)中心為主體,由超級(jí)數(shù)據(jù)服務(wù)器系統(tǒng)為核心構(gòu)成的海量數(shù)據(jù)存儲(chǔ)、處理和服務(wù)的環(huán)境。軟硬件環(huán)境具體包括以下內(nèi)容:超級(jí)數(shù)據(jù)服務(wù)器系統(tǒng),海量存儲(chǔ)系統(tǒng),可視化系統(tǒng),協(xié)同工作環(huán)境,高速網(wǎng)絡(luò)環(huán)境,系統(tǒng)軟件等。
超級(jí)數(shù)據(jù)服務(wù)器系統(tǒng)由59個(gè)4路安騰2處理器的結(jié)點(diǎn)構(gòu)成。海量存儲(chǔ)系統(tǒng)包括20TB磁盤陣列和50TB磁帶庫(kù)??梢暬到y(tǒng)為20塊LCD(5x4)拼成的顯示墻系統(tǒng),分辨率達(dá)到2600萬(wàn)像素。協(xié)同工作環(huán)境包括Access Grid、VRVS等系統(tǒng)。高速網(wǎng)絡(luò)環(huán)境由高性能千兆局域網(wǎng)構(gòu)成,對(duì)外有2Gbps連接到CSTNET和NSFCNET。
超級(jí)數(shù)據(jù)服務(wù)器于2004年10月底基本完成安裝和調(diào)試,2005年1月進(jìn)入試運(yùn)行,2005年4月開始正式運(yùn)行并提供服務(wù)。20TB磁盤陣列隨超級(jí)數(shù)據(jù)服務(wù)器安裝。50TB磁帶庫(kù)于2005年6月投入使用。
科學(xué)數(shù)據(jù)庫(kù)系統(tǒng)軟件包括:
操作系統(tǒng)平臺(tái)為Windows 2003 Server和Redhat Linux AS 2.1/3;數(shù)據(jù)庫(kù)管理系統(tǒng)有Oracle 9i/10g RAC(2結(jié)點(diǎn)8CPU并行),Microsoft SQL Server 2000,MySQL等;機(jī)群軟件有聯(lián)想機(jī)群管理系統(tǒng)、聯(lián)想機(jī)群監(jiān)控系統(tǒng)、聯(lián)想作業(yè)管理系統(tǒng)等;應(yīng)用軟件有Web服務(wù)器Tomcat/apache/Resin/IIS,Java/J2EE,F(xiàn)TP/Rsync等;學(xué)科領(lǐng)域軟件有地學(xué)GIS軟件(ArcGIS),生物信息處理軟件等。
系統(tǒng)平臺(tái)軟硬件環(huán)境向科學(xué)數(shù)據(jù)庫(kù)建庫(kù)單位提供服務(wù),運(yùn)行良好。結(jié)點(diǎn)使用情況為:服務(wù)(外部)結(jié)點(diǎn)20個(gè),已使用19個(gè);存儲(chǔ)/管理結(jié)點(diǎn)9個(gè),全部使用;處理(內(nèi)部)結(jié)點(diǎn)30個(gè),已使用19個(gè)。整體結(jié)點(diǎn)使用率為79.7%。存儲(chǔ)系統(tǒng)使用情況為:磁盤裸容量20T,RAID容量17T,已分配使用空間14.8T。磁盤陣列使用率為87%。
數(shù)據(jù)網(wǎng)格軟件開發(fā)與部署
系統(tǒng)平臺(tái)的數(shù)據(jù)網(wǎng)格軟件是針對(duì)科學(xué)數(shù)據(jù)庫(kù)的特點(diǎn)和需求,利用網(wǎng)格技術(shù),自主開發(fā)的一套數(shù)據(jù)網(wǎng)格中間件和工具集。
以下是最新發(fā)布的產(chǎn)品及版本:
· 網(wǎng)格信息服務(wù)系統(tǒng) 1.0版
· 通用元數(shù)據(jù)管理工具 2.0版
· 網(wǎng)格信息與元數(shù)據(jù)服務(wù)(IMS)
· 數(shù)據(jù)訪問服務(wù)(DAS)1.0/1.1/2.0版
· 通用數(shù)據(jù)訪問工具2.1版
· 科學(xué)數(shù)據(jù)庫(kù)CA管理系統(tǒng) 2.0版
· 科學(xué)數(shù)據(jù)庫(kù)資源訪問控制工具包1.1版
· 存儲(chǔ)服務(wù)1.0版
· 網(wǎng)格門戶
應(yīng)用系統(tǒng)
在科學(xué)數(shù)據(jù)庫(kù)應(yīng)用系統(tǒng)方面已經(jīng)啟動(dòng)了高能物理領(lǐng)域的“國(guó)際宇宙線數(shù)據(jù)預(yù)處理中心”和生物領(lǐng)域的“禽流感等突發(fā)疾病綜合信息平臺(tái)與預(yù)警預(yù)報(bào)系統(tǒng)”兩個(gè)項(xiàng)目。這些應(yīng)用將在系統(tǒng)平臺(tái)軟硬件環(huán)境上開發(fā)和運(yùn)行,并充分利用數(shù)據(jù)網(wǎng)格軟件所提供的支持。禽流感項(xiàng)目由微生物所、武漢病毒所、動(dòng)物所、網(wǎng)絡(luò)中心等4個(gè)研究所共同協(xié)作完成,在面向e-Science的跨地域、跨學(xué)科、跨組織科研協(xié)同方面開展了積極的探索和嘗試。
科學(xué)數(shù)據(jù)庫(kù)系統(tǒng)總結(jié)
科學(xué)數(shù)據(jù)庫(kù)系統(tǒng)平臺(tái)的建設(shè)過程中,我們還在網(wǎng)格技術(shù)等主要技術(shù)路線上做了深入的研究,相關(guān)研究成果以論文和會(huì)議報(bào)告的形式發(fā)表在國(guó)內(nèi)學(xué)術(shù)期刊和國(guó)內(nèi)外學(xué)術(shù)會(huì)議上。
在本項(xiàng)目有關(guān)工作的基礎(chǔ)上,我們還得到國(guó)家有關(guān)科技計(jì)劃的大力支持:在863計(jì)劃中承擔(dān)了中國(guó)國(guó)家網(wǎng)格的應(yīng)用網(wǎng)格項(xiàng)目“科學(xué)數(shù)據(jù)網(wǎng)格”;在科技部“科學(xué)數(shù)據(jù)共享工程”中承擔(dān)了“基礎(chǔ)科學(xué)數(shù)據(jù)中心”項(xiàng)目;在自然科學(xué)基金委“以網(wǎng)絡(luò)為基礎(chǔ)的科學(xué)活動(dòng)環(huán)境”重大研究計(jì)劃中承擔(dān)了“綜合試驗(yàn)平臺(tái)”的相關(guān)課題。
軟硬件環(huán)境、系統(tǒng)平臺(tái)數(shù)據(jù)網(wǎng)格軟件都已基本建設(shè)開發(fā)完成,進(jìn)入以運(yùn)行和服務(wù)為主的階段,下一步的工作重點(diǎn)是繼續(xù)推動(dòng)建庫(kù)單位對(duì)系統(tǒng)平臺(tái)硬件軟件資源的使用。一方面應(yīng)加大宣傳推廣力度,讓建庫(kù)單位充分了解可用的資源的情況;并提供方便的工具和服務(wù),便于建庫(kù)單位使用這些資源。同時(shí),在系統(tǒng)平臺(tái)的基礎(chǔ)上進(jìn)一步推進(jìn)面向e-Science的科學(xué)數(shù)據(jù)庫(kù)應(yīng)用試點(diǎn)?!?/P>