對象存儲初創(chuàng)公司Scality將其存儲添加到Hadoop,使用戶可避免通過Hadoop自己的文件系統(tǒng)加載數(shù)據(jù)。他們還推出了一款針對Cinder——在OpenStack項目里面的塊存儲層的插件。
RING是基于一組X86服務(wù)器節(jié)點的對象存儲基礎(chǔ)架構(gòu),存儲對象而不是文件或塊,而且可以并行操作。
Scality提供的一個被稱為“生產(chǎn)級Hadoop存儲實施”使用了CDMI——由SNIA開發(fā)和推廣的面向云計算數(shù)據(jù)管理的云存儲標(biāo)準(zhǔn)。CDMI開始緩慢被供應(yīng)商支持但處于回升的步伐。
Scality已經(jīng)使用自己的元數(shù)據(jù)架構(gòu)替換了Hadoop命名節(jié)點(Name Node)服務(wù)器,從而消除了Hadoop架構(gòu)中的單點故障。該公司表示,其Hadoop實現(xiàn)可以在存儲節(jié)點自身上面適當(dāng)?shù)奶幚?、計算,并通過與作業(yè)跟蹤共享數(shù)據(jù)位置顯著地降低了數(shù)據(jù)傳輸?shù)男枨蟆?/p>
Scality表示,其RING的擦除編碼意味著省去了由于復(fù)制產(chǎn)生的任何Hadoop硬件開銷。另外“用戶可以通過一個標(biāo)準(zhǔn)的文件系統(tǒng)寫入和讀取文件,并在相同的時間用Hadoop處理過程,而不需要通過HDFS(Hadoop分布式文件系統(tǒng))加載文件”。
Scality公司首席執(zhí)行官Jerome Lecat說:“我們已經(jīng)貢獻(xiàn)我們的Hadoop解決方案到CDMI社區(qū),確保它可以與任何的CDMI兼容存儲一起使用。...我們的CDMI框架(framework)可以直接從我們的向外擴(kuò)展(scale-out)文件系統(tǒng)讀取數(shù)據(jù),沒有必要在執(zhí)行一個MapReduce作業(yè)之前做HDFS獲取。“
Scality的產(chǎn)品兼容、并且已經(jīng)與Hortonworks HDP 1.0和Cloudera CDH4測試過——沒有顯現(xiàn)出Scality正在尋求替代或者與現(xiàn)有的Hadoop發(fā)行版競爭。通過添加一個RING后端,在某種程度上,Scality表示它提供了一個更具成本效益、更容易使用、更有彈性和更高性能的Hadoop基 礎(chǔ)設(shè)施,同時用戶從Scality的SOFS(Scale-Out文件系統(tǒng))中受益。
Lecat表示:“我們的角度是,我們認(rèn)為人們想要做到在“普通”的數(shù)據(jù)上進(jìn)行Hadoop工作,不只是他們特別為Hadoop準(zhǔn)備的(數(shù)據(jù))。在我的印象中,這對于Hadoop是非常有價值的,但它被事實扼殺了,人們需要在任何MapReduce作業(yè)之前做一個HDFS攝取。由于我們不再需要這樣了。”
一個含義是這樣的,Lecat說:“試想一下,如果你現(xiàn)在使用MapReduce你可以做什么——這是工作在存儲節(jié)點上的——去做數(shù)據(jù)轉(zhuǎn)換,如新的編碼,作為一個新的版本得出結(jié)果,這節(jié)省了大量的處理時間。它在以前需要將數(shù)據(jù)從存儲移動到服務(wù)器,進(jìn)行轉(zhuǎn)換然后寫回存儲。”
OpenStack對象存儲
OpenStack是一個云或基礎(chǔ)設(shè)施即服務(wù)(IaaS),基于免費(fèi)的、開放源碼的軟件來控制在數(shù)據(jù)中心里的計算,存儲和網(wǎng)絡(luò)資源池,用戶通過一個門戶自助分配,而管理人員通過儀表盤(dashboard)管理整個群。Rackspace和許多其他供應(yīng)商都積極和大聲支持OpenStack。現(xiàn)在Scality也來湊熱鬧。
Cinder是對在OpenStack中的一個塊存儲層的代碼名稱,它使虛擬機(jī)(VM)發(fā)現(xiàn)和使用持久的塊級卷,而Scality針對它提供了一個RING插件。Lecat表示:“這個貢獻(xiàn)使OpenStack的采用者追趕上了亞馬遜針對虛擬機(jī)的EBS持久卷。隨著Grizzly(版本)釋放,OpenStack計算將有一個存儲伙伴,部署在有高需求的云計算環(huán)境,這將提高OpenStack在市場上的采用率。”
Grizzly是OpenStack定于4月份發(fā)布的下一個版本。
Scality并不孤單。Coraid公司也提供了ATA-over-以太網(wǎng)(AOE)和Coraid EtherCloud的驅(qū)動程序到OpenStack的Cinder塊存儲開源項目,所以O(shè)penStackers可以使用其存儲陣列作為塊存儲。全閃存“云”存儲陣列初創(chuàng)廠商SolidFire做了同樣的事情,它現(xiàn)在已經(jīng)參與了Cinder項目好幾年。Coraid聲稱,傳統(tǒng)的存儲供應(yīng)商如NetApp、EMC、惠普和戴爾等在他們的OpenStack驅(qū)動程序中只完成了部分功能,而他們已經(jīng)作為一個企業(yè)贊助商加入OpenStack社區(qū)。
針對OpenStack的RING通過向外擴(kuò)展文件系統(tǒng)(SOFS)封裝提供了一個POSIX文件接口。Scality敘述道:
Cinder整合是建立在Scality的 … 嵌入在SOFS中分布式的稀疏文件技術(shù)。每個Cinder卷實際上是在Scality Scale-Out存儲里面的一個文件。這確保了簡便的管理、無縫的可擴(kuò)展性,并提供了像在計算節(jié)點硬件故障的情況下,實時遷移虛擬機(jī)和即時故障轉(zhuǎn)移這樣的先進(jìn)虛擬化功能。
Scality的產(chǎn)品戰(zhàn)略總監(jiān)Philippe Nicolas表示:“這個塊存儲接口完成了我們的統(tǒng)一存儲戰(zhàn)略。Scality是實際交付承諾的真實和完整的統(tǒng)一存儲訪問,包括對象、文件和塊的第一批廠商之一。”
Scality的Cinder整合將在OpenStack的Grizzly發(fā)布時可用。