EMC公司當下正積極推進兩大工程技術項目的發(fā)展,它們分別是基于閃存的DSSD以及虛擬SAN ScaleIO。兩大項目都將目標指向了機架級別存儲業(yè)務領域。
DSSD源自EMC公司于去年五月完成的一筆收購,該項目意在打造一整套設計方案、利用PCIe接入閃存作為持久存儲層。
其設計思路在于將機架內塞滿閃存存儲設備,從而滿足內存內數(shù)據(jù)庫以及實時分析工作負載對于低延遲訪問的實際需要。
那么閃存設備的容納量到底如何?一臺33U XtremIO 6-X-Brick集群擁有120TB原始閃存容量。如何按照同樣的每U存儲TB數(shù)字來計算,那么42U機架應該能夠為我們帶來151TB空間。相比之下,HGST的第二代Skyera產品Skyhawk能夠在1U空間內提供136TB閃存容量,這使得XtremIO即使經過擴展、其閃存空間容納能力仍顯得十分可憐。一臺42U Skyhawk機架將提供5712TB容量——這絕對是一份值得大書特書的出色成績單。
誠然,DSSD目前正在尋求將機架存儲容量提升至PB級別以上的辦法。在Stifel Tech大會的一次發(fā)言當中,EMC公司新興技術部門總裁Chirantan “CJ” Desai表示DSSD產品將于今年晚些時候正式推出,且同時提供數(shù)據(jù)塊訪問與HDFS支持能力。他同時指出,該產品將不會采用現(xiàn)成的PCIe閃存卡、而是選擇PCIe作為原始NAND閃存的接入通道。
這意味著該產品實際上也不會使用DSSD。相反,類似于Violin Memory與HGST的Skyhawk,EMC的方案將直接采用NAND晶片并對寫入操作削減、垃圾收集以及其它一些功能加以管理。
其DSSD產品在存儲資源密度方面將高于XtremIO陣列。但該方案將不具備XtremIO的各類數(shù)據(jù)服務,例如精簡配置、重復數(shù)據(jù)刪除、壓縮以及快照等等。
EMC II公司總裁兼倡導者Chad Sakac在博文中寫道:
“我們在Thunder項目當中還總結出了第三項重要經驗。在大多數(shù)情況下,理想的接口并不是IB/以太網(wǎng)(內存映射)之上的RDMA。
相比之下,開發(fā)人員更傾向于通過應用程序API與持久性存儲層進行直接交互。大家可以通過NVMe完成這一目標,而且該機制很可能與HDFS、鍵值存儲以及其它技術實現(xiàn)‘嚴絲合縫’的匹配效果。而這正是DSSD的意義所在。”
DSSD技術是真正的“架頂式、池化服務器-內存-閃存”,并能夠提供高達百萬級別的IOPS表現(xiàn)。
DSSD技術當中涉及多塊閃存驅動器,每一塊都擁有自己的控制器,并利用內存(即RAM)為閃存提供緩沖或者緩存區(qū)。主機(即應用程序運行服務器)通過“一套超低延遲互連機制”接入DSSD閃存存儲系統(tǒng)。
在我們看來,這意味著DSSD產品所采用的互連機制與InfiniBand或者100GbitE有所不同。這不禁讓我們想到英特爾Silicon Photonic中的Omni-Path架構。
我們似乎可以期待著該產品的數(shù)據(jù)訪問速度要比網(wǎng)絡XtremIO陣列更為出色。
DSSD軟件將對閃存資源進行管理及池化,并自動完成方方面面操作任務。Sakac表示,數(shù)據(jù)塊與文件訪問堆棧都將在此基礎上進行分層。Desai的評論意見也證實,塊訪問已經被加入該套方案,而這將拓展該技術所適合的用例類型。我們不妨設想當下任何需要在SAN當中并行訪問大量數(shù)據(jù)并需要更高訪問速度的企業(yè)級應用程序——這些正是DSSD的潛在適合用例。
DSSD包攬一切
Sakac表示:“DSSD并不需要在閃存讀取與寫入模式之間借助任何文件/塊語義。它能夠通過libHDFS或者對象語義完成上述任務,或者直接映射至鍵值存儲(利用PCIe/NVMe連接)。如果大家需要基于RDMA以及直接PCIe NVME之上的內存映射機制,DSSD產品也完全能夠勝任。”
這一切建立在由Fusion-io公司提出并倡導的、將閃存作為內存的解決思路,這一點在其PCIeioMemory閃存當中也有很好的體現(xiàn)。Fusion-io公司聯(lián)合創(chuàng)始人David Flynn指出,如果無需經歷傳統(tǒng)操作系統(tǒng)IO堆棧提供的接入路由機制,應用程序完全能夠獲得更出色的數(shù)據(jù)訪問速度——其增幅甚至跨越數(shù)量級。
根據(jù)Sakac的說法,DSSD屬于“‘超熱門’前沿方案——這套基礎設施能夠支持以SAP HANA與Gemfire為代表的內存內數(shù)據(jù)庫,外加以memcached為代表的鍵值存儲機制。DSSD改變了內存內數(shù)據(jù)庫的整個生態(tài)系統(tǒng),大家能夠以遠低于傳統(tǒng)方案的成本水平構建起更為龐大的內存處理體系。DSSD改變了IOPS極限并為高度依賴于低延遲水平的分布式NoSQL/SQL數(shù)據(jù)庫帶來理想的延遲表現(xiàn)——這足以使其瞬間躋身實時分析領域之中。”
我們的關注重點包括HDFS訪問、塊訪問、對象訪問以及內存內使用場景。
說到這里,我們的腦海中不禁出現(xiàn)一個疑問:單一服務器能否接入DSSD閃存陣列?作為一套擁有PB以上級別存儲容量與微秒級延遲水平的存儲系統(tǒng),我們通常會將其交付給大量服務器設備共同使用——如果其互連機制允許多服務器訪問的話。
也許從樂觀的角度出發(fā),我們應該認定DSSD屬于一套以準主內存擴展為目標的SAN改造性方案,同時配備更快的網(wǎng)絡接入機制、內存式訪問堆棧以及HDFS。如果這一切能夠成為現(xiàn)實,那么我們迎來的將是一套堪稱磁盤SAN殺手的技術方案。
EMC公司預計DSSD產品在營收方面將迎來超過XtremIO的增長速度。后者作為閃存陣列已經在本月成功實現(xiàn)了年均12億美元的營收目標。該系列的第一款產品推出于2013年5月,也就是二十一個月之前。如果DSSD能夠實現(xiàn)EMC的既定期望,那么我們預計將在其首款產品推出后的十八個月見證其年均營收突破10億美元。這真能成為現(xiàn)實嗎?看起來可能性不太高。
如果以上預期成為現(xiàn)實,那么激進派投資方埃利奧特資本管理公司將有理由暫停其將VMware拆分出EMC并加以出售的恐怖計劃,轉而靜待DSSD是否能夠如EMC計劃中那般成為推動股價上升的極效強心劑。
我們權當EMC能夠在這一問題上獲得肯定答案,即能夠憑借著DSSD作為真正的SAN殺手級技術在IO密集型以及計算密集型PB級存儲用例當中大放異彩,那么這套方案對于其它供應商又將意味著什么?
所有內存內應用程序處理系統(tǒng)——也就是SAP HANA——都將被吸引到DSSD當中。EMC將成為甲骨文工程技術系統(tǒng)之外的惟一后備解決方案。
戴爾、HDS、惠普、IBM以及NetApp則面臨著被徹底擠出內存內應用程序存儲市場的命運,他們恐怕需要通過收購或者自行開發(fā)來獲得屬于自己的同類技術方案。但該從哪家廠商手中購買?也許SanDisk收購Fusion-io的舉措值得他們加以借鑒?我們不妨給Sanjay Mehrotra(SanDisk公司CEO)打個電話。
那么Violin能否收購PCIe接入路由技術并打造出能夠作為DRAM擴展的自有陣列方案?答案恐怕要由Kevin DaNuccio給出。HGST的Skyera擁有必要的硬件密度,但其配套軟件是否夠給力?也許可以通過合作謀得生存的機會。不過總結來看,以上猜想都有些瘋狂而不切實際。
可以肯定的是,EMC推出的DSSD產品勢必在市場上掀起巨大波瀾。也許DSSD的滾滾洪流將會吞沒一切。抵抗是徒勞的,放棄掙扎倒是能幫廠商們保存一點體力。