8月18日原創(chuàng)報道: 8月13日下午14:30,DOSTOR獨家發(fā)起圍繞“Flash evolve Datacenter 閃存進化數(shù)據(jù)中心”為主題的網(wǎng)絡沙龍活動圓滿結束,沙龍現(xiàn)場邀請到國家信息中心專家委員會主任、研究員寧家駿、Gartner大中華區(qū)首席存儲分析師張瑾、國家審計署計算機技術中心技術推廣處副處長裴曉寧、中國農(nóng)業(yè)銀行總行清算中心經(jīng)理王正江以及華為的兩位專家。沙龍互動熱烈,共有348名在線網(wǎng)友參與,收到提問639條。在閃存時代,也相信很多網(wǎng)友有著不少疑問,特別是企業(yè)存儲十年轉(zhuǎn)型,閃存從中帶來了什么動力?閃存在加速數(shù)據(jù)中心過程中到底扮演什么角色?閃存可靠性方面到底需要注意什么?華為閃存策略又有哪些與眾不同的地方?
企業(yè)存儲十年轉(zhuǎn)型與閃存有何關系?
數(shù)據(jù)中心經(jīng)歷10年左右的發(fā)展,從數(shù)據(jù)孤島到數(shù)據(jù)集中,再到對存儲提出更為高標準的要求,存儲效率與價值的發(fā)揮已經(jīng)成為企業(yè)用戶關注的焦點之一。
國家信息中心專家委員會主任、研究員寧家駿也贊同這樣的觀點,對于數(shù)據(jù)中心十年發(fā)展的轉(zhuǎn)型,他進一步分析道,大型數(shù)據(jù)中心轉(zhuǎn)型主要經(jīng)歷了三個階段,第一個階段是大型機階段;第二個階段就是當前以服務器為主構建數(shù)據(jù)中心的階段;第三個階段進入以云計算為代表的數(shù)據(jù)中心階段,包括軟件定義數(shù)據(jù)中心階段。隨著企業(yè)用戶數(shù)據(jù)量爆發(fā)增長,如何做到數(shù)據(jù)更高效利用和數(shù)據(jù)的安全關鍵是存儲的穩(wěn)定運行,這成為數(shù)據(jù)中心發(fā)展過程中最重要的事情。
不過,在談到這方面的問題時,Gartner大中華區(qū)首席存儲分析師張瑾明確指出,在摩爾定律與服務器虛擬化技術的快速演進過程中,CPU、網(wǎng)絡都獲得很快的發(fā)展,而存儲長期依靠機械硬盤早已遠遠跟不上前兩者的發(fā)展,從而存儲成為數(shù)據(jù)中心發(fā)展的瓶頸,一些新的存儲技術出現(xiàn)成為必然,包括閃存的出現(xiàn)。包括大數(shù)據(jù)的應用對于存儲的需求在增加而沒有減少,為此,對于企業(yè)用戶來說如何在有限資金下提升存儲效率成為很重要的話題。
可見,來自兩位專家的觀點都充分表明,閃存的出現(xiàn)帶來了數(shù)據(jù)中心存儲的新動力,但閃存是否能重塑數(shù)據(jù)中心?張瑾認為,閃存實際在顛覆傳統(tǒng)存儲的技術架構和競爭格局,從現(xiàn)在來看,主流廠商是被動或半主動地推出閃存策略,既然有這么多對于閃存的投資,未來閃存將會有突飛猛進的階段。在軟件定義架構的理念推動下,必然使得主流廠商更為重視這方面的發(fā)展。
另外,從企業(yè)用戶層面來分析,在衡量閃存應用的標準時,國家審計署計算機技術中心技術推廣處副處長裴曉寧認為主要關注其安全性、可靠性和性價比,不過對于安全性方面應該是放在第一位。
對于談到企業(yè)用戶存儲及閃存需求方面,華為存儲產(chǎn)品線高級營銷經(jīng)理張秦筠認為企業(yè)對于存儲的需求要滿足三點,一是存儲性能要能與企業(yè)業(yè)務匹配;二是存儲是否可靠,管理簡單;三是在總體擁有成本方面給企業(yè)帶來益處。在他看來,閃存的出現(xiàn),可以提供存儲系統(tǒng)更低的時延,并給業(yè)務系統(tǒng)提供更快的保障。如何在閃存系統(tǒng)上提供更好的可靠性,相對于傳統(tǒng)機械硬盤比較,閃存在性能容量比、性能能耗比、性能空間比上都具有天然優(yōu)勢,充分發(fā)揮閃存與系統(tǒng)之間的優(yōu)勢可以成為企業(yè)數(shù)據(jù)中心發(fā)展中非常好的選擇。
為什么強調(diào)閃存是數(shù)據(jù)中心進化的催化劑?
當然了,對于閃存進化數(shù)據(jù)中心不可能一蹴而就,那么閃存在數(shù)據(jù)中心演進過程中到底扮演什么樣的角色,發(fā)揮著什么樣的作用呢?
當前,傳統(tǒng)存儲陣列逐漸變成了虛擬化基礎架構的性能瓶頸,直接限制了虛擬化基礎架構的效益最大化。華為存儲產(chǎn)品線高級營銷經(jīng)理張秦筠認為,閃存及其構筑在其上的相關產(chǎn)品的出現(xiàn),為存儲系統(tǒng)的性能提升,給出了一個嶄新的解決方案,閃存本身并不能解決虛擬環(huán)境中出現(xiàn)的復雜數(shù)據(jù)管理問題,但提供了一種可能。那么,閃存產(chǎn)品、閃存系統(tǒng)以什么樣的路線圖演進方式,進入到企業(yè)的IT基礎架構中去?
從1984年東芝正式公布Flash原理到現(xiàn)在,閃存技術已經(jīng)走過了30年的發(fā)展歷程。最開始,閃存依靠高IOPS、低時延、低功耗、無機械部件的特點進入人們的視野,但在2008年開始才真正在企業(yè)級服務器和存儲領域取得商用,那時,僅僅是作為一個獨立部件對一些對性能有特殊要求的應用進行加速,它有效地拉近了計算與數(shù)據(jù)的距離,并解決了數(shù)據(jù)中心基礎架構虛擬化所帶來的I/O攪拌問題,是“良藥”。隨著工藝的不斷演進、密度的不斷提高、技術的不斷完善,以及價格的不斷下降,閃存產(chǎn)品已經(jīng)不僅僅局限于對系統(tǒng)進行加速或者提升性能的單一部件優(yōu)化層面。
在可以預見的2-3年內(nèi),閃存將會逐步取代SAS機械硬盤成為高性能盤的唯一選擇,圍繞著閃存與SSD進行設計的系統(tǒng)和特性將會越來越多地應用在企業(yè)的不同級別業(yè)務中。
張秦筠強調(diào)說,在整個數(shù)據(jù)中心的演進過程中,“簡”和“捷”是不變的話題,閃存在這兩個維度都帶來了巨大的沖擊,從服務器計算效率、到網(wǎng)絡傳輸效率,再到供電、散熱等。閃存作為一種催化劑,促進了整個數(shù)據(jù)中心的變化。
面向未來,數(shù)據(jù)中心將逐步演進成為由上層軟件堆棧定義下的能夠自適應的下層統(tǒng)一的IT基礎設施所構成,由軟件按需使用硬件資源,以最高效的方式使用硬件資源。閃存將進一步促進數(shù)據(jù)中心更上一個臺階,催生計算與存儲的聚合,計算以最高效的內(nèi)存訪問方式訪問存儲,存儲離CPU最近,徹底消除CPU與存儲介質(zhì)之間的性能鴻溝。未來的企業(yè)數(shù)據(jù)中心,將從計算、網(wǎng)絡到存儲的各個路徑做好適配,數(shù)據(jù)中心效能極大提升,將硅片上構筑的計算與存儲效能發(fā)揮至極致,實現(xiàn)物盡其用。傳統(tǒng)數(shù)據(jù)中心逐步步入“Flash”時代,即閃存進化下的企業(yè)數(shù)據(jù)中心——更高效、更可靠、更節(jié)能。
如何分析閃存可靠性的關鍵因素?
中國農(nóng)業(yè)銀行總行清算中心經(jīng)理王正江表示,作為一線用戶,最重視閃存可靠性,特別是在金融結算過程中,更是擔心閃存的可靠性,其次對于數(shù)據(jù)反映時間要求也非常高,每天金融業(yè)務處理上億筆,如何加快數(shù)據(jù)反映時間,對存儲速度要求就非常快。
在談到可靠性方面話題時,華為存儲產(chǎn)品線閃存系統(tǒng)架構師龔濤指出在數(shù)據(jù)中心中,計算、網(wǎng)絡、存儲都是非常明確。如何保證企業(yè)用戶業(yè)務連續(xù)性,成為閃存可靠性方面的關鍵因素。在這個方面,華為對閃存采取了錯時運行技術,快速復位固件(在一秒以內(nèi)的秒級復位),起到定時器作用,達到SSD運行時長錯開,一旦有SSD盤有問題發(fā)生,就只是單盤失效,而不會出現(xiàn)數(shù)據(jù)丟失,避免客戶業(yè)務中斷。在保護用戶數(shù)據(jù)業(yè)務連續(xù)性方面有著很大的作用,在SSD方面能有這樣功能的廠商華為做到了領先。
另外,如何保障閃存硬件具備可靠性?那么需要對閃存故障模式有深入的了解。從2007年到現(xiàn)在,華為在閃存方面做了非常多的技術積累。首先,龔濤談到可靠性的故障模式,比如閃存顆粒隨機失效,華為盡可能減少顆粒的磨損和擦寫次數(shù)。同時華為采取全局容量冗余,使用軟件功能控制硬盤冗余比,達到整體系統(tǒng)可靠性。另外,減少顆粒磨損能提升SSD可靠性,但華為不僅如此,還采取了自研的全局反磨損均衡技術,在軟件管理系統(tǒng)里面顯示直接的磨損監(jiān)控。同時犧牲小部分盤利用來爭取整體SSD盤的可靠性,從而不至于因SSD盤片全部失效而導致業(yè)務斷掉。
從實際出發(fā),華為SSD配套陣列、服務器等都在出貨,所有SSD出貨量達到了數(shù)萬片,華為SSD年返還率是0.29%,而某友商SSD年返還率是0.44%,華為在SSD可靠性方面做了大量工作。再具體到華為全閃存陣列方面,到目前全閃存陣列出貨在數(shù)PB以上,從2010年到現(xiàn)在,沒有出現(xiàn)一起故障問題,沒有一片SSD返還,這得益于華為在閃存、陣列以及相互配合方面做了大量優(yōu)化工作。
同時在業(yè)務不斷發(fā)展變化過程中,企業(yè)用戶越來越重視存儲的可靠性,要做到可靠性提升,盤和系統(tǒng)相結合是基礎。SSD是基于Nand flash來設計的,不是10k的SAS HDD,其工作方式和故障模式和機械硬盤存在很大的不同,SSD不受振動、腐蝕、平均利用率等因素的影響,但存在顆粒隨機失效、固件潛在bug、失效概率隨著磨損次數(shù)上升而變化等可能。對此,通過盤與系統(tǒng)更好的融合,可以為數(shù)據(jù)中心可靠性帶來最大的幫助,洞察存儲變化,提高存儲可靠性。
怎么看待華為閃存Flash first的1.0到3.0?
既然華為對于閃存可靠性有著這樣深入的理解和分析,那么在配合閃存帶給數(shù)據(jù)中心的演進方面,作為國內(nèi)最早從事閃存研發(fā)的華為如何看待閃存的應用?華為閃存的總體策略又是什么樣的?相信這是諸多網(wǎng)友最為關心的話題。為此,華為存儲產(chǎn)品線高級營銷經(jīng)理張秦筠針對這方面的問題給出了非常詳盡的解釋,華為公司一直以來就非常重視Flash在數(shù)據(jù)中心的應用,早在2007年,華為就洞察到閃存在逐漸演進的過程中給企業(yè)級用戶帶來的核心價值,開始投入到SSD領域的研發(fā),并聚焦于將SSD與系統(tǒng)進行融合,以充分發(fā)揮SSD的特性。
“一直以來,華為和閃存顆粒廠商保持著良好的“戰(zhàn)略”合作關系,在自研SSD和SSD Controller方面,我們先后推出了三代SSD以及自研ASIC芯片。正是因為我們擁有自主研發(fā)的SSD,我們可以做到針對SSD的全局資源管理以及SSD與系統(tǒng)深度融合設計。另一方面,我們更看重如何在企業(yè)級應用中將SSD更好的用起來,在不改變用戶使用習慣的基礎上,將SSD系統(tǒng)與相應軟件功能更平滑地切入到現(xiàn)網(wǎng)環(huán)境。”
他進一步指出,華為在閃存方面的整體策略是Flash first,通過完美地在數(shù)據(jù)中心注入閃存基因,加速閃存在數(shù)據(jù)中心的布局,幫助數(shù)據(jù)中心完成整體進化。作為目前業(yè)界唯一一家同時自研SSD Controller、SSD以及SSD系統(tǒng)的廠商,華為通過將SSD相關的技術完美融合到數(shù)據(jù)中心的核心業(yè)務中,力求為企業(yè)提供更穩(wěn)定的、更高效、更節(jié)能的SSD系統(tǒng)與解決方案。
基于以這個大方針為指引,華為提出了“Flash first”三步走的策略。
Flash first 1.0階段,關鍵詞:“加速”。從2008年到2012年,在這個時期,大多數(shù)數(shù)據(jù)中心存儲雖然在物理上集中,但業(yè)務還是獨立分散部署,F(xiàn)lash對數(shù)據(jù)中心加速,只是解決部分應用的性能問題。在這個時期,華為稱作Flash first 1.0階段,它的關鍵詞是“加速”。從這個思路出發(fā),華為在2010年推出了應用在傳統(tǒng)陣列里的SSD Cache以及SSD Tier,以及基于SSD的全固態(tài)存儲系統(tǒng)Dorado,對數(shù)據(jù)中心的性能敏感的關鍵業(yè)務進行加速。目前,華為已經(jīng)實現(xiàn)了Flash first 1.0的目標,進入到第二個階段的實施中。
Flash First 2.0階段,關鍵詞:“融合”。如前文所述,在主機虛擬化浪潮的推動下,數(shù)據(jù)中心建設模式由煙囪式走向資源池化,池化數(shù)據(jù)中心的大量業(yè)務并發(fā)運行,業(yè)務規(guī)模和業(yè)務種類動態(tài)變化,產(chǎn)生大量動態(tài)變化的隨機IO。客戶期望高性能、特別是高隨機性能的存儲資源池。與此同時,池化數(shù)據(jù)中心支撐大量的業(yè)務,一旦出現(xiàn)異常,將會波及很多業(yè)務;所以,客戶期望是高可靠、能自愈的存儲資源池。同時,在這一時期,隨著Flash規(guī)模應用,及Flash價格快速下降,逐步接近高性能HDD( 15K、10K轉(zhuǎn)速),使得Flash在企業(yè)級市場的大規(guī)模應用成為可能。Flash逐步替代高性能HDD盤,應用于主存,成為高性能盤的唯一選擇。而在這個時候,機械硬盤卻不會一下子從數(shù)據(jù)中心徹底消失,數(shù)據(jù)中心需要能融合高速的SSD以及大容量的HDD的融合架構。華為稱之為Flash First 2.0時代,它的關鍵詞就是“融合”。一方面,基于融合架構,通過多介質(zhì)融合、多協(xié)議融合、跨設備融合、跨生命周期融合技術,推動Flash以平滑方式進駐數(shù)據(jù)中心,同時也是推動數(shù)據(jù)中心存儲資源池化的過程。而另一方面,存儲系統(tǒng)專為Flash設計,基于全局表項管理、全局動態(tài)均衡(全局容量冗余、全局磨損均衡、全局反磨損均衡)、全局壞塊管理等技術,提供超高性能、超高可靠的存儲服務。
Flash First 3.0階段,關鍵詞:“聚合”。在Flash First 3.0階段,華為認為數(shù)據(jù)中心走向All IP承載的軟件定義下的數(shù)據(jù)中心。通過全IP互聯(lián),實現(xiàn)網(wǎng)絡高度融合與統(tǒng)一,不僅數(shù)據(jù)中心內(nèi)部全IP互聯(lián),數(shù)據(jù)中心之間全IP互聯(lián),數(shù)據(jù)中心與終端之間也是采用IP互聯(lián),數(shù)據(jù)基于統(tǒng)一IP網(wǎng)自由流動。軟件與硬件解耦,計算、存儲、交換基于通用標準硬件,由軟件按需使用硬件資源,以最高效的方式使用硬件資源。在Flash First 3.0階段,F(xiàn)lash將促進計算與存儲的聚合,計算以最高效的內(nèi)存訪問的方式訪問存儲,計算與存儲的界限將變得模糊,存儲離CPU最近,徹底消除CPU與存儲介質(zhì)之間的性能鴻溝。消除了以SCSI為核心的復雜軟件堆棧,徹底簡化編程模型,將硬件資源發(fā)揮至最高效。存儲與計算高度聚合,聚合成單一硬件節(jié)點,單節(jié)點具備計算、存儲、交換的能力,單節(jié)點是緊縮的數(shù)據(jù)中心。節(jié)點之間基于IP互聯(lián),計算與數(shù)據(jù)跨節(jié)點自由流動,多個節(jié)點互聯(lián)就是擴展的數(shù)據(jù)中心。未來的企業(yè)數(shù)據(jù)中心,將從計算、網(wǎng)絡到存儲各個路徑做好適配,數(shù)據(jù)中心效能將得到極大提升,將在硅片上構筑的計算與存儲效能發(fā)揮到極致,實現(xiàn)真正的物盡其用。(阿明)
編者按:由此可見,閃存在數(shù)據(jù)中心演進過程中的不同階段也扮演著不同的角色。作為國內(nèi)最先發(fā)展閃存的國產(chǎn)廠商華為,不僅重視閃存帶來的變化,而且對閃存進化數(shù)據(jù)中心的深刻理解和詮釋。通過這篇“Flash evolve Datacenter 閃存進化數(shù)據(jù)中心”沙龍觀點整理出來的文章,相信大家也對于數(shù)據(jù)中心十年發(fā)展中存儲的變化有了更為全面的了解,對于大家最為關注的閃存在SDS趨勢下扮演什么角色、企業(yè)需要什么樣的閃存的問題,相信大家也從文章中找到了想要的答案,而對于華為閃存整體策略Flash first:從1.0到3.0的細分,相信也給與各位網(wǎng)友耳目一新的感覺。