戴爾葉毓睿:戴爾Fluid Cache for SAN實(shí)現(xiàn)500萬IOPS

責(zé)任編輯:editor006

2014-12-11 14:51:53

摘自:存儲在線

2014年12月2日,由中國軟件行業(yè)協(xié)會、中國計(jì)算機(jī)學(xué)會、武漢國家光電實(shí)驗(yàn)室和國防科技大學(xué)大力支持,DOIT傳媒和存儲在線聯(lián)合主辦的中國數(shù)據(jù)存儲年度盛會—— 2014(第十屆)中國存儲峰會今天在北京盛大開幕。比如說我們可以靈活的去組織多個(gè)服務(wù)器

2014年12月2日,由中國軟件行業(yè)協(xié)會、中國計(jì)算機(jī)學(xué)會、武漢國家光電實(shí)驗(yàn)室和國防科技大學(xué)大力支持,DOIT傳媒和存儲在線聯(lián)合主辦的中國數(shù)據(jù)存儲年度盛會—— 2014(第十屆)中國存儲峰會今天在北京盛大開幕。作為中國存儲產(chǎn)業(yè)的十年盛會,峰會以“掌控?cái)?shù)據(jù)經(jīng)濟(jì)·重塑商業(yè)價(jià)值”為主題,邀請超過1500位學(xué)術(shù)界頂級學(xué)者、產(chǎn)業(yè)精英和企業(yè)用戶出席,圍繞數(shù)據(jù)經(jīng)濟(jì)和商業(yè)價(jià)值兩大話題,從云計(jì)算、大數(shù)據(jù)、軟件定義和閃存等四個(gè)技術(shù)方面舉行一系列主題演講和圓桌會議。

在下午的閃存分論壇上,戴爾架構(gòu)師 葉毓睿發(fā)表了題為《為應(yīng)用提速!戴爾Fluid Cache for SAN實(shí)現(xiàn)500萬IOPS!》的主題演講,從應(yīng)用的角度出發(fā)探討實(shí)現(xiàn)500萬IOPS這一驚人話題。以下是文字實(shí)錄:

葉毓睿:首先簡單介紹一下我自己,我叫Peter Ye,我之前是在一家Compellent存儲,公司在2011年被戴爾收購,現(xiàn)在是在戴爾的渠道部任職存儲顧問,支持戴爾的合作伙伴,去做一些培訓(xùn)或者技術(shù)支持。

10月23號參加中國的閃存論壇,當(dāng)時(shí)聽了一下有各個(gè)解決方案里面,比如說在全閃存陣列里,據(jù)說有50萬的、90萬的、100萬的、200萬的,實(shí)際當(dāng)這個(gè)性能到100萬的時(shí)候,單純靠磁盤陣列內(nèi)的已經(jīng)很難支撐了,而且成本非常高。所以現(xiàn)在我們用了新的方式去突破這個(gè)瓶頸,就是Fluid Cache for SAN的解決方案。

今天我要給大家介紹的這個(gè)綱要在這里,在介紹之前我們可以先看一下什么是Fluid Cache for SAN,它的優(yōu)勢以及它的場景。然后我會結(jié)合我們的實(shí)際的案例,也就是在最近的一個(gè)月的時(shí)間,由我本人親自參與的一個(gè)非常大的項(xiàng)目的一個(gè)POC(驗(yàn)證)測試,一個(gè)很大的用戶,他也在旁邊觀察,看著測試結(jié)果。

首先我想請大家配合一下,就是今年的淘寶雙十一沒有在網(wǎng)上購物的請舉手。大部分都有,今年的淘寶的雙十一突破了去年,達(dá)到了571億的人民幣,我觀察了一下,它這個(gè)高峰時(shí)期的交易數(shù)在每秒8萬筆,這是最高峰期的時(shí)候。待會兒我會介紹一個(gè)實(shí)際用戶的測試案例是每秒大約在6萬5千多,雖然可能不是對等的比較,但是從量級幾乎可以達(dá)到這樣的程度。

我們在進(jìn)行購物的時(shí)候可能最不能忍受是什么呢?就是當(dāng)你去點(diǎn)頁面半天沒有出來,或者點(diǎn)提交的時(shí)候又在那里停止,其實(shí)這個(gè)就是它的延時(shí)過長。這樣的一個(gè)性能的問題會使客戶體驗(yàn)大大降低,客戶有可能不再訪問這個(gè)網(wǎng)站或者去別的地方,這樣也意味著生意的流失。我們看到在這個(gè)當(dāng)中會有哪些因素導(dǎo)致?比如低效的代碼,還有可能是基礎(chǔ)架構(gòu)的原因,基礎(chǔ)架構(gòu)最可能成為瓶頸的往往是存儲。為什么?我們可以看一下。這是我們看到在過去二三十年里面CPU的發(fā)展以幾千萬倍的速度發(fā)展,而存儲我們看到從原來的7200轉(zhuǎn)到15000轉(zhuǎn),它的延時(shí)始終是在毫秒這一級,這當(dāng)中有一個(gè)巨大的差距,這樣的差距就意味著存儲的性能實(shí)際上和CPU去相比較是它的一百萬分之一,怎么彌補(bǔ)這個(gè)差距呢?我們可以看一下。

實(shí)際上已經(jīng)有一些手段和方案去彌補(bǔ)這樣的延時(shí)差距,比方說我們用像戴爾的存儲SC系列里面有一個(gè)很好的功能,就是頻繁訪問數(shù)據(jù)集中在外圈,不頻繁訪問的歷史數(shù)據(jù)集中在內(nèi)圈,這樣就可以減少機(jī)械臂的擺動,僅此一個(gè)功能就可以使得像SATA(改成:SAS)盤等等可以提升20%的性能。還有一種方式就是一個(gè)IO寫進(jìn)來,分散到所有的磁盤陣列,顯示燈同閃同滅,它突破了以前的局限性,可以使得性能隨著磁盤增加而提升。再就是自動分級,后面還會詳細(xì)講自動分級。

所以看到有一些相應(yīng)的對癥下藥的方案,接下來我們可以看一下在后方存儲部署快速的閃存盤,早些時(shí)候我們需要300多塊盤才能堆出9000個(gè)IOPS,當(dāng)我們把SSD用起來,放到我們的磁盤陣列里,像全閃存這樣的陣列。一塊盤有讀有寫的情況下大概到8000個(gè)IOPS,這個(gè)性能已經(jīng)提升了很多,能耗降低了很多。但是這還不夠,那么這樣的方式我們需要注意什么呢?那么它的成本到底多高,壽命怎么樣,現(xiàn)在出現(xiàn)了很多SSD,但是市場主流使用的是SLC和MLC,一個(gè)是寫密集型,一個(gè)是讀密集型的盤。寫密集型SLC的壽命可以達(dá)到30萬次的全擦寫,讀密集型MLC可以達(dá)到3萬次?;谶@樣的一些東西,戴爾的存儲SC系列采取了一個(gè)非常好的辦法叫做讀寫分離,怎么做呢?我們可以讓這些新寫入的數(shù)據(jù)或者修改的數(shù)據(jù)都存放在寫密集型盤,然后定期會遷移到讀密集型盤,這上面的數(shù)據(jù)只能被讀,這樣就使得讀密集型盤只有3萬次的壽命的局限性被規(guī)避了,寫都是在寫密集型盤完成,這個(gè)也是存儲界,僅僅戴爾的SC系列才有。

比如像6塊400G的SLC,加上6塊1.6TB的MLC,我們可以提供12TB的SSD性能,但是比純粹用SLC的方式大概下降到三分之二甚至二分之一。這些都是我們考慮的對癥下藥的一些手段。

實(shí)際我們這邊給出一個(gè)案例,就是應(yīng)該是在上半年,我們已經(jīng)成功落單了一個(gè)案例,我們和SAP HANA的集成案例。最早的時(shí)候它原有的系統(tǒng)要做分析,做BI分析需要兩個(gè)小時(shí)才能出結(jié)果,然后在計(jì)算過程中經(jīng)常發(fā)生中斷,但是全閃存陣列以后20秒以內(nèi)就可以出來了。

前面講的三個(gè)技術(shù)還不夠,只是部分解決了從存儲到CPU的鴻溝。現(xiàn)在來看一下我們還有什么方式,我們探討一下為什么會出現(xiàn)這種情況,其實(shí)在后面講有一個(gè)好處,之前都已經(jīng)介紹了,就是因?yàn)镮O延遲比較長。我們可以看到一個(gè)IO從服務(wù)器產(chǎn)生寫到磁盤陣列里,要經(jīng)過內(nèi)存CPU,還有光纖,還有前端卡到內(nèi)存,再到存儲的后端的SAS卡等等,經(jīng)歷10個(gè)環(huán)節(jié)甚至更多,所以IO延遲非常長,即使吞吐的帶寬大,但還是幫助不了,還是要走這些環(huán)節(jié),延遲一定在毫秒級。

PCIe SSD性能很高,延遲更是能縮短到微秒級。但是PCIe SSD也面臨挑戰(zhàn),比如這個(gè)服務(wù)器插了幾塊PCIe SSD,如果沒有用完,其他的服務(wù)器又沒有PCIe SSD的時(shí)候可以共享使用它的空間嗎?當(dāng)PCIe SSD的服務(wù)器出了問題,或者就是PCIe SSD的設(shè)備本身出了問題,那么你的數(shù)據(jù)是不是能夠很好的保護(hù)起來?你的業(yè)務(wù)是不是能夠不中斷?還有你的方式是只為寫入進(jìn)行加速和只為讀進(jìn)行加速,或者兩者都可以進(jìn)行加速嗎?再一個(gè)我現(xiàn)在已經(jīng)把PCIe SSD插好了,比如有兩塊總共800G的容量,如果容量不夠可不可以在線擴(kuò)容,應(yīng)對應(yīng)用規(guī)模不斷增長。

實(shí)際上我們有一個(gè)很好的方式來解決,就是我們會創(chuàng)建一個(gè)高速的共享閃存層,叫做FAN(Flash Area Network),這個(gè)高速共享閃存層簡單講就是我們的PCIe SSD能夠把各個(gè)服務(wù)器所內(nèi)嵌的PCIe SSD納入到一個(gè)全局的虛擬緩存池里面,而且在這個(gè)緩存池里面去做數(shù)據(jù)的保護(hù),而且這個(gè)緩存池可以共享使用,可以動態(tài)的擴(kuò)容。但是這個(gè)還不是最重要的,最重要是什么?我們這個(gè)數(shù)據(jù)放在服務(wù)器里總覺得數(shù)據(jù)不夠安全,還是覺得數(shù)據(jù)寫到磁盤陣列才是最安全。所以我們和后端的存儲機(jī)緊密集成在一起,數(shù)據(jù)最后會到磁盤陣列上的。這里就提到了前面也有一些朋友提到的技術(shù),為什么要提到PCIe SSD呢?其實(shí)也是因?yàn)橛辛薘DMA,才幫助到我們在虛擬緩存池做這樣的數(shù)據(jù)保護(hù)。戴爾網(wǎng)絡(luò)交換機(jī)S4800就是0.8微秒,我們寫到服務(wù)器的PCIe SSD,我們的PCIe SSD會立刻復(fù)制到另外一個(gè)服務(wù)器的PCIe SSD,就是用的RDMA的技術(shù),這樣一來一回反復(fù)確認(rèn),總的延遲不會超過5微秒,這樣的延遲會使前端服務(wù)器感覺好象就是在本地進(jìn)行讀寫,本地就進(jìn)行反饋確認(rèn)了,非常快,把整個(gè)的IO延遲從毫秒縮短到微秒級。

那么我們這個(gè)Fluid Cache for SAN解決方案的特點(diǎn)是什么?首先它主要是針對OLTP在線交易和VDI,重點(diǎn)是提供低延遲,非常小的延遲。然后通過數(shù)據(jù)靠近計(jì)算,同時(shí)做到什么呢?從服務(wù)器一直到后端存儲都沒有單點(diǎn)故障,可以有效把數(shù)據(jù)保護(hù)起來,在任何一個(gè)時(shí)刻都至少會有兩份數(shù)據(jù)。而且不只是說讀加速,我們還可以為寫進(jìn)行加速,因?yàn)槲覀冎С只貙?也即Write Back)的緩存技術(shù),就是IO不是一定寫到磁盤陣列才反回去。我們使用單個(gè)界面,可以把Fluid Cache管理起來,可以動態(tài)的在線增減SSD設(shè)備,或者在線增減服務(wù)器節(jié)點(diǎn)。通過這樣同樣的單一界面也可以把后端的存儲管理起來,只需一個(gè)界面就可以管理,也不會因?yàn)槎嗉业膹S商的整合需要找不同的維護(hù)人員。我們還是一個(gè)開放性平臺,可以兼容其他的硬件,比如在我們這個(gè)PCIe SSD里面實(shí)際有兩種角色,一個(gè)是高速緩存服務(wù)器貢獻(xiàn)者,就是插了SSD盤的一些服務(wù)器節(jié)點(diǎn),還有一些沒有插SSD的叫高速緩存服務(wù)器客戶端,對高速緩存服務(wù)器客戶端這樣的角色可以不用戴爾品牌的服務(wù)器,可以用其他品牌的服務(wù)器。最近的測試就把華為的服務(wù)器放進(jìn)去測試,同樣也可以為它的數(shù)據(jù)庫進(jìn)行提速。包括網(wǎng)絡(luò)交換機(jī)也可以支持其他品牌。

我們來看一下它的拓?fù)鋱D,常規(guī)狀況下我們的使用就是前端有各種各樣的服務(wù)器,有些可能是做集群,這些服務(wù)器都集中去訪問我們的共享存儲的邏輯卷,原來是直接訪問。如果是Fluid Cache for SAN一開始我們會先架設(shè)一個(gè)專有的高速的網(wǎng)絡(luò),這個(gè)網(wǎng)絡(luò)通常就是由比如說前面提到的S6000或者S4800的交換機(jī),還有服務(wù)器里插Mellanox網(wǎng)卡,一起就構(gòu)成了一個(gè)私有的高速網(wǎng)絡(luò),在這個(gè)網(wǎng)絡(luò)利用RDMA的技術(shù)使得一個(gè)服務(wù)器可以很快讀寫另外一個(gè)服務(wù)器節(jié)點(diǎn)上SSD的數(shù)據(jù)。如果服務(wù)器作為貢獻(xiàn)者,需要配置PCIe SSD。其他品牌的服務(wù)器,盡管它不能成為貢獻(xiàn)者,但它同樣能享用高速緩存池來提升性能,我注意到前面一個(gè)講座也提到了,大概是10:9,就是如果有貢獻(xiàn)者可能可以跑到100萬,那客戶端可以跑到90萬,因?yàn)樗难舆t確實(shí)非常短,只有微秒的延遲。

再來看一下,這時(shí)候我們就安裝這個(gè)流動緩存的軟件,接下來做的是什么?就是單一管理界面里面,把原來我的服務(wù)器和存儲映射的邏輯卷,把這個(gè)邏輯卷映射到高速緩存池,經(jīng)過映射完之后,這些邏輯卷就會被迅猛地提速,而且它提供靈活性,不是說你存儲的一百個(gè)邏輯卷都提速,而是有選擇的,那些邏輯卷希望被提速的,才通過映射放到高速緩存池上,有很大的方便。

我們這個(gè)方式和其他的解決方案的最大區(qū)別在哪呢?首先其他解決方案到目前為止通常還是停留在這個(gè)階段,雖然在服務(wù)器可以支持PCIe SSD,但都是各自為政,沒有形成一個(gè)Cache Pool。但我們可以,Cache Pool可以被大家共享使用。即便沒有插PCIe SSD的節(jié)點(diǎn),比如華為或浪潮的服務(wù)器,或者可能原來老舊服務(wù)器,也可以利用這個(gè)Cache Pool為應(yīng)用提速。

最后我們這些數(shù)據(jù)是和磁盤陣列緊密結(jié)合在一起的。數(shù)據(jù)都會每隔一段時(shí)間會Flush(刷新)到磁盤陣列上,讓它真正落地,形成數(shù)據(jù)保護(hù)。它有什么優(yōu)勢?我們總結(jié)一下。

比如說我們可以靈活的去組織多個(gè)服務(wù)器,構(gòu)成不同的高速緩存池,一個(gè)存儲可以支持多個(gè)不同的緩存池,或者一個(gè)緩存池可以有多個(gè)存儲。一個(gè)緩存池(也即Cache Cluster)里的多個(gè)服務(wù)器節(jié)點(diǎn),可以規(guī)劃出不同的子集群,為不同的應(yīng)用或者應(yīng)用集群提速。不僅為讀進(jìn)行加速,還可以為寫進(jìn)行加速,第一次寫就加速?,F(xiàn)在這個(gè),是戴爾的服務(wù)器帶來的一個(gè)獨(dú)特的優(yōu)勢,我們可以在服務(wù)器的前面板通過獨(dú)有的技術(shù)把2.5寸的PCIe SSD進(jìn)行熱插拔,后面的案例分享就有,在線增減SSD設(shè)備。

第四個(gè)優(yōu)勢也是很獨(dú)特的,當(dāng)我的后端的磁盤陣列要創(chuàng)建一個(gè)保護(hù)點(diǎn)的時(shí)候,為了確保數(shù)據(jù)的一致性會發(fā)出一個(gè)請求,告訴流動緩存軟件,讓它把尚未刷新到磁盤陣列的虛擬頁先刷新到磁盤陣列,刷完之后再創(chuàng)建保護(hù)點(diǎn),這樣在那個(gè)時(shí)間創(chuàng)建的確實(shí)是你要的數(shù)據(jù),沒有數(shù)據(jù)丟失或者一致性的問題。這個(gè)也是目前為止我們獨(dú)一無二的優(yōu)勢。

2013年12月的時(shí)候邁克爾.戴爾親自演示了這個(gè)解決方案,他可以冒這么大勇氣也是因?yàn)楹茏孕?,因?yàn)槟敲炊鄥挠脩艉兔襟w記者,當(dāng)時(shí)演示就是8臺的普通的兩路服務(wù)器R720,每個(gè)都插PCIe SSD,然后后面接SC8000,穩(wěn)定地跑到了517萬IOPS,延時(shí)不到6毫秒。我們經(jīng)過測試8臺的服務(wù)器的集群可以使得原來的Oracle延時(shí)縮短到1%,如果是SQL縮短到14%,提升是很可觀的。那使用場景包括OLTP和ERP等等。包括在一些基礎(chǔ)架構(gòu)云平臺里面,這是所列出來的一些行業(yè),如金融、政府、醫(yī)療、教育、制造、零售等。

接下來是最近我們做的測試,給一個(gè)超級大的用戶,他想觀察我們的流動緩存,首先我們測試一個(gè)節(jié)點(diǎn)的情況下,可以跑到42萬IOPS,這個(gè)跟剛才我們前面Intel介紹的都差不多,就是400多K左右,一個(gè)節(jié)點(diǎn)只看一塊PCIe SSD盤,如果一個(gè)節(jié)點(diǎn)放兩塊還可以提升,大概可以提升到60多萬個(gè)IOPS,延時(shí)不到0.3毫秒。再增加一個(gè)節(jié)點(diǎn)可以線性增加到85萬IOPS,延時(shí)仍然不到0.3毫秒,再增加一個(gè)節(jié)點(diǎn)可以達(dá)到122萬IOPS,延時(shí)大概在0.3毫秒。如果放兩塊SSD,每個(gè)節(jié)點(diǎn)就是60萬的IOPS。這個(gè)可能大家覺得不夠信服,現(xiàn)在來給你們看一個(gè)模擬用戶實(shí)際應(yīng)用的場景。

用戶的需求是做大規(guī)模的并發(fā)定發(fā),比方說他希望在2000萬條,這怎么分配?是200個(gè)并發(fā)用戶,每個(gè)用戶執(zhí)行10萬次提交,就是先查A表,這個(gè)A表是十多億條記錄的表,B表是二十多億條記錄的表。每一次查就是一個(gè)10多億的表,相當(dāng)于全表掃描,然后再插入到B表。這里比一次性5000條記錄提交或者10000條記錄再提交的要求更苛刻,這種情況下用戶當(dāng)時(shí)期望是什么?就是時(shí)長不要超過一個(gè)小時(shí),延時(shí)平均響應(yīng)時(shí)間不要超過40毫秒。在這里,我特別強(qiáng)調(diào)延時(shí),這是因?yàn)?,用戶的使用場景有點(diǎn)類似網(wǎng)上購物,需要買到各個(gè)設(shè)備是測試之后延時(shí)最短的,因?yàn)樗U纤腎O從CPU產(chǎn)生到最后落地到盤里,再返回確認(rèn)給CPU,整個(gè)延時(shí)要非常短,各個(gè)環(huán)節(jié)要盡量的壓縮延時(shí),又為了確保數(shù)據(jù)的真實(shí),所以提出了200個(gè)并發(fā)用戶,查10萬次,而不是一個(gè)用戶。所以我們看到友商的高端存儲是用了75分鐘,延時(shí)是85毫秒。那我們沒有用流動緩存,僅僅用戴爾的一個(gè)兩級閃存技術(shù),就是讀寫分離的這種方式,我們測到2000萬只用了47分鐘,27毫秒。所以對這個(gè)成績我們很受鼓舞,就繼續(xù)加大它的量,5000萬條,我們用了500個(gè)并發(fā)用戶,用戶要求并發(fā)運(yùn)行,這時(shí)候我們只用了66分鐘,時(shí)間稍微超一點(diǎn),但延時(shí)是在40毫秒以內(nèi),每秒鐘的交易是12500,這個(gè)是我們用的業(yè)內(nèi)知名的Benchmark Factory的工具,這是工具截圖,延時(shí)僅38毫秒。后來我們起用流動緩存,我們用的5個(gè)節(jié)點(diǎn)的,非常驚人,用戶大受鼓舞,延時(shí)才6毫秒,時(shí)間僅僅是12分鐘??梢钥吹矫棵氲慕灰讛?shù)可以達(dá)到6萬5千多筆。前面提過,淘寶是每秒8萬多筆,雖然不是對等的比較,但是數(shù)量級相差不大。我們還沒用到8個(gè)節(jié)點(diǎn),只用了5個(gè)節(jié)點(diǎn)。我們算了一下和我們自己全閃存比較都提升了五六倍,無論從時(shí)間還是延時(shí),剛才的毫秒是38,到這里只剩下6毫秒,提升了6倍以上,IOPS從一萬多到六萬多,時(shí)間從66分鐘到12分鐘。

我們想乘勝追擊,繼續(xù)考慮一億條的記錄,這時(shí)候用的更多并發(fā)用戶了,1000個(gè)并發(fā)用戶。要知道,這么多用戶,IO爭用會導(dǎo)致延時(shí)的增加。但是也還不錯,半個(gè)小時(shí),延時(shí)只有16毫秒,TPS稍微低一點(diǎn),但也有5萬多,所以用戶已經(jīng)決定購買我們的存儲。

除了剛才看到的驚人的IOPS值和延時(shí)縮短外,還有很多特點(diǎn)我們做了測試。比如在線增加SSD設(shè)備,我們在線增加了第二個(gè)SSD設(shè)備,除了Cache Pool有動態(tài)擴(kuò)大外,IOPS從44.2萬提升到了60.9萬,而且延時(shí)還減小了,從0.29毫秒降到了0.2毫秒。包括在線增加節(jié)點(diǎn),這里特意找了一個(gè)異構(gòu)服務(wù)器,就是一臺華為服務(wù)器,從合作伙伴那里借了一臺華為服務(wù)器,這里顯示的這個(gè)空間給Cache Pool貢獻(xiàn)的都是0,因?yàn)樗皇亲鰹榭蛻舳?。我們動態(tài)的增加進(jìn)去,也增加了一些戴爾服務(wù)器,作為貢獻(xiàn)者服務(wù)器增加,也即含有SSD設(shè)備,都可以讓Cache Pool容量增加。相應(yīng)我們?nèi)匀粶y了很多數(shù)據(jù),當(dāng)時(shí)用了200個(gè)用戶并發(fā)跑在這個(gè)服務(wù)器上,這個(gè)其他品牌的服務(wù)器仍然享有被提速的好處,達(dá)到兩萬多的TPS的值。

實(shí)際上流動緩存是戴爾現(xiàn)在非常先進(jìn)的技術(shù)方案,到目前為止還沒有其他的解決方案可以比這個(gè)方案更先進(jìn),由于我們采用的是自己的服務(wù)器、網(wǎng)絡(luò)交換機(jī)以及存儲,所以當(dāng)用戶選用的時(shí)候不會因?yàn)椴煌桨傅慕M合出現(xiàn)售后問題扯皮現(xiàn)象,而且一個(gè)界面可以管理,非常簡便。

流動緩存也是屬于戴爾的軟件定義存儲的眾多方案之一,為什么這么說呢?首先戴爾其實(shí)它的一個(gè)理念是什么?沒有說一個(gè)軟件定義存儲的軟件或者產(chǎn)品可以適用于所有的場景,而是根據(jù)用戶不同需求推薦。像這種超高性能一定是推我們自己的知識產(chǎn)權(quán)的,然后在一些虛擬化場景有可能推PS系列,或者PowerVault MD等等這些方案。但是在高性能這部分一定是這個(gè)方式,而且流動緩存的未來的潛力還非常巨大,因?yàn)橹八峭ㄟ^我們收購的一個(gè)RNA演進(jìn)過來的,RNA可以兼容所有的服務(wù)器,它甚至可以全局虛擬化每一個(gè)服務(wù)器的內(nèi)存,只是說現(xiàn)在出于成本考慮有沒有必要現(xiàn)在就做。而且它還能夠虛擬化每一個(gè)服務(wù)器節(jié)點(diǎn)的SAS盤,所以它未來的發(fā)展?jié)摿€很巨大,很有軟件定義存儲的特征的。

我們大致做了一個(gè)分類,現(xiàn)在進(jìn)入到全閃存時(shí)代,大家聽說過比如兩年以后單位GB的固態(tài)盤可能低于SAS盤,這樣一個(gè)時(shí)代怎么應(yīng)對不同的性能負(fù)載的需求?比如5萬以內(nèi)IOPS,戴爾存儲MD系列或PS系列可以考慮,或者是IOPS在數(shù)千個(gè)到數(shù)十萬個(gè),我們會推薦戴爾存儲的SC系列。當(dāng)然在數(shù)十萬以上的IOPS還有一個(gè)選擇就是流動緩存,與其在磁盤陣列里堆幾百個(gè)固態(tài)盤,還不如去結(jié)合前端的PCIe SSD的技術(shù),這樣的話有可能單位IOPS的價(jià)格會更低,這是在這個(gè)區(qū)間的處理,這是戴爾的解決方案。

額外再提一句,我們經(jīng)常聽到兩年以后單位的GB的固態(tài)盤價(jià)格可能低于單位GB的SAS盤。但如果使用戴爾的解決方案,現(xiàn)在就能實(shí)現(xiàn)。為什么?我們對全閃存陣列的有不同的看法,我們認(rèn)為全閃存陣列現(xiàn)在很好,可能很多用戶需要,但是用戶買的時(shí)候就覺得成本很高,怎么辦?應(yīng)該是可以支持混合陣列的方式,全閃存可以和客戶端的一萬多轉(zhuǎn)或者7000轉(zhuǎn)的盤有機(jī)融合,數(shù)據(jù)可以流動。你全閃存的話是在這,如果是讀寫分離系列價(jià)格可能會降到三分之二或者二分之一,很多歷史數(shù)據(jù)顯示沒有必要放全閃存盤,再結(jié)合7200轉(zhuǎn)的盤就可以變成這個(gè)綠色的線,可以比純粹的15000轉(zhuǎn)的配置還要便宜,而且性能是全15000轉(zhuǎn)SAS盤的幾十倍?,F(xiàn)在就可以以磁盤價(jià)格獲取閃存性能,前提是全閃存可以支持與后端機(jī)械盤做混合,否則就變成兩個(gè)孤島了。

再來看一下我們的閃存最近在幾個(gè)月里的捆綁的銷售包,比如說戴爾存儲PS系列,我們?nèi)绻怯盟腜S6210XS,是用的9個(gè)800G的,17個(gè)1萬轉(zhuǎn)的SAS盤。這個(gè)價(jià)格可能在幾十萬,二三十萬,具體要跟銷售聯(lián)系。如果是像能夠采用流動緩存的只有10%的用戶,剩下90%的用戶如果想用高性能負(fù)載,考慮預(yù)算控制的時(shí)候可以考慮SC 4000這個(gè)產(chǎn)品,比方用6個(gè)400GB的SLC加6個(gè)1.6TB的MLC,支持三千個(gè)虛擬桌面的用戶,達(dá)到95000個(gè)IOPS,如果需要擴(kuò)容還可以增長12塊,仍然是2U高,里面雙控和24塊盤全都包括了。當(dāng)然還能繼續(xù)擴(kuò)展到更多盤箱。如果純粹是6+6價(jià)格不會超過60萬人民幣,所以相比其他友商的全閃存常常超過100萬的成本來講,戴爾SC4000是非常好的選擇。

最后總結(jié)一下就是我們的流動緩存的優(yōu)勢,數(shù)據(jù)靠近計(jì)算,不存在單點(diǎn)故障。不僅對讀加速,還對寫加速。還有一個(gè)就是使用單個(gè)界面,可以在線增加節(jié)點(diǎn),比如從5個(gè)到8個(gè)節(jié)點(diǎn),或者在線增加SSD設(shè)備,而且配制靈活,可以選擇某些卷加速,某些卷不加速。都可以統(tǒng)統(tǒng)在一個(gè)大的Cache Pool里提速,而且我們兼容其他的硬件。

今天我這部分就到這里,謝謝大家!

相關(guān)資訊噱頭?淺談PCI-E 3.0和SSD硬盤的那點(diǎn)事噱頭?淺談PCI-E 3.0和SSD硬盤的那點(diǎn)事再掀閃存熱 英特爾發(fā)布三款PCIe閃存卡再掀閃存熱 英特爾發(fā)布三款PCIe閃存卡閃存2.0加速數(shù)據(jù)中心存儲變革閃存2.0加速數(shù)據(jù)中心存儲變革2毫米等于1TB容量!Intel黑科技新3D閃存2毫米等于1TB容量!Intel黑科技新3D閃存從存儲軟件到軟件定義存儲的演繹史從存儲軟件到軟件定義存儲的演繹史Memblaze基于PMC Flashtec NVMe控制器推出最新一代閃存加速卡Memblaze基于PMC Flashtec NVMe控制器推出最新一代閃存加速卡Host-Based和Device-Based閃存卡走向融合存儲專欄:Host-Based和Device-Based閃存卡走向融合IT雙日談:“大”有所失 “小”有作為IT雙日談:“大”有所失 “小”有作為英特爾將推出32層256Gb 3D NAND閃存顆粒: 10TB SSD不是夢英特爾將推出32層256Gb 3D NAND閃存顆粒: 10TB SSD不是夢3300MHz DDR4內(nèi)存面市 高頻DDR4普及在望3300MHz DDR4內(nèi)存面市 高頻DDR4普及在望

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號-6京公網(wǎng)安備 11010502049343號