LSI積極創(chuàng)新直面數(shù)據(jù)中心變革

責(zé)任編輯:一三

2013-09-12 09:34:02

摘自:DOIT

不可否認(rèn)我們已經(jīng)身處大數(shù)據(jù)洪流中,無(wú)時(shí)不刻的體驗(yàn)著大數(shù)據(jù)帶來(lái)的價(jià)值。

不可否認(rèn)我們已經(jīng)身處大數(shù)據(jù)洪流中,無(wú)時(shí)不刻的體驗(yàn)著大數(shù)據(jù)帶來(lái)的價(jià)值。面對(duì)大數(shù)據(jù)洪流,數(shù)據(jù)中心已經(jīng)迫在眉睫的需要變革,數(shù)據(jù)中心的基石IT基礎(chǔ)架構(gòu)也需要轉(zhuǎn)變。近日LSI存儲(chǔ)解決方案部執(zhí)行副總裁Phil Brace來(lái)華接受了記者的采訪 ,Phil Brace是LSI公司存儲(chǔ)解決方案部門的執(zhí)行副總裁,之前負(fù)責(zé)所有針對(duì)硬盤驅(qū)動(dòng)、企業(yè)級(jí)磁帶市場(chǎng)以及SSD市場(chǎng)的芯片解決方案。目前主要負(fù)責(zé)LSI企業(yè)級(jí)以及客戶端存儲(chǔ)業(yè)務(wù),包括硬盤SoC 和前置放大器、RAID芯片和控制卡、SAS存儲(chǔ)控制器和閃存存儲(chǔ)處理器業(yè)務(wù)。Phil Brace結(jié)合LSI的產(chǎn)品闡述了自己對(duì)于大數(shù)據(jù)洪流下,數(shù)據(jù)中心變革的理解。

大數(shù)據(jù)時(shí)代機(jī)遇與挑戰(zhàn)

移動(dòng)互聯(lián)時(shí)代,我們每時(shí)每刻感受著數(shù)據(jù)量的沖擊,當(dāng)前每一分鐘就有2.4億封郵件被收發(fā),同時(shí)也會(huì)有長(zhǎng)達(dá)幾十萬(wàn)分鐘的視頻在網(wǎng)絡(luò)上流通。而且數(shù)據(jù)的增長(zhǎng)不會(huì)停止。大量的結(jié)構(gòu)化數(shù)據(jù)以及非結(jié)構(gòu)化數(shù)據(jù)改變這個(gè)世界以及我們的工作和生活。爆炸式的數(shù)據(jù)增長(zhǎng)給IT基礎(chǔ)設(shè)施帶來(lái)機(jī)遇與挑戰(zhàn)。如何處理這些數(shù)據(jù)以及通過(guò)大數(shù)據(jù)分析為人類社會(huì)發(fā)展帶來(lái)價(jià)值?數(shù)據(jù)中心IT基礎(chǔ)架構(gòu)面對(duì)大數(shù)據(jù)的技術(shù)挑戰(zhàn)如何應(yīng)對(duì)?都是值得人們?nèi)ヌ接憽?/p>

Phil Brace舉了兩個(gè)現(xiàn)實(shí)中的例子,來(lái)展示一下有了大數(shù)據(jù),并對(duì)大數(shù)據(jù)進(jìn)行分析能夠帶來(lái)什么樣切實(shí)的效果。

首先是通過(guò)大數(shù)據(jù)分析能實(shí)現(xiàn)對(duì)自然災(zāi)害的快速響應(yīng),2012年10月颶風(fēng)Sandy使得美國(guó)東海岸24個(gè)州受到影響,如果沒(méi)有超級(jí)計(jì)算機(jī)對(duì)于大數(shù)據(jù)的分析,此次災(zāi)害影響會(huì)大很多。通過(guò)超級(jí)計(jì)算機(jī)對(duì)成千上萬(wàn)個(gè)數(shù)據(jù)源分析,做了一個(gè)23小時(shí)多達(dá)760 Data sources的分析,每一天都會(huì)做這樣的仿真模擬的分析,每小時(shí)采集的數(shù)據(jù)量是1TB。預(yù)測(cè)實(shí)時(shí)的風(fēng)速、水的溫度,為颶風(fēng)周邊30英里內(nèi)造成的影響提供預(yù)測(cè),幫助政府可以及時(shí)在颶風(fēng)降臨之前,做好人員撤離災(zāi)區(qū),對(duì)災(zāi)難進(jìn)行應(yīng)對(duì),準(zhǔn)確的數(shù)據(jù)和實(shí)時(shí)應(yīng)急響應(yīng)挽救了更多的生命。

其次是對(duì)數(shù)據(jù)分析掀起醫(yī)療革命,大家知道人類基因組圖譜的繪制對(duì)于醫(yī)學(xué)來(lái)說(shuō)是偉大的一件事情。從2000年開始一直到2013年,總計(jì)投入了數(shù)以十億美金的投資,來(lái)做人類基因圖譜的解析。但是現(xiàn)在,過(guò)去需要13年完成的基因組工作,現(xiàn)在在一個(gè)月內(nèi)就可以做完。可以想象一下,一個(gè)基因是0.5TB的數(shù)據(jù)量,有幾萬(wàn)個(gè)基因要去分析,有幾十億個(gè)病人要分析不同的基因,所以單指在醫(yī)藥一個(gè)領(lǐng)域,大數(shù)據(jù)就可以為我們提供巨大的價(jià)值。

其實(shí)還有很多領(lǐng)域,比如智能的能源、交通、視頻監(jiān)控等等,有很多應(yīng)用案例。比如只是在倫敦一個(gè)城市,就安裝了500萬(wàn)個(gè)攝像頭。所以大家就可以看到大數(shù)據(jù)的意義何在。

大數(shù)據(jù)推動(dòng)計(jì)算架構(gòu)轉(zhuǎn)型為數(shù)據(jù)流架構(gòu)

通過(guò)案例我們可以總結(jié)大數(shù)據(jù)具有三個(gè)特性,多元、海量、高速。多元是在數(shù)據(jù)源的來(lái)源可以來(lái)自各個(gè)方面。手機(jī)、記錄、結(jié)構(gòu)化、非結(jié)構(gòu)化等等成千上萬(wàn)的數(shù)據(jù)源。海量是指大數(shù)據(jù)當(dāng)然是指海量的數(shù)據(jù),我們估計(jì)在2012年的數(shù)據(jù)總量達(dá)到2.8ZB。到2020年,預(yù)測(cè)是有40ZB的數(shù)據(jù)量產(chǎn)生,也就意味著在這段時(shí)間里會(huì)有一個(gè)數(shù)據(jù)20倍的增加量。高速是我們每一分鐘每一小時(shí)都會(huì)面臨非常多的數(shù)據(jù)涌入。總之一切都需要我們?cè)诙嘣?、高速、海量的?shù)據(jù)中分析提取出真正有價(jià)值的數(shù)據(jù)。

如何提取有價(jià)值的數(shù)據(jù)?分三步驟,首先是從不同的數(shù)據(jù)源采集各種數(shù)據(jù)(需要計(jì)算能力創(chuàng)新),其次需要保存這些數(shù)據(jù)(需要存儲(chǔ)能力的創(chuàng)新),最后需要對(duì)數(shù)據(jù)進(jìn)行分析(需要軟硬件結(jié)合快速融合的解決方案)。因此需要對(duì)現(xiàn)有的工具、產(chǎn)業(yè)環(huán)境以及基礎(chǔ)架構(gòu)進(jìn)行創(chuàng)新。“第一是我們要有工具,工具就是像Hadoop這樣的一些框架協(xié)議,它能夠分析大型的數(shù)據(jù)。第二是需要開放的生態(tài)系統(tǒng),比如說(shuō)像Openstack,及其它的開源項(xiàng)目。第三是IT基礎(chǔ)設(shè)施,我們需要硬件軟件的結(jié)合去處理大數(shù)據(jù)。”Phil Brace講到。

可以看出,貫穿云的大數(shù)據(jù),整個(gè)IT架構(gòu)從“計(jì)算”架構(gòu)轉(zhuǎn)型為“數(shù)據(jù)流”架構(gòu)。企業(yè)將面對(duì)更多更復(fù)雜的數(shù)據(jù)傳輸、共享和存儲(chǔ)的壓力。對(duì)于IT基礎(chǔ)架構(gòu)及解決方案帶來(lái)了全新的課題。

順應(yīng)大數(shù)據(jù) LSI不斷技術(shù)創(chuàng)新

知道如何提取有價(jià)值的數(shù)據(jù)步驟之后,通過(guò)怎樣的技術(shù)實(shí)現(xiàn)數(shù)據(jù)采集、存儲(chǔ)以及分析?LSI提供的產(chǎn)品和技術(shù)示范滿足數(shù)據(jù)中心基礎(chǔ)架構(gòu)規(guī)模及經(jīng)濟(jì)性?Phil Brace 全面介紹了LSI全面的產(chǎn)品與技術(shù)。Phil Brace認(rèn)為當(dāng)前面臨的不再簡(jiǎn)單的是一個(gè)計(jì)算的系統(tǒng),而是一個(gè)數(shù)據(jù)流的系統(tǒng)。

如何更好的去采集、存儲(chǔ)以及分析數(shù)據(jù),首先介紹第一個(gè)領(lǐng)域,數(shù)據(jù)的采集。我們面臨著各種各樣的數(shù)據(jù)源,面對(duì)豐富的資源類型和數(shù)據(jù)格式,各種服務(wù)和計(jì)費(fèi)要求。需要保證服務(wù)質(zhì)量與安全。“無(wú)線基站里面有一個(gè)器件是多核的處理器,正是因?yàn)橛羞@樣的處理器,它能夠以線速動(dòng)態(tài)的捕獲整個(gè)網(wǎng)絡(luò)流量的情況,知道現(xiàn)在進(jìn)來(lái)的流量?jī)?yōu)先級(jí)別是如何的。”Phil Brace講到。LSI提供的異構(gòu)多核處理器Axxia以及可定制化芯片為數(shù)據(jù)采集提供充足的引擎。

LSI提供怎么的存儲(chǔ)產(chǎn)品?從采集再到保留數(shù)據(jù),也就是存儲(chǔ)的部分。在整個(gè)架構(gòu)中,我們要去存儲(chǔ)、保留數(shù)據(jù),要求就是你的容量必須是可擴(kuò)展的、利用率要高、高可用性、保證數(shù)據(jù)的完整性,核心的挑戰(zhàn)是什么呢?就是它的復(fù)原力,要有非常低的宕機(jī)時(shí)間(故障時(shí)間少),低成本條件下的高可用性性以及低錯(cuò)誤率。Phil Brace重點(diǎn)介紹了如何解決閃存存儲(chǔ)面臨的復(fù)原力的挑戰(zhàn)。他談了LSI最新的技術(shù)亮點(diǎn)。

第一,LSI支持東芝19nm閃存,LSI SandForce SF-2000閃存控制器現(xiàn)已支持東芝第二代先進(jìn)19nm NAND閃存存儲(chǔ)器,使SSD制造商能夠制造出成本更低的SSD產(chǎn)品。每Gb的Flash成本降低了,單位存儲(chǔ)數(shù)量更高了。這樣就面臨一個(gè)重要的技術(shù)問(wèn)題,因?yàn)镕lash越做越小,它可以用來(lái)存儲(chǔ)電流的電子數(shù)量也越來(lái)越小了,所以導(dǎo)致它的錯(cuò)誤率提高。

為了解決閃存錯(cuò)誤率高的現(xiàn)象,LSI創(chuàng)新了新技術(shù)LSI SHIELD技術(shù)。這是一種高級(jí)的糾錯(cuò)方法,即便同時(shí)使用出錯(cuò)率較高的廉價(jià)閃存存儲(chǔ)器也能實(shí)現(xiàn)企業(yè)級(jí)的SSD耐久度和數(shù)據(jù)完整性。為了讓大眾通俗易懂,Phil Brace比喻:假設(shè)你在跟我用英文進(jìn)行對(duì)話,我的英文是有口音的,可能某一個(gè)單詞你聽不清楚到底我說(shuō)的是什么,但是根據(jù)前后的單詞你可以判斷出這個(gè)詞是什么,這就是SHIELD來(lái)做糾錯(cuò)的原理。”也就是通過(guò)分析錯(cuò)誤碼前后的數(shù)據(jù)高頻率的實(shí)現(xiàn)閃存糾錯(cuò)。

關(guān)鍵是當(dāng)我們面對(duì)閃存九千次/秒的編程擦寫速度,BCH、LDPC因?yàn)殄e(cuò)誤碼太多不能糾錯(cuò),但是SHIELD的技術(shù)仍然沒(méi)有問(wèn)題。即使又提高了一倍,到一萬(wàn)八千次/秒讀寫的速度,這時(shí)候出現(xiàn)的錯(cuò)誤點(diǎn)基本上已經(jīng)沒(méi)法糾錯(cuò)了,但是SHIELD仍然能夠達(dá)成目標(biāo)。

還有一個(gè)亮點(diǎn)是LSI的可擴(kuò)展能力技術(shù),針對(duì)典型數(shù)據(jù)庫(kù)應(yīng)用,通過(guò)LSI DVC(DuraWrite Virtual Capacity)功能,其規(guī)劃出的虛擬容量可以達(dá)到原物理容量的三倍。可以理解為新增的虛擬容量可以顯著降低用戶每GB的用戶存儲(chǔ)成本。“這個(gè)壓縮技術(shù)是軟硬件結(jié)合的。其實(shí)我們看到其底層的技術(shù),把它叫做動(dòng)態(tài)壓縮,指的是我們可以動(dòng)態(tài)的改變頁(yè)面的大小,比如一般來(lái)說(shuō)有16K的大小,但有的時(shí)候它不是16K,可能要變得更小。所以這個(gè)時(shí)候我們就用軟件來(lái)做這樣一種映射,然后動(dòng)態(tài)的調(diào)整頁(yè)面的大小。”Phil Brace講到。

接下來(lái)談數(shù)據(jù)的分析。LSI提供服務(wù)器與存儲(chǔ)連接解決方案以及PCIe閃存解決方案。數(shù)據(jù)的高速傳輸就是我們面臨的挑戰(zhàn),即如何提高數(shù)據(jù)的效率,同時(shí)有高容量、高性能、低成本、低功耗。LSI方案采用6Gb/s驅(qū)動(dòng)器獲得126Gb/s的性能。LSI推出了Nytro新的產(chǎn)品系列,目的就是降低延遲,提高響應(yīng)速度。

通過(guò)數(shù)據(jù)的采集、存儲(chǔ)和分析,三個(gè)領(lǐng)域的深入分析,LSI不斷解決解決用戶在大數(shù)據(jù)方面的技術(shù)難點(diǎn)。最后Phil Brace講到“我們現(xiàn)在已經(jīng)從PC時(shí)代進(jìn)入了移動(dòng)計(jì)算的時(shí)代,未來(lái)的下一個(gè)時(shí)代是什么呢?就是以數(shù)據(jù)為中心的時(shí)代。而大數(shù)據(jù)三個(gè)特點(diǎn),多元、高速、海量。以及未來(lái)基礎(chǔ)設(shè)施有足夠的規(guī)模以及經(jīng)濟(jì)性,這些因素推動(dòng)移動(dòng)計(jì)算的架構(gòu)到數(shù)據(jù)流的架構(gòu)的轉(zhuǎn)換。為了順應(yīng)這種變化,LSI必須有智能的芯片解決方案,比如閃存、可共享的DAS的架構(gòu),以及異構(gòu)的多核的處理器。為我們剛剛邁進(jìn)全新的數(shù)據(jù)中心時(shí)代做準(zhǔn)備。 ”

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號(hào)-6京公網(wǎng)安備 11010502049343號(hào)