當(dāng)前,隨著企業(yè)規(guī)模的不斷成長,有效存儲和管理長期累積的且仍在持續(xù)快速增長的海量數(shù)據(jù),從中發(fā)掘商業(yè)價值,意味著巨大的市場機(jī)遇;同時,也帶來了 嚴(yán)峻的挑戰(zhàn):大數(shù)據(jù)將挑戰(zhàn)企業(yè)在存儲架構(gòu)及數(shù)據(jù)中心基礎(chǔ)設(shè)施等,也會引發(fā)數(shù)據(jù)倉庫、數(shù)據(jù)挖掘、商業(yè)智能、云計(jì)算等應(yīng)用的連鎖反應(yīng)。如何選擇有效的組織管理 數(shù)據(jù),提供商業(yè)解決方案,已經(jīng)不是單純的IT技術(shù)問題,而是與企業(yè)未來發(fā)展前途攸關(guān)的關(guān)鍵性問題。
面對大數(shù)據(jù)存在的機(jī)遇與挑戰(zhàn),在以“海量數(shù)據(jù) 深度分析 智慧商業(yè)”為主題的第二屆大數(shù)據(jù)世界論壇上來自不同行業(yè)的專家就大數(shù)據(jù)的發(fā)展與機(jī)遇做了詳細(xì)的介紹。
NetApp大中華區(qū)技術(shù)及專業(yè)服務(wù)部總監(jiān)何英華就大數(shù)據(jù)時代的存儲之道作了主題發(fā)言。
何英華指出,大數(shù)據(jù)指的是那些超越了傳統(tǒng)典型工具可以采集、存儲、管理和分析的數(shù)據(jù)集合。大數(shù)據(jù)就是大量、速度快、比較復(fù)雜,還有結(jié)構(gòu)性、非結(jié)構(gòu)性,它可能是一個電郵,可能是一個圖片,可能是不同的數(shù)據(jù)、影像等等。
大分析(Analytics)、高帶寬(Banduidth)、大內(nèi)容(Content)就是ABC。大分析:分析是要對數(shù)據(jù)有一個洞見,超大數(shù)據(jù)的實(shí)時分析;高帶寬:數(shù)據(jù)一來就要分析結(jié)果,做出報表;大內(nèi)容:大內(nèi)容是基本上不要丟失任何的東西。
把數(shù)據(jù)放到不同的存儲,拿出來到放計(jì)算機(jī)的時候需要一個非常好的硬盤渠道,通過很大的帶寬,在中間不能丟失任何數(shù)據(jù)。怎么樣在存儲方面體現(xiàn)出?
大數(shù)據(jù)——保持簡單
我們的策略也是非常簡單的,就是ABC這樣來做。所以,在不同的地方我們用不同的應(yīng)用,在分析方面提到大數(shù)據(jù),每一個廠家都提到 Hadoop,Hadoop應(yīng)該是有一個非常創(chuàng)新的聯(lián)盟,在開發(fā)Hadoop應(yīng)用有實(shí)時的分析等等。在高帶寬方面有一些video方面要處理,在大內(nèi)容上 有一些內(nèi)容。在這三個方面都有開發(fā)產(chǎn)品去應(yīng)和。
大數(shù)據(jù)存儲市場的機(jī)會
在大分析、高帶寬、大內(nèi)容來看,Netapp在大容量方面作為領(lǐng)先的一個供應(yīng)商,每年的增長是35%,在未來我們可以看到有更高容量的增長。
Analytics 大分析之Netapp解決方案
企業(yè)級Hadoop解決方案。打包集成的部署就緒的模塊化Hadoop集群,我們有一個策略聯(lián)盟,Hadoop的創(chuàng)始人就是在這個公司里做CIO。我們 和Hadoop中是密不可分的關(guān)系,放到我們的存儲中,在容量方面會有160%的增長。所以,在大分析的地方作為一個聯(lián)盟來達(dá)到結(jié)果。
Banduidth高帶寬之Netapp解決方案
全動態(tài)視頻存儲解決方案。去年我們收購了一系列存儲系統(tǒng),在這些方面可以對帶寬速度需要非常高的數(shù)據(jù)進(jìn)行存儲管理,我們通過一系列的產(chǎn)品來達(dá)到這方面的解決方案,達(dá)到30GB/S的峰值,其他很難有產(chǎn)品可以達(dá)到。
Banduidth高性能計(jì)算 HPC-Lustre解決方案。
在不同的行業(yè),比如政府,國防,能源,石油方面,制造業(yè)方面,我們都有非常好的案例。
Content 大內(nèi)容之Netapp解決方案
存儲方面StorageGRID這個產(chǎn)品,它有不同的協(xié)議,有CIFS、NFS、RESTfulhTTP等存儲協(xié)議,也是上幾萬億對象存儲的一個產(chǎn)品。
大數(shù)據(jù)存儲的IT采購標(biāo)準(zhǔn)
如果要做大數(shù)據(jù),在存儲采購方面有什么考慮?在這方面,我跟大家談的就是幾個方向:
1、向上擴(kuò)展與向外擴(kuò)展。我們最常常說話的scale out就是橫向和縱向的擴(kuò)展,我們這里是向上擴(kuò)展和向外自擴(kuò)展能力是非常大的,加上 scale out集群的應(yīng)用可以支持橫向的應(yīng)用。
2、工作負(fù)載優(yōu)化架構(gòu)。大數(shù)據(jù)處理的實(shí)時是非常重要的,在負(fù)載方面有非常好的能力。
3、整合的數(shù)據(jù)保護(hù)。
4、不中斷的運(yùn)營。一天24小時不中斷的運(yùn)營,擴(kuò)展的時間也是可以不停機(jī)的,用戶一天24小時,一個星期7天都可以應(yīng)用。但是對于數(shù)據(jù)中心的管理員來說,也可以增加很多部署,比如增加硬盤、增加磁盤、增加節(jié)點(diǎn),把數(shù)據(jù)從不同的地方遷移,做一些整合等等,所以這是一個不中斷的營運(yùn)。
5、服務(wù)自動化。
在大數(shù)據(jù)的應(yīng)用開發(fā)采購方面,我們給用戶一些建議,我們都可以達(dá)到這些要求。
ONTAP和E系列的應(yīng)用領(lǐng)域
數(shù)據(jù)從總部到偏遠(yuǎn)的地方,我們都可以用到Data ONTAP管理。而E系列,在大數(shù)據(jù)方面分析、衛(wèi)星拍下來的影像等等,在醫(yī)療行業(yè)方面系統(tǒng)的應(yīng)用。所以,部門和行業(yè)的應(yīng)用是在E系列。
在大數(shù)據(jù)里面很多的應(yīng)用都具備E系列和FSA都是無縫的,這兩個產(chǎn)品有一個非常好的作用,它是一個非常高性能的應(yīng)用。
Analytics、Banduidth、Content,我們有很好的專業(yè)服務(wù),可以幫助我們的客戶去開發(fā)Hadoop和工具來發(fā)展應(yīng)用,在帶寬方面我們有很多計(jì)算,在內(nèi)容方面我們有對象存儲,我們都在FSA系列和E系列都有分工,有無縫的連接。