高可擴(kuò)展性
Hadoop是一個(gè)高度可擴(kuò)展的存儲(chǔ)平臺(tái),因?yàn)樗梢源鎯?chǔ)和分發(fā)橫跨數(shù)百個(gè)并行操作的廉價(jià)的服務(wù)器數(shù)據(jù)集群。不同于傳統(tǒng)的關(guān)系型數(shù)據(jù)庫(kù)系統(tǒng)不能擴(kuò)展到處理大量的數(shù)據(jù),Hadoop是能給企業(yè)提供涉及成百上千TB的數(shù)據(jù)節(jié)點(diǎn)上運(yùn)行的應(yīng)用程序。
成本效益
Hadoop還為企業(yè)用戶提供了極具成本效益的存儲(chǔ)解決方案。傳統(tǒng)的關(guān)系型數(shù)據(jù)庫(kù)管理系統(tǒng)的問(wèn)題是,他并不符合海量數(shù)據(jù)的處理器,不能夠符合企業(yè)的成本效益。許多公司過(guò)去不得不假設(shè)那些數(shù)據(jù)最優(yōu)價(jià)值,然后根據(jù)這些有價(jià)值的數(shù)據(jù)設(shè)定分類,如果保存所有的數(shù)據(jù),那么成本就會(huì)過(guò)高。雖然這種方法可以短期內(nèi)實(shí)現(xiàn)工作,但是隨著數(shù)據(jù)量的增大,這種方式并不能很好的解決問(wèn)題。
Hadoop的架構(gòu)則不痛,其被設(shè)計(jì)為一個(gè)向外擴(kuò)展的架構(gòu),可以經(jīng)濟(jì)的存儲(chǔ)所有公司的數(shù)據(jù)供以后使用,節(jié)省的費(fèi)用是非常驚人的,Hadoop提供數(shù)百TB的存儲(chǔ)和計(jì)算能力,而不是幾千塊錢就能解決的問(wèn)題。
Hadoop靈活性更好
靈活性更好
Hadoop能夠使企業(yè)輕松訪問(wèn)到新的數(shù)據(jù)源,并可以分析不同類型的數(shù)據(jù),從這些數(shù)據(jù)中產(chǎn)生價(jià)值,這意味著企業(yè)可以利用Hadoop的靈活性從社交媒體、電子郵件或點(diǎn)擊流量等數(shù)據(jù)源獲得寶貴的商業(yè)價(jià)值。
此外,Hadoop的用途非常廣,諸如對(duì)數(shù)處理、推薦系統(tǒng)、數(shù)據(jù)倉(cāng)庫(kù)、市場(chǎng)活動(dòng)分析以及欺詐檢測(cè)。
Hadoop處理更快
Hadoop擁有獨(dú)特的存儲(chǔ)方式,用于數(shù)據(jù)處理的工具通常在與數(shù)據(jù)相同的服務(wù)器上,從而導(dǎo)致能夠更快的處理器數(shù)據(jù),如果你正在處理大量的非結(jié)構(gòu)化數(shù)據(jù),Hadoop能夠有效的在幾分鐘內(nèi)處理TB級(jí)的數(shù)據(jù),而不是像以前PB級(jí)數(shù)據(jù)都要以小時(shí)為單位。
容錯(cuò)能力
使用Hadoop的一個(gè)關(guān)鍵優(yōu)勢(shì)就是他的容錯(cuò)能力。當(dāng)數(shù)據(jù)被發(fā)送到一個(gè)單獨(dú)的借點(diǎn),該數(shù)據(jù)也被復(fù)制到集群的其它節(jié)點(diǎn)上,這意味著在故障情況下,存在另一個(gè)副本可供使用。
總結(jié):當(dāng)涉及到處理大量數(shù)據(jù)集以及安全和成本效益的時(shí)候,Hadoop相比關(guān)系型數(shù)據(jù)庫(kù)管理系統(tǒng)更具有優(yōu)勢(shì)。它適用于任何規(guī)模的非結(jié)構(gòu)化數(shù)據(jù)持續(xù)增長(zhǎng)的企業(yè),將幫助企業(yè)持續(xù)發(fā)現(xiàn)商業(yè)價(jià)值。