對(duì)于試圖分類和整理大數(shù)據(jù)科技,特別是 Hadoop的那些企業(yè),這是一個(gè)振奮人心的全新信息圖。這個(gè)對(duì)Hadoop的分析,也許能幫助公司的決策領(lǐng)導(dǎo)者更好地了解該技術(shù)平臺(tái)。
1什么是Hadoop?
Apache Hadoop是2005 年(由Apache Software Foundation)開(kāi)發(fā)的開(kāi)源軟件框架,特別為大數(shù)據(jù)和大規(guī)模數(shù)據(jù)處理量身定制。它包含四個(gè)主要模塊:
1. Hadoop Common: 包含其它Hadoop模塊所需的所有庫(kù)和功能。
2. Hadoop 分布式文件系統(tǒng)(Distributed File System),簡(jiǎn)稱HDFS。它是一個(gè)文檔儲(chǔ)存系統(tǒng),能夠在數(shù)據(jù)集群間提供高帶寬。
3. Hadoop Yarn: 管理計(jì)算機(jī)集群中計(jì)算資源的平臺(tái),并利用這些資源做應(yīng)用調(diào)度。
4. Hadoop MapReduce:處理大規(guī)模數(shù)據(jù)的程序模塊。
小貼士
超過(guò)170家公司正在致力于發(fā)展Hadoop,當(dāng)前Hadoop框架的估值為20億美元。
2企業(yè)中的Hadoop
使用Hadoop管理數(shù)據(jù),2014年,每4家企業(yè)就有1家;2012年,每10家公司才有1家。
前5大應(yīng)用行業(yè):計(jì)算機(jī)制造業(yè)、商用服務(wù)、金融、零售和批發(fā)、教育和政府部門。
使用Hadoop的5大原因:低成本,計(jì)算性能,規(guī)??缮炜s性,存儲(chǔ)靈活性,數(shù)據(jù)保護(hù)。
超過(guò)60%的公司表明,Hadoop補(bǔ)充或取代了他們現(xiàn)有的數(shù)據(jù)環(huán)境。
3Hadoop的未來(lái)
61%的機(jī)構(gòu)計(jì)劃在不遠(yuǎn)的未來(lái)部署、或已經(jīng)部分部署了Hadoop。
對(duì)基于Hadoop技術(shù)的全球銷售額:截至2020年將達(dá)到50.2億美元。
高德納咨詢公司(Gartner)表示:
“對(duì)Apache Hadoop使用對(duì)增長(zhǎng),正在促進(jìn)著結(jié)構(gòu)化數(shù)據(jù)的增長(zhǎng),引領(lǐng)企業(yè)去理解如何再利用數(shù)據(jù),賦予數(shù)據(jù)新的用途,并從數(shù)據(jù)中獲得至關(guān)重要的深入理解 。”
4
完整信息圖
來(lái)源:
http://insidebigdata.com/2014/10/18/current-state-hadoop-inforgraphic/