Ashish Thusoo, Qubole的CEO和聯(lián)合創(chuàng)始人,最近在 Enterprise Data World Conference (EDW)上談到了作為一種服務(wù)產(chǎn)品的“云中巨象” Hadoop 。大數(shù)據(jù)作為服務(wù)而不是一個產(chǎn)品會成為一個趨勢,Hadoop作為一種服務(wù)提供,旨在幫助機構(gòu)處理大規(guī)模運行的Hadoop服務(wù)的挑戰(zhàn)和成本。這些基于云服務(wù)的解決方案也可以從云服務(wù)的其他功能中獲益,如動態(tài)配置、計算和存儲的靈活性以及在多個地區(qū)的可用性。
Ashish在開始談?wù)摃r說到,現(xiàn)在數(shù)據(jù)的性質(zhì),包括海里的交互數(shù)據(jù),都是非結(jié)構(gòu)化的。而不僅僅是我們長期以來傳統(tǒng)應(yīng)用程序里處理數(shù)據(jù)結(jié)構(gòu)化數(shù)據(jù)。
分析的性質(zhì)也發(fā)生了改變。Ashish談到了分析值從描述性向規(guī)范性分析的發(fā)展。
描述性分析(發(fā)生了什么?)診斷性分析(為什么發(fā)生?)預(yù)測性分析(將會發(fā)生什么?)規(guī)范性分析(我們怎樣才會讓它發(fā)生?)云提供很多好處,如按需和彈性擴展架構(gòu),高可擴展的對象存儲和處理,和自適應(yīng)的基礎(chǔ)設(shè)施。使用云大數(shù)據(jù)平臺提供更快的生產(chǎn)時間、敏捷和基礎(chǔ)設(shè)施的靈活性以及顯著降低成本。
Virtual Private Cloud (VPC)提供隔離訪問計算和存儲,以及提供安全實踐。VPC的安全性包括云存儲中的數(shù)據(jù)和網(wǎng)絡(luò)數(shù)據(jù),以及基于訪問計算和存儲的角色加密選項。
現(xiàn)代數(shù)據(jù)處理平臺包括多個處理引擎,可以處理各種案例,如下面列舉出:
復(fù)雜批次處理SQL,Hive數(shù)據(jù)科學(xué),Spark簡單交互SQL查詢,Presto批量數(shù)據(jù)清洗(ETL),Map ReduceAshish 還談?wù)摿嘶谠破脚_的大數(shù)據(jù)參考架構(gòu),包括多租戶數(shù)據(jù)訪問、引擎統(tǒng)一、云計算服務(wù)和可移植性服務(wù)等。他總結(jié)報告說,Hadoop作為一種服務(wù)提供在大數(shù)據(jù)架構(gòu)決策時是一個吸引人眼球的選擇。
查看英文原文:Elephant in the Cloud - Hadoop as a Service