為了滿足移動應(yīng)用開發(fā)的需求,現(xiàn)有的Hadoop應(yīng)用程序應(yīng)該得到充分利用。
根據(jù)CIMI公司最新的一項(xiàng)研究調(diào)查顯示,企業(yè)考慮支持把加強(qiáng)移動辦公人員移動性和生產(chǎn)效率的新型應(yīng)用程序作為最高優(yōu)先級來開發(fā)。這意味著大多數(shù)公司已經(jīng)采用或者正在采用, Hadoop框架很可能將不得不與移動應(yīng)用程序整合。
整合Hadoop和移動應(yīng)用程序的過程可以分解為三部分:
認(rèn)識Hadoop在移動使用中的固有局限性
創(chuàng)建真實(shí)的Hadoop應(yīng)用程序框架
在移動應(yīng)用程序中提供Hadoop支持和故障排除
Hadoop是一個(gè)開放實(shí)現(xiàn)的MapReduce模型,用于處理大型分布式數(shù)據(jù)庫。由于Hadoop關(guān)聯(lián)到云以及云部署,大多數(shù)人忽略了一點(diǎn),Hadoop有些屬性不適合一般企業(yè)的需求,特別是移動應(yīng)用程序。下面是其中的一些特點(diǎn):
1. Hadoop的最大價(jià)值在于數(shù)據(jù)庫,而Hadoop所用的數(shù)據(jù)庫是移動應(yīng)用程序所用數(shù)據(jù)庫的10到1000倍。對于許多人來說,使用Hadoop就是殺雞用牛刀。
2. Hadoop有顯著的設(shè)置和處理開銷。 Hadoop工作可能會需要幾分鐘的時(shí)間,即使相關(guān)數(shù)據(jù)量不是很大。
3. Hadoop在支持具有多維上下文數(shù)據(jù)結(jié)構(gòu)方面不是很擅長。例如,一個(gè)定義給定地理變量值的記錄,然后使用垂直連接,來連續(xù)定義一個(gè)比hadoop使用的鍵值對定義更復(fù)雜的數(shù)據(jù)結(jié)構(gòu)關(guān)系。
4. Hadoop必須使用迭代方法處理的問題方面用處不大——尤其是幾個(gè)連續(xù)有依賴性步驟的問題。
綜上所述,移動應(yīng)用程序通常不應(yīng)該被設(shè)計(jì)為一個(gè)新的Hadoop應(yīng)用。而調(diào)整Hadoop來滿足移動應(yīng)用的需求,需要通過移動應(yīng)用連接利用現(xiàn)有的Hadoop應(yīng)用。