分享我的Hadoop成長路線

責(zé)任編輯:editor005

2015-03-10 13:18:11

摘自:56iot

還在實(shí)驗(yàn)室時(shí),老師就建議看google關(guān)于大數(shù)據(jù)的三篇論文,啃了好長時(shí)間還是沒完全理解。2012年7月份我第一次參加easyhadoop講座,聽大師們的分享,我內(nèi)心就自我暗示,需要跟他們交流,需要加入這個(gè)組織。

Hadoop

  hadoop啟蒙

還在實(shí)驗(yàn)室時(shí),老師就建議看google關(guān)于大數(shù)據(jù)的三篇論文,啃了好長時(shí)間還是沒完全理解。也動(dòng)手搭建了Hadoop集群,運(yùn)行了wordcount,帶著“Hadoop會(huì)火“的指示離開了實(shí)驗(yàn)室。

Hadoop入門

2011年初我加入了一個(gè)互聯(lián)網(wǎng)流量分析運(yùn)營項(xiàng)目,開始真正實(shí)戰(zhàn)Hadoop,編寫mapreduce程序。項(xiàng)目主要是對用戶瀏覽的url進(jìn)行分析,挖掘用戶的上網(wǎng)行為偏好,進(jìn)行精準(zhǔn)營銷。整個(gè)項(xiàng)目應(yīng)用到hadoop的地方只有兩個(gè),就是對url進(jìn)行去重和排序。這個(gè)項(xiàng)目持續(xù)了一年多,大部分的時(shí)間我還是在實(shí)現(xiàn)業(yè)務(wù)邏輯。

此時(shí)“大數(shù)據(jù)的概念”在國內(nèi)慢慢熱起來了,使我更堅(jiān)信了”hadoop值得依賴”。

1.我把當(dāng)時(shí)中文論壇關(guān)于Hadoop相關(guān)的技術(shù)貼都過了一遍。

2.精讀了Pro Hadoop 一書。

3.蹲點(diǎn)百度知道好一陣子,專挑Hadoop帖子回答,賺了不少積分。

4.在計(jì)算機(jī)科雜志上發(fā)表了一篇關(guān)于mr優(yōu)化的文章。

這一年多的積累讓我真正在Hadoop這個(gè)領(lǐng)域入門了。

Hadoop平臺初建

2012年國內(nèi)大規(guī)模使用Hadoop的公司還不算多,我知道自己此時(shí)最需要的是一個(gè)平臺,更專注的去做一些事情。并不是每個(gè)人都那么幸運(yùn),而我很幸運(yùn)的在那時(shí)加入現(xiàn)在的公司,很幸運(yùn)的跟到了一個(gè)好leader。又碰巧公司在這個(gè)時(shí)候需要重新規(guī)劃一個(gè)更大且開放Hadoop集群(150節(jié)點(diǎn)),很幸運(yùn)的這個(gè)事情是交由我來負(fù)責(zé)。

7月-8月:調(diào)研安全開放的Hadoop集群方案

9月:制定開放流程、用戶手冊,使用規(guī)范,集群機(jī)房遷移

10月份:集群正式對外開放運(yùn)營

在Hadoop開放的頭一個(gè)月里,我開始接觸平臺用戶,和大伙慢慢熟悉起來,大伙遇到Hadoop的問題都會(huì)先來問我,把我當(dāng)成了”Hadoop專家”。其實(shí)在那之前,積累的個(gè)人實(shí)戰(zhàn)經(jīng)驗(yàn)還是比較匱乏的。懂得就回答,不懂的我就查閱資料,跟蹤源碼,也許就是這種”羅森塔爾效應(yīng)”,讓我的Hadoop技術(shù)得到快速的成長。

Hadoop平臺運(yùn)營

在2013年的Hadoop平臺運(yùn)營過程中:

懂得了用戶需要引導(dǎo),培訓(xùn)的;

懂得了流程規(guī)范有時(shí)候可以繞開技術(shù)難題;

懂得了監(jiān)控報(bào)警多多益善;

懂得了技術(shù)也是需要運(yùn)營;

學(xué)會(huì)了培養(yǎng)用戶信任感;

學(xué)會(huì)透過用戶的描述找到真正的需求;

學(xué)會(huì)了用計(jì)算投入產(chǎn)出比來做決策;

學(xué)會(huì)了對用戶只講困難不做拒絕;

了解了每個(gè)人做事的風(fēng)格特點(diǎn)。

方法論

2014年我們將Hadoop平臺的成功經(jīng)驗(yàn)借鑒到日志系統(tǒng)、Storm集群、kafka集群、Spark集群、統(tǒng)一監(jiān)控系統(tǒng)、Hbase集群。讓我體會(huì)到了很多道理都是相通的,確實(shí)是有方法可以總結(jié)的,我們需要進(jìn)行階段性的自我思考和總結(jié),搭建維護(hù)一套屬于自己的方法論。

技術(shù)分享

技術(shù)分享一方面是為了分享經(jīng)驗(yàn),另一方面也是促使自我思考,總結(jié),加深理解。

2012年7月份我第一次參加easyhadoop講座,聽大師們的分享,我內(nèi)心就自我暗示,需要跟他們交流,需要加入這個(gè)組織。

9月份我將兩個(gè)多月的研究成果總結(jié)成一個(gè)主題在easyhadoop另一次講座上給大家做了分享,這是我職業(yè)生涯的第一次對外分享。

之后一有新的研究成果我都會(huì)找機(jī)會(huì)參加講座進(jìn)行分享,結(jié)識業(yè)界的牛人并進(jìn)行交流。

這兩年大大小小的主題也分享了10余次,每次分享的主題基本都不一樣,沉淀了不少知識,也培養(yǎng)了我的結(jié)構(gòu)性思維。

鼓勵(lì)大家在自己的領(lǐng)域?qū)ふ乙粋€(gè)可以交流的組織,有機(jī)會(huì)就去分享,犯錯(cuò)是成長最快的方式。

鳴謝

總結(jié)這幾年,運(yùn)氣一直很好,在恰當(dāng)?shù)臅r(shí)候做了對的事情,讓我成長了技術(shù),也積累了許多技術(shù)之外的寶貴經(jīng)驗(yàn)。

感謝tuboo這些年帶我升級打怪,感謝小伙伴們杰出的成果讓我在外面能有牛逼可以吹,感謝老婆對我經(jīng)常熬夜加班的諒解!這一路來要感恩的人和事太多了!

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號-6京公網(wǎng)安備 11010502049343號