企業(yè)網(wǎng)D1Net 3月11日訊
據(jù)阿里巴巴員工羅李在微博上透露:阿里云梯,這個(gè)國(guó)內(nèi)最大Hadoop集群,下線已經(jīng)進(jìn)入倒計(jì)時(shí)。此消息一出,引發(fā)業(yè)界一片嘩然。
羅李,花名鬼厲,是阿里“云梯”集群的元老級(jí)創(chuàng)立者,也是阿里分布式計(jì)算團(tuán)隊(duì)的第一批員工,長(zhǎng)期從事分布式存儲(chǔ)和hadoop系統(tǒng)的研究和開(kāi)發(fā)。 對(duì)于自己一手創(chuàng)建的阿里云梯的啞然而止,羅李在微博上顯得非常沉痛。
阿里云梯,即阿里巴巴的Hadoop集群,是處理阿里巴巴海量數(shù)據(jù)存儲(chǔ)與計(jì)算的系統(tǒng)。其計(jì)算模塊已經(jīng)進(jìn)化到了Hadoop Yarn,能支持MapReduce、Spark、MPI、RHive、RHadoop等多個(gè)計(jì)算模型。阿里云梯,可謂是代表了阿里數(shù)據(jù)平臺(tái)的一個(gè)時(shí)代。
資料來(lái)自QCon大會(huì)
停了如此龐大而有價(jià)值的阿里云梯項(xiàng)目,阿里打算拿什么取代呢?既聲勢(shì)浩大的去IOE之后,阿里難道打算去Hadoop?
據(jù)傳,阿里確實(shí)深受現(xiàn)有Hadoop版本之苦,由于不是Hadoop項(xiàng)目管理委員會(huì)的成員,Hadoop開(kāi)源社區(qū)的發(fā)展并不受阿里的控制和影響,這使得阿里不能很好地定制Hadoop,在研發(fā)上受制頗多。
但是,Hadoop目前已經(jīng)是大數(shù)據(jù)分布式平臺(tái)的主流選擇,如果說(shuō)去IOE可以認(rèn)為是傳統(tǒng)IT向互聯(lián)網(wǎng)轉(zhuǎn)型的必然,去Hadoop?聽(tīng)上去并不現(xiàn)實(shí)。
據(jù)小編了解,阿里云梯有兩個(gè)版本,被停掉的是云梯1,底層為Hadoop,而云梯2的底層為阿里自主研發(fā)的飛天分布式平臺(tái)。事實(shí)上,阿里巴巴早在2008年,就已經(jīng)組建了飛天項(xiàng)目。
另?yè)?jù)微博網(wǎng)友@vinW透露,云梯2用C++重寫(xiě)并改良的hadoop,在性能上超出云梯1,而且擁有更多的自主知識(shí)產(chǎn)權(quán)。
如此看來(lái),云梯2恐怕會(huì)成為阿里數(shù)據(jù)平臺(tái)的主力,作為一家有野心的互聯(lián)網(wǎng)公司,阿里巴巴做出這樣的技術(shù)路線選擇雖在意料之外,卻也在情理之中。