百度外賣為什么比其他平臺送的快?當(dāng)然不是因?yàn)樗尿T手比別人跑的快,而是由于背后有一套智能的算法,能更加合理地派單、規(guī)劃送餐路線。
這屬于大數(shù)據(jù)的范疇嗎?屬于。
電商平臺的商品推薦系統(tǒng)為什么能推薦給你感興趣的東西?也是因?yàn)檎莆樟四愕臄?shù)據(jù),并據(jù)此分析你的生活、工作習(xí)慣。
這屬于大數(shù)據(jù)的范疇嗎?屬于。
顯然,透過數(shù)據(jù)分析,作為消費(fèi)者,我們能體會(huì)到大數(shù)據(jù)給我們生活帶來的變化(更快地吃到美食,買到自己感興趣的東西);作為商家,則能更好地服務(wù)客戶,發(fā)掘商業(yè)價(jià)值(提升客戶體驗(yàn),獲得更高的業(yè)務(wù)成長)。
這也是為什么大數(shù)據(jù)這么火的主要原因,三贏,除了客戶、企業(yè),還有大數(shù)據(jù)解決方案的提供商。
但這和英特爾有什么關(guān)系嗎?
論應(yīng)用,像百度、阿里、京東,他們這些最終用戶在做,論平臺軟件解決方案,Hadoop、Spark這些開源社區(qū)、解決方案提供商在做,論硬件解決方案,浪潮、聯(lián)想、華為、HPE等基礎(chǔ)架構(gòu)解決方案提供商在做。
答案是有,而且關(guān)系還很大。
2你聽說過不打地基直接蓋房子嗎?反正我沒有。
廣大硬件解決方案提供商如果說是房子,那英特爾就是地基。Intel Inside的slogan不僅適用于PC領(lǐng)域,同時(shí)適用于數(shù)據(jù)中心市場。不完全統(tǒng)計(jì),世界上有90%以上的中小型計(jì)算機(jī)采用的是英特爾的處理器,也就是說絕大多數(shù)的數(shù)據(jù)都是通過英特爾的處理器來處理的。
你還能說大數(shù)據(jù)和它沒關(guān)系嗎?地基和房子共同組成了處理數(shù)據(jù)的硬件平臺。
當(dāng)然,英特爾在大數(shù)據(jù)領(lǐng)域扮演的一個(gè)角色。另外,你見過裝修房子前不測量的嗎?我沒有。
如果平臺軟件解決方案提供商是裝修的話,那英特爾所擔(dān)負(fù)的正是測量那個(gè)環(huán)節(jié)。不測量,裝修無法做到精準(zhǔn),結(jié)果就是費(fèi)時(shí)費(fèi)力費(fèi)錢。英特爾是世界上最大的硬件公司不假,但同樣英特爾也有著世界上最大的軟件研發(fā)團(tuán)隊(duì)。據(jù)悉,它的規(guī)模超過萬人,而硬件與平臺軟件解決方案之間的優(yōu)化、適配就是很重要的一項(xiàng)工作。站在這個(gè)角度看,大數(shù)據(jù)只能是其中的一個(gè)分支。
同樣的,應(yīng)用軟件與硬件之間的關(guān)系,就像是家具家電和房子的關(guān)系,在購買之前也需要測量尺寸。
也就是說,英特爾作為最底層的平臺,無論是與平臺軟件還是應(yīng)用軟件都有不可分割的關(guān)系。其之所以有那么大的軟件研發(fā)團(tuán)隊(duì),原因不明而喻。
于是,我們看到了這樣一個(gè)英特爾,大而全。
硬件層面,不僅是處理器,還有存儲(chǔ)、網(wǎng)絡(luò),英特爾都做,而且都做的不錯(cuò)。
軟件層面,除了發(fā)揮測量功能,對很多項(xiàng)目,包括大數(shù)據(jù)項(xiàng)目,除了進(jìn)行優(yōu)化外,還會(huì)主動(dòng)推出一些開源項(xiàng)目,比如大數(shù)據(jù)領(lǐng)域,英特爾最近推出了TAP(Trusted Analytics Platform,一個(gè)云應(yīng)用程序的加速工具)。
給合作伙伴、用戶的錯(cuò)覺是英特爾軟硬件都要做,而且越做越廣。事實(shí)上并非如此,英特爾的核心業(yè)務(wù)還是在硬件,軟件方面的投入更多還是在服務(wù)硬件,讓用戶有更好的硬件體驗(yàn)。而為了離用戶更近(英特爾并不直接對接用戶),英特爾與很多業(yè)內(nèi)的軟件服務(wù)商都達(dá)成了合作,比如與Hadoop解決方案提供商Cloudera的合作。
Hadoop創(chuàng)始人,Cloudera首席架構(gòu)師Doug Cutting介紹他們在數(shù)據(jù)分析領(lǐng)域的探索,以及與英特爾之間的合作
至于硬件,確實(shí)英特爾涉及的領(lǐng)域在不斷擴(kuò)展,這一點(diǎn)英特爾自己也承認(rèn)。不過聽聽英特爾公司軟件與服務(wù)事業(yè)部副總裁、系統(tǒng)技術(shù)和優(yōu)化部門大數(shù)據(jù)技術(shù)總監(jiān)馬子雅的解釋,或許你會(huì)釋然。
馬子雅表示,確實(shí)任何一個(gè)客戶都不希望被綁定,但為什么英特爾還能不斷擴(kuò)展,而且越做越好。最簡單的道理,這是一個(gè)市場化、優(yōu)勝劣汰的結(jié)果。用戶可能對英特爾有意見,但比較了性能、用戶體驗(yàn)、性價(jià)比等后,可能還是會(huì)選英特爾。從英特爾自身的角度出發(fā),我們希望能給用戶帶來最好的解決方案,于是有了至強(qiáng)、至強(qiáng)融核、FPGA。同樣做網(wǎng)絡(luò)、存儲(chǔ)也都是一個(gè)道理,我們希望給用戶最具性價(jià)比的產(chǎn)品和方案。
盡管情感上你可能不太接受,但道理就是如此。就像筆者聽某大廠說過的一句話,用戶不選你的產(chǎn)品,首先要反思的是你產(chǎn)品是不是足夠好,而不是其他。
當(dāng)使用新技術(shù)后,數(shù)據(jù)處理性能能有幾倍、幾十倍的提升(當(dāng)然,其他方面成本、可靠性、安全性等并沒有太多的變化)時(shí),可能他真的不會(huì)去再糾結(jié)是不是有被綁定的可能。
這樣的例子對于英特爾而言,有很多。
英特爾公司軟件與服務(wù)事業(yè)部副總裁、系統(tǒng)技術(shù)和優(yōu)化部門大數(shù)據(jù)技術(shù)總監(jiān)馬子雅介紹英特爾在大數(shù)據(jù)領(lǐng)域所做的工作
在演講中,馬子雅就舉了幾個(gè)例子。一是,一個(gè)客戶在利用英特爾新一代硬件技術(shù)(最新至強(qiáng)處理器、網(wǎng)絡(luò)、SSD)后,大數(shù)據(jù)的機(jī)組性能整整提高了7倍。
二是中國一個(gè)比較大的互聯(lián)網(wǎng)公司,在其已有的Spark機(jī)組的每臺服務(wù)器加一塊英特爾的SSD,整個(gè)機(jī)組的性能就能提升20%,在此基礎(chǔ)上,利用英特爾開發(fā)的Hierarchical storage management Solution層次性存儲(chǔ)軟件,使得性能再獲大幅度提升,最終的效果是整個(gè)機(jī)組性能提升70%。
三是一個(gè)Hadoop用戶,在傳統(tǒng)Hadoop中,數(shù)據(jù)通常存儲(chǔ)三個(gè)副本,這樣造成了200%存儲(chǔ)資源的浪費(fèi)。為此,英特爾和Cloudera在開源社區(qū)共同主導(dǎo)開發(fā)了一個(gè)項(xiàng)目HDFS Erasure Coding,通過它可以把存儲(chǔ)成本降低一半,并把編碼器和解碼器的性能提升30倍,即便和新的Java編碼器和解碼器相比,性能也提升了6倍。
這樣的例子還有很多,從中也能看出英特爾在其中發(fā)揮的作用,就如前文所講,它不僅僅是個(gè)硬件平臺提供商,在硬件和軟件、硬件和應(yīng)用之間起到了很重要的潤滑作用。