百度大數(shù)據(jù)走出煉丹爐
9月2日消息, 世界杯已過(guò)去兩個(gè)多月,但百度通過(guò)大數(shù)據(jù)實(shí)現(xiàn)了對(duì)世界杯相對(duì)精準(zhǔn)的預(yù)知,“完勝”微軟、谷歌、高盛等IT大佬,至今依然令人印象深刻。而早在今年百度大數(shù)據(jù)開(kāi)放大會(huì)上,搞計(jì)算機(jī)學(xué)術(shù)理論的懷進(jìn)鵬校長(zhǎng)談到大數(shù)據(jù),聽(tīng)眾們還覺(jué)得是一記悶棍。
實(shí)際上,懷校長(zhǎng)的演講在開(kāi)頭部分講了大數(shù)據(jù)在這個(gè)時(shí)代對(duì)我們傳統(tǒng)思維的沖擊,一些價(jià)值觀的建立,而可穿戴之父阿萊克斯·彭特蘭則從另一個(gè)角度解讀了關(guān)于大數(shù)據(jù)的一些看法。
可穿戴之父談百度大數(shù)據(jù):精確預(yù)測(cè)向全球創(chuàng)新借力
全球七大權(quán)威大數(shù)據(jù)專家之一的阿萊克斯·彭特蘭(Alex Pentland)日前接受專訪時(shí)談到,百度精確預(yù)測(cè)世界杯是一次深度學(xué)習(xí)技術(shù)運(yùn)用的成功案例,同時(shí)他還談到了對(duì)百度大數(shù)據(jù)戰(zhàn)略的看法,認(rèn)為百度的成功在于它超越了創(chuàng)新的地域邊界,懂得如何向全球創(chuàng)新借力。
彭特蘭指出:“深度學(xué)習(xí)技術(shù)比傳統(tǒng)人工智能更加高級(jí),能夠通過(guò)數(shù)據(jù)的搜集和發(fā)掘幫助人類更好地做出決定。”
彭特蘭在評(píng)價(jià)百度大數(shù)據(jù)產(chǎn)品時(shí)說(shuō),正如與其他公司一樣,百度開(kāi)發(fā)了許多非常棒的產(chǎn)品和應(yīng)用,這說(shuō)明百度已經(jīng)逐漸找到了如何把紙上談兵的數(shù)據(jù)轉(zhuǎn)化為具有實(shí)際運(yùn)用價(jià)值的產(chǎn)品的有效方式。
他還指出,百度是世界人口最多國(guó)家的第一大搜索引擎,因而在發(fā)展大數(shù)據(jù)領(lǐng)域具有非常好的天然優(yōu)勢(shì),并且百度本身是一個(gè)強(qiáng)大的公司,擁有強(qiáng)大的技術(shù)和市場(chǎng)作為支撐,也正是基于此,他們成了這個(gè)行業(yè)的翹楚之一。
說(shuō)到大數(shù)據(jù),究竟什么是大數(shù)據(jù)呢?
以百度為例。百度大數(shù)據(jù)引擎一共分三個(gè)部分。
開(kāi)放云:百度的大規(guī)模分布式計(jì)算和超大規(guī)模存儲(chǔ)云。過(guò)去的百度云主要面向開(kāi)發(fā)者,大數(shù)據(jù)引擎的開(kāi)放云則是面向有大數(shù)據(jù)存儲(chǔ)和處理需求的“大開(kāi)發(fā)者”。
百度的開(kāi)放云擁有超過(guò)1.2萬(wàn)臺(tái)的單集群,超過(guò)阿里飛天計(jì)劃的5k集群。百度開(kāi)放云還擁有CPU利用率高、彈性高、成本低等特點(diǎn)。百度是全球首家大規(guī)模商用ARM服務(wù)器的公司,而ARM架構(gòu)的特征是能耗小和存儲(chǔ)密度大,同時(shí)百度還是首家將GPU(圖形處理器)應(yīng)用在機(jī)器學(xué)習(xí)領(lǐng)域的公司,實(shí)現(xiàn)了能耗節(jié)省的目的。
數(shù)據(jù)工廠:開(kāi)放云是基礎(chǔ)設(shè)施和硬件能力,你可以把數(shù)據(jù)工廠理解為百度將海量數(shù)據(jù)組織起來(lái)的軟件能力。就像數(shù)據(jù)庫(kù)軟件的位置一樣。只不過(guò)數(shù)據(jù)工廠是被用作處理TB級(jí)甚至更大的數(shù)據(jù)。
百度數(shù)據(jù)工廠支持單詞百TB異構(gòu)數(shù)據(jù)查詢,支持SQL-like以及更復(fù)雜的查詢語(yǔ)句,支持各種查詢業(yè)務(wù)場(chǎng)景。同時(shí)百度數(shù)據(jù)工廠還將承載對(duì)于TB級(jí)別大表的并發(fā)查詢和掃描,大查詢、低并發(fā)時(shí)每秒可達(dá)百GB,在業(yè)界已經(jīng)是很領(lǐng)先的能力了。
百度大腦:有了大數(shù)據(jù)處理和存儲(chǔ)的基礎(chǔ)之后,還得有一套能夠應(yīng)用這些數(shù)據(jù)的算法。圖靈獎(jiǎng)獲得者N.Wirth(沃斯)提出過(guò)“程序=數(shù)據(jù)結(jié)構(gòu)+算法”的理論。如果說(shuō)百度大數(shù)據(jù)引擎是一個(gè)程序,那么它的數(shù)據(jù)結(jié)構(gòu)就是數(shù)據(jù)工廠+開(kāi)放云,而算法則對(duì)應(yīng)到百度大腦。
百度大腦將百度此前在人工智能方面的能力開(kāi)放出來(lái),主要是大規(guī)模機(jī)器學(xué)習(xí)能力和深度學(xué)習(xí)能力。此前它們被應(yīng)用在語(yǔ)音、圖像、文本識(shí)別,以及自然語(yǔ)言和語(yǔ)義理解方面,被應(yīng)用在不少App,還通過(guò)百度Inside等平臺(tái)開(kāi)放給了智能硬件?,F(xiàn)在這些能力將被用來(lái)對(duì)大數(shù)據(jù)進(jìn)行智能化的分析、學(xué)習(xí)、處理、利用。百度深度神經(jīng)網(wǎng)絡(luò)擁有200億個(gè)參數(shù),是全球規(guī)模最大的,它擁有獨(dú)立的深度學(xué)習(xí)研究院(IDL)和較早的布局,在人工智能上百度已經(jīng)快了一步,現(xiàn)在貢獻(xiàn)給業(yè)界表明了它要開(kāi)放的決心。
大數(shù)據(jù)能干啥?
百度將基礎(chǔ)設(shè)施能力、軟件系統(tǒng)能力以及智能算法技術(shù)打包在一起,通過(guò)大數(shù)據(jù)引擎開(kāi)放出來(lái)之后,擁有大數(shù)據(jù)的行業(yè)可以將自己的數(shù)據(jù)接入到這個(gè)引擎進(jìn)行處理。同時(shí),一些企業(yè)在沒(méi)有大數(shù)據(jù)的情況下,還可以使用百度的數(shù)據(jù)以及大數(shù)據(jù)成果。
舉幾個(gè)例子可能你更加清楚百度大數(shù)據(jù)引擎究竟是什么。
[page]
許多政府部門(mén)擁有海量大數(shù)據(jù)——大數(shù)據(jù)經(jīng)典之作《大數(shù)據(jù)》也是在講美國(guó)政府的大數(shù)據(jù)。但政府部門(mén)幾乎都沒(méi)有大數(shù)據(jù)處理和挖掘技術(shù)。交通部門(mén)有車(chē)聯(lián)網(wǎng)、物聯(lián)網(wǎng)、路網(wǎng)監(jiān)控、船聯(lián)網(wǎng)、碼頭車(chē)站監(jiān)控等地方的大數(shù)據(jù),衛(wèi)生部門(mén)擁有流感法定報(bào)告數(shù)據(jù)、全國(guó)流感樣病例哨點(diǎn)監(jiān)測(cè)和病原學(xué)監(jiān)測(cè)數(shù)據(jù),公安部門(mén)有大量的視頻監(jiān)控?cái)?shù)據(jù)。如果這些數(shù)據(jù)與百度的搜索記錄、全網(wǎng)數(shù)據(jù)、LBS數(shù)據(jù)結(jié)合,在利用百度大數(shù)據(jù)引擎的大數(shù)據(jù)能力,則可以實(shí)現(xiàn)智能路徑規(guī)劃、運(yùn)力管理、流感預(yù)測(cè)、疫苗接種指導(dǎo)、安防追逃等等。
許多企業(yè)也擁有海量大數(shù)據(jù)——通信、金融、物流、制造、農(nóng)業(yè)等行業(yè)。不過(guò),它們幾乎都沒(méi)有大數(shù)據(jù)能力,坐擁海量數(shù)據(jù)卻一籌莫展。這時(shí)候如果能夠應(yīng)用百度大數(shù)據(jù)引擎,則可以對(duì)海量數(shù)據(jù)進(jìn)行可靠低成本的存儲(chǔ),進(jìn)行智能化的由淺入深的價(jià)值挖掘。在百度技術(shù)開(kāi)放日上,中國(guó)平安便介紹了如何利用百度的大數(shù)據(jù)能力加強(qiáng)消費(fèi)者理解和預(yù)測(cè),細(xì)分客戶群制定個(gè)性化產(chǎn)品和營(yíng)銷(xiāo)方案。
可以看出,大數(shù)據(jù)引擎的輸入實(shí)際上是百度擁有的大數(shù)據(jù)以及行業(yè)已有的大數(shù)據(jù),而輸出則是各種行業(yè)應(yīng)用成果,也就是大數(shù)據(jù)的“價(jià)值”。
百度大數(shù)據(jù)走出煉丹爐
近日,聯(lián)合國(guó)與百度宣布啟動(dòng)戰(zhàn)略合作,共建大數(shù)據(jù)聯(lián)合實(shí)驗(yàn)室,這也成為聯(lián)合國(guó)開(kāi)發(fā)計(jì)劃署在全球范圍內(nèi)首次攜手科技企業(yè)建立大數(shù)據(jù)實(shí)驗(yàn)室。百度將利用自己強(qiáng)大的技術(shù)創(chuàng)新實(shí)力,助力聯(lián)合國(guó)解決環(huán)保、健康等人類發(fā)展問(wèn)題。
百度攜手聯(lián)合國(guó)開(kāi)發(fā)計(jì)劃署共建大數(shù)據(jù)聯(lián)合實(shí)驗(yàn)室,獻(xiàn)禮互聯(lián)網(wǎng)大會(huì),意味著百度大數(shù)據(jù)已完全走出了“煉丹爐”,全面普及應(yīng)用,成為政府、國(guó)際組織、環(huán)保、醫(yī)療等各個(gè)領(lǐng)域真正的“火眼金睛”。
據(jù)悉,聯(lián)合國(guó)開(kāi)發(fā)計(jì)劃署與百度大數(shù)據(jù)聯(lián)合實(shí)驗(yàn)室的目標(biāo)是探索利用大數(shù)據(jù)解決全球性問(wèn)題的創(chuàng)新模式。對(duì)于百度的大數(shù)據(jù)聯(lián)合實(shí)驗(yàn)室來(lái)說(shuō),首先將目光聚焦在電子垃圾問(wèn)題,開(kāi)發(fā)“百度回收站”,通過(guò)收集與分析電子垃圾有關(guān)大數(shù)據(jù),將得出的有效信息與知識(shí)為社會(huì)所用,推動(dòng)電子垃圾回收產(chǎn)業(yè)發(fā)展,為解決世界電子垃圾回收問(wèn)題提供政策參考,此舉也是中國(guó)企業(yè)勇于承擔(dān)解決全球發(fā)展問(wèn)題的擔(dān)當(dāng)表現(xiàn)。
短時(shí)期哪些行業(yè)將會(huì)首先從大數(shù)據(jù)中獲益?
美國(guó)可穿戴設(shè)備先驅(qū)阿萊克斯·彭特蘭這樣說(shuō),在短期內(nèi)大數(shù)據(jù)會(huì)幫助公司和企業(yè)的內(nèi)部運(yùn)營(yíng)更加有效。在長(zhǎng)一點(diǎn)時(shí)期內(nèi),我認(rèn)為會(huì)大數(shù)據(jù)會(huì)讓公司和企業(yè)更加深入和綜合,例如酒店經(jīng)營(yíng),酒店不僅僅提供住宿而是綜合客人的整個(gè)旅行體驗(yàn)。電子商店變得更符合你的個(gè)性化風(fēng)格,因?yàn)樗麄兞私饽愫湍愀信d趣的東西。