百度世界大數(shù)據(jù)論壇:百度大數(shù)據(jù)助你感知世界

責(zé)任編輯:editor004

2014-09-08 21:23:59

摘自:ZDNet至頂網(wǎng)

2014百度世界大數(shù)據(jù)論壇于9月3日在北京舉行,會(huì)上既有來自百度大數(shù)據(jù)的專家介紹百度的大數(shù)據(jù)產(chǎn)品和發(fā)展經(jīng)驗(yàn),也有來自各行各業(yè)的精英介紹他們與百度在實(shí)際合作中的心得。未來百度要借助開放平臺(tái)為客戶提供一個(gè)完整的從端到端的解決方案。

2014百度世界大數(shù)據(jù)論壇于9月3日在北京舉行,會(huì)上既有來自百度大數(shù)據(jù)的專家介紹百度的大數(shù)據(jù)產(chǎn)品和發(fā)展經(jīng)驗(yàn),也有來自各行各業(yè)的精英介紹他們與百度在實(shí)際合作中的心得。

百度大數(shù)據(jù)的價(jià)值——感知世界

百度大數(shù)據(jù)部高級(jí)總監(jiān)朱永忠講到百度大數(shù)據(jù)給行業(yè)帶來的最大價(jià)值即時(shí)感知世界。所謂感知世界就是讓機(jī)器能夠模擬人腦的方式處理感知到的所有信息。而能夠像人腦那樣處理感知的信息之后,隨之給行業(yè)帶來的價(jià)值即是類似人腦活動(dòng)的思考和決策。

對(duì)此百度推出的產(chǎn)品是百度大腦。百度大腦依托圖像識(shí)別技術(shù)、語音識(shí)別技術(shù)、手術(shù)識(shí)別技術(shù)、自然語言理解技術(shù)等識(shí)別技術(shù)將一系列信息整合在一起,能夠更加接近自然,從第一人稱的角度感知周圍的世界。

而這給行業(yè)帶來的直接價(jià)值即是能夠更好的管理用戶。以往在網(wǎng)絡(luò)上流行著一句名言“你不知道電腦對(duì)面的是一條狗還是一個(gè)人”,而百度大腦所具有的感知能力毫無疑問知道對(duì)面是一個(gè)人,而且能夠?qū)λ鎸?duì)的用戶有更多的了解,使用戶的畫像更加清晰。這樣行業(yè)可以更加全面的了解自己用戶的特點(diǎn),有哪些需求,能夠更針對(duì)性的面向用戶進(jìn)行推廣和服務(wù)。

康知網(wǎng)CEO、祥云醫(yī)療集團(tuán)副總裁胡翼即講到了醫(yī)療行業(yè)在運(yùn)用百度大腦過程中的成果。通過百度大腦的圖像識(shí)別技術(shù)來快速識(shí)別出是那種疾病,降低患者因不知何種疾病而導(dǎo)致的風(fēng)險(xiǎn),提高醫(yī)患交流的效率。之后百度大腦給予個(gè)性化推薦,幫助醫(yī)生提供更佳的診療方案。

感知世界的基礎(chǔ)之強(qiáng)大的數(shù)據(jù)處理能力

能夠做到感知世界服務(wù)于各行各業(yè)的基礎(chǔ)是具有強(qiáng)大的數(shù)據(jù)處理能力。百度大數(shù)據(jù)部的副總監(jiān)高亮即講到了百度大數(shù)據(jù)處理能力的三層架構(gòu),海量數(shù)據(jù)存儲(chǔ)能力、智能分析能力和基此之上做出的大數(shù)據(jù)產(chǎn)品。

海量數(shù)據(jù)存儲(chǔ)首先要解決的就是數(shù)據(jù)的傳輸。百度推出的海量數(shù)據(jù)存儲(chǔ)產(chǎn)品——通用數(shù)據(jù)倉(cāng)庫(kù)能夠?qū)⑷魏我粋€(gè)產(chǎn)品線的數(shù)據(jù)實(shí)時(shí)的傳送到數(shù)據(jù)倉(cāng)庫(kù)里,同時(shí)能夠解決數(shù)據(jù)存儲(chǔ)的另一大問題即數(shù)據(jù)的標(biāo)準(zhǔn)化。無論數(shù)據(jù)是什么樣的格式到了這個(gè)數(shù)據(jù)倉(cāng)庫(kù)里都能以同樣的格式來存儲(chǔ)。

做到存儲(chǔ)之后接下來就是進(jìn)行各種各樣的處理。事實(shí)上百度已經(jīng)形成了一個(gè)數(shù)據(jù)的生命周期,值得注意的是這個(gè)周期是全自動(dòng)化的,從數(shù)據(jù)的生成,數(shù)據(jù)的傳輸,數(shù)據(jù)的標(biāo)準(zhǔn)化,數(shù)據(jù)的歸類再到數(shù)據(jù)的分析,都是一個(gè)自動(dòng)化的過程。而且對(duì)于這套自動(dòng)化的流程,百度已經(jīng)形成了自己的產(chǎn)品——Query Engine。

Query Engine能夠做到無論數(shù)據(jù)是什么樣的都能進(jìn)行標(biāo)準(zhǔn)化處理,當(dāng)數(shù)據(jù)實(shí)時(shí)生成時(shí)通過其良好的數(shù)據(jù)傳輸架構(gòu)保證將數(shù)據(jù)上傳到百度的開放云中,在上面進(jìn)行建模,進(jìn)行各種各樣的可視化分析和決策過程。

到了大數(shù)據(jù)處理能力的第三層,百度推出了三大數(shù)據(jù)產(chǎn)品以服務(wù)于各行各業(yè)。百度司南,能夠讓企業(yè)對(duì)自身品牌有更客觀的了解。讓企業(yè)知道自己的品牌在同行業(yè)中的定位是怎樣的,了解自己的忠實(shí)客戶還關(guān)心什么,了解客戶是通過什么渠道來了解自己的品牌。另一個(gè)產(chǎn)品是預(yù)測(cè)平臺(tái)產(chǎn)品,幫企業(yè)預(yù)測(cè)未來的營(yíng)業(yè)額,或幫政府預(yù)測(cè)某地的交通人流量。在一個(gè)產(chǎn)品就是百度推薦,行業(yè)可以定制百度推薦的哪一方面的性能、技術(shù)和功能。

感知世界的基礎(chǔ)之深度學(xué)習(xí)

百度大腦所具有的各種分析能力技術(shù)都有一個(gè)重要的基礎(chǔ)即深度學(xué)習(xí)。深度學(xué)習(xí)就是在最大程度上模擬人腦神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)和行為。百度研究院副院長(zhǎng)余凱講到百度正在構(gòu)建世界上最大的深度神經(jīng)網(wǎng)絡(luò),達(dá)到百億級(jí)參數(shù)。通過開發(fā)的各種不同的深度學(xué)習(xí)模型應(yīng)用于圖像、語音識(shí)別,搜索,和廣告推薦等技術(shù)。

當(dāng)人們?cè)诎俣绕脚_(tái)上表達(dá)搜索需求,百度大腦要識(shí)別用戶的意圖,在精確識(shí)別用戶搜索意圖后,用深度學(xué)習(xí)來對(duì)網(wǎng)頁語義進(jìn)行相關(guān)性排序,從而匹配用戶需求,這就完成了人與信息的連接。另一方面連接人與廣告和服務(wù),通過大規(guī)模的深度學(xué)習(xí),去估計(jì)和優(yōu)化點(diǎn)擊率和轉(zhuǎn)化率,進(jìn)而把人連接到所需要的廣告和服務(wù)。深度學(xué)習(xí)已經(jīng)應(yīng)用在百度核心業(yè)務(wù)的方方面面,真正實(shí)現(xiàn)智能連接人和信息,智能連接人和服務(wù)。

百度大腦里用到一種叫深度語義神經(jīng)網(wǎng)絡(luò)的模型,這是百度大腦用于自然語言,去匹配query和網(wǎng)頁的語義相關(guān)性,是業(yè)界第一次把深度學(xué)習(xí)用于提升搜索精度的成功案例,也是迄今為止深度學(xué)習(xí)用于語音文本信息最成功的應(yīng)用。

基于深度學(xué)習(xí)的OCR技術(shù),可以像人一樣讀懂文字。如一個(gè)外國(guó)人在上海看到某個(gè)菜單,他想知道這個(gè)菜單中是否滿足他想要的菜品需求,但自己又不懂中文不知道這是什么菜。他可給中文字拍照用百度翻譯,百度通過識(shí)別中文知道這是什么菜,通過識(shí)別后再翻譯成英文并有語音合成。這體現(xiàn)了百度在方方面面的人工智能領(lǐng)域有很深的積累。

將感知世界開放給行業(yè)——開放云

百度具有諸多的先進(jìn)技術(shù)和產(chǎn)品,于此同時(shí)百度還推出了開放云平臺(tái)。百度基礎(chǔ)架構(gòu)部高級(jí)總監(jiān)楊煬講到,百度開放云是希望幫助客戶提供云開放的投入,客戶只需要按一下按鈕,就可以獲得百度云,而且是誰用誰付費(fèi),成本很低。另外在云上面提供非常多的服務(wù),用戶可以像搭積木一樣搭建起來,更重要的是后面有百度專業(yè)人員幫客戶運(yùn)維,還能給客戶提供完整的解決方案,幫助客戶在競(jìng)爭(zhēng)中獲得更大的優(yōu)勢(shì)。

開放云能夠與大數(shù)據(jù)結(jié)合,因?yàn)闊o論什么業(yè)務(wù)都有大量的數(shù)據(jù)存儲(chǔ),將這些數(shù)據(jù)存儲(chǔ)放到開放云里面。同時(shí)將很多數(shù)據(jù)處理和流程都放到云上,就可以讓數(shù)據(jù)存儲(chǔ)更容易,把數(shù)據(jù)存儲(chǔ)變成結(jié)果的應(yīng)用也更容易。

百度未來還將開放云引擎,開放SaaS(軟件即服務(wù)),開放IaaS(基礎(chǔ)設(shè)施即服務(wù))。因?yàn)楹芏嗥髽I(yè)需要的不僅僅是高大上的東西,需要的是完整的IT解決方案,這個(gè)解決方案既包括上層的服務(wù)應(yīng)用,又包括基本的網(wǎng)絡(luò)存儲(chǔ)服務(wù)。未來百度要借助開放平臺(tái)為客戶提供一個(gè)完整的從端到端的解決方案。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號(hào)-6京公網(wǎng)安備 11010502049343號(hào)