科技公司的年度大會有兩種,一種是推出普通消費者日常生活使用的用品,如蘋果一年一度或一年兩度的iPhone 發(fā)布會,另一種則是針對技術(shù)開發(fā)者發(fā)布的SDK、API、開發(fā)套件等,一如英特爾的開發(fā)者技術(shù)大會 IDF。
如果說蘋果的發(fā)布會講述的是當下最好的軟硬件集成,那么英特爾的發(fā)布會則是探討未來的各種可能。
這其中,最讓業(yè)界關(guān)注的恐怕還是英特爾打算如何切入當下最火的人工智能領(lǐng)域。放眼業(yè)界, 人工智能成為當下技術(shù)公司發(fā)力的方向。AlphaGo 用一場完勝將 Google 深度學習推進人工智能的野心展露無疑;Facebook 給未來十年規(guī)劃了社交、人工智能、虛擬現(xiàn)實、無人機的發(fā)展路線;微軟則通過云、基于人工智能的 Bot 開發(fā)框架打造新一代軟件開發(fā)平臺,而作為過去 50 年領(lǐng)導整個世界計算進步的英特爾,下一步又該如何應對人工智能帶來的機遇和挑戰(zhàn)呢?
一、圍繞機器學習,從算法和硬件上尋求突破
基于深度神經(jīng)網(wǎng)絡的機器學習崛起于 2012 年的 ImageNet 挑戰(zhàn)賽,來自多倫多大學的一個明不見經(jīng)傳的團隊利用深度學習訓練的圖像識別模型,不僅取得了冠軍,并將錯誤率降低到 20% 以下,震驚產(chǎn)業(yè)界和學術(shù)界。自此之后,基于深度神經(jīng)網(wǎng)絡的機器學習成為人工智能重新崛起的巨大推動力,Google、Facebook、微軟先后建立深度學習研究團隊,在多個產(chǎn)品中部署深度學習技術(shù),成績斐然。
當業(yè)界越來越來多依靠深度學習,也帶來對新一代計算的要求,而且更重要的一點則是,深度學習對計算力資源的需求到底有多高,其實誰也不知道,這就像個「計算黑洞」,也使得異構(gòu)加速技術(shù)在過去幾年成為該領(lǐng)域應用廣泛的技術(shù),比如 FPGA。
所謂 FPGA(Field-ProgrammableGate Array,現(xiàn)場可編程門陣列),是一種介于專用芯片和通用芯片之間,具有一定的可編程性,可同時進行數(shù)據(jù)并行和任務并行計算,在處理特定應用時有更加明顯的效率。更重要的是,FPGA 具有明顯的性能功耗比優(yōu)勢,其能耗比是 CPU的 10 倍以上、GPU 的 3 倍。FPGA 在諸多領(lǐng)域得到應用,如邏輯控制,信號處理,圖像處理等方面。
2015年12月,英特爾完成了對可編程邏輯器件廠商 Altera 的收購。這是英特爾公司歷史上規(guī)模最大的一筆收購,這也讓英特爾成為第二大可編程邏輯器件廠商,并且將 Altera 的 FPGA 納入到英特爾的產(chǎn)品線中。
這次收購對于英特爾接下來的發(fā)展至關(guān)重要。
眾所周知,英特爾在業(yè)界的影響力建立在 PC、服務器的 CPU 基礎(chǔ)之上,但在 PC 銷量持續(xù)下滑的殘酷面前,英特爾的收入和利潤都將受到很大影響。根據(jù) 2015 財年財報,英特爾全年營收同比下滑 1%,凈利潤同比下滑 2%,毛利率同比下滑 1.1%。華爾街分析師將下滑的原因歸結(jié)為 PC 芯片業(yè)務處于持續(xù)的疲軟狀態(tài),該業(yè)務一度是英特爾最核心的產(chǎn)品線。
在服務器層面,包括 Facebook、Google 在內(nèi)的主要客戶,其對大型網(wǎng)絡服務計算的需求不斷增長。傳統(tǒng)意義上,英特爾會在每塊硅片上集成更多晶體管,不過隨著摩爾定律失效,這種方法也越來越難以滿足客戶需求。
FPGA 則有望給英特爾帶來新的業(yè)務增長點,那就是機器學習。在英特爾全球副總裁兼中國區(qū)總裁楊旭看來,將 Altera 的 FPGAs 和英特爾處理器結(jié)合在一起的「一個很激動人心的領(lǐng)域就是機器學習,它是影像識別、目標探測、發(fā)現(xiàn)大數(shù)據(jù)規(guī)律的關(guān)鍵要素?!咕唧w來說,英特爾會把FPGAs 和英特爾處理器封裝到一顆芯片里,當用 FPGAs 來運算一些機器學習的任務時,就像CNN影像識別算法,這些算法能大大提高它的性能。根據(jù)英特爾并購副總裁文德爾·布魯克斯 2015 年接受采訪時的說法,相對于傳統(tǒng)的處理器和 FPGA 獨立組建,新的一體化芯片最初將帶來30%至50%的性能提升,而最終的性能提升將達到 2 到 3 倍。
也正是在這樣的背景下,英特爾與科大訊飛聯(lián)手推出的深度學習計算平臺備受矚目。在這個平臺上,底層硬件來自于英特爾的至強助力器和 Altera FPGA 技術(shù),依托科大訊飛在自然語言處理、語音識別方面的核心技術(shù),可實時將發(fā)言者語音轉(zhuǎn)化成文字,準確率高達95%。
硬件層面的進展令人眼前一亮,而在軟件尤其是算法層面,英特爾想做的則是通過2015年發(fā)布的數(shù)據(jù)分析加速庫DAAL(DataAnalyticsAccelerationLibrary)來幫助第三方開發(fā)者更好地在英特爾的底層硬件上進行機器學習模型的搭建和訓練。與此同時到 2017年,英特爾會在另一個名叫「數(shù)學核心函數(shù)庫」的產(chǎn)品中發(fā)布神經(jīng)網(wǎng)絡 API ,上述資源會讓開發(fā)者直接調(diào)取,極大地降低了開發(fā)者入門機器學習的門檻。
總體上說,英特爾的確在為機器學習,尤其是深度學習做了很多布局,但也真如深度學習還處在早期發(fā)展階段一樣,英特爾的各個產(chǎn)品(硬件、軟件/算法)也并不成熟,但在另一個層面來看英特爾對于人工智能發(fā)展的思考,則別具深意。
把感知能力賦予機器人
在去年的 IDF 上,英特爾 CEO Brian Krzanich 向觀眾不斷重復實感技術(shù)(RealSense)的重要性,并進行了多次演示。而到了一年后的主題演講中,當現(xiàn)場觀眾再次被一年前的這項技術(shù)歡呼鼓掌時,某種意義上也展現(xiàn)了實感技術(shù)的確有著巨大的應用場景。
英特爾新技術(shù)事業(yè)部副總裁兼感知計算事業(yè)部總經(jīng)理鮑克勤在談到實感技術(shù)時表示,「我們正處于計算設(shè)備寒武紀物種大爆發(fā)的起始階段」,如果人類經(jīng)過寒武紀物種大爆發(fā)看到了世界,那么「我們的智能設(shè)備也處在這樣一個時代,有了『眼睛』以后,它們也可以去理解世界了?!?/p>
所謂實感技術(shù),就是一整套軟硬件解決方案,硬件層面由色彩傳感器、紅外傳感器、紅外激光發(fā)射器和實感圖像處理芯片等部件組成了 3D 攝像頭。軟件方面,這個攝像頭可以捕捉物體的色彩、計算物體深度和運動軌跡,并且還支持 3D 建模、實時渲染等。
簡而言之,就是通過攝像頭把感知能力和理解能力賦予新一代的計算設(shè)備。格萊美頒獎禮上,lady GaGa 向剛剛?cè)ナ赖膿u滾巨星 David Bowie 的致敬環(huán)節(jié)令人激動。演出中,Lady Gaga的臉上出現(xiàn)了變化莫測的華麗妝容,起初仿佛巖漿流淌而過,后來隨著妝容的不斷變化出現(xiàn)閃電。David Bowie 實時投影在Lady Gaga的臉上,接著一只逼真的蜘蛛突然從左眼爬到右眼,緩慢劃過臉頰,最終在額頭處化成魔洞。這一切都依靠實感技術(shù),這也是該項技術(shù)眾多應用場景中的一個。
在今年的 IDF 上,英特爾帶來三種不同型號的實感攝像頭,包括適合近距離感知的SR300、遠距離的 R200/LR200 以及適合遠距離并可進行運動感知的 ZR300 。同時還發(fā)布了針對不同領(lǐng)域的實感技術(shù)開發(fā)工具套件。
首先,將實感技術(shù)武裝到機器人身上。機器人自然需要「眼睛」感知世界,不過過去缺乏一種讓機器人「看見」周遭世界的方法。因此,英特爾希望通過實感技術(shù)機器人開發(fā)工具包,讓機器人擁有一雙「眼睛」。這個工具包集成機器人開發(fā)主板和 R200 相機,這是一個交鑰匙方案(所謂「交鑰匙」,是承包公司為客戶方建造工廠或其他工程項目,一旦設(shè)計與建造工程完成,包括設(shè)備安裝、試車及初步操作順利運轉(zhuǎn)后,即將該工廠或項目所有權(quán)和管理權(quán)的「鑰匙」依合同完整地「交」給對方,由對方開始經(jīng)營。英特爾已經(jīng)在多個領(lǐng)域啟動「交鑰匙」方案)。
特別要指出的一點,利用實感技術(shù),Ninebot 公司的賽格威機器人在今年 CES 上可謂大展身手,目前,這個機器人已經(jīng)將視覺識別、語音交流和定位運動能力完美融合,而賽格威機器人也已一個開放平臺項目,全球各地的軟硬件開發(fā)者可以在這個平臺上開發(fā)、優(yōu)化自己的機器人項目。
其次,推出英特爾實感技術(shù) SDK,提供了更多 API,包括姿態(tài)識別、人臉跟蹤、3D掃描、場景感知,還有 SLAM,并且真正實現(xiàn)了跨平臺操作,為縱深相機提供開源的驅(qū)動程序,支持 Linux、Android、OSX 和 Winows。這些跨平臺的API 也為機器人操作系統(tǒng) ROS 提供了交互界面,對于未來機器人的開發(fā)有重要意義。
第三,把實感技術(shù)放入無人機平臺(Aero Drone Board)。這塊主板的中間有個 100 針的接口,可以通過上面的 FPGA 對它進行再編程、再優(yōu)化。而主板的外圍設(shè)備支持包括 SSD 存儲、LTE 通訊網(wǎng)絡、RealSense視覺。它運轉(zhuǎn) Yocto Linux軟件,可以和大量商用的飛行控制器連接。
另外,圍繞實感技術(shù)周邊,只有「鈕扣」大小的計算模塊 Curie、輕便型移動網(wǎng)絡設(shè)備平臺Atom、適應物聯(lián)網(wǎng)(IOT)和可穿戴設(shè)備的芯片 Edison、以及云計算技術(shù) FreeD 都將成為英特爾為機器人、無人機帶來感知的重要輔助力量。
相較于可用于機器學習的昂貴一體化芯片,英特爾的實感技術(shù)頗具親民之意,更多的還是聚焦于正奮戰(zhàn)在一線的機器人、無人機開發(fā)者們,上述諸項舉措也將伴隨英特爾針對中國創(chuàng)客的「創(chuàng)客爆米花」計劃在中國落地。
2015 年以來,英特爾一直力圖擺脫對于PC、服務器的過度依賴,通過強大的研發(fā)能力,在多個領(lǐng)域?qū)で笸黄啤?/strong>比如在物聯(lián)網(wǎng)方面就有不小的進展,根據(jù)2015年第四季度的財報,物聯(lián)網(wǎng)部門第四財季營收為6.25億美元,高于上年同期的5.91億美元。
而在當下最火熱的人工智能領(lǐng)域,以硬件擅長的英特爾選擇提供計算能力和感知能力,這既是對原有業(yè)務的延續(xù)和補充(畢竟,芯片還是該公司的支撐業(yè)務之一),也是英特爾最熟悉的商業(yè)模式——打造生態(tài)系統(tǒng),與平臺上各個鏈條的合作伙伴共同推動產(chǎn)業(yè)發(fā)展。從新一代計算芯片到新一代視覺感知,英特爾為人工智能布下的這兩個棋子,未來將帶來多大的產(chǎn)業(yè)影響力,我們不妨拭目以待。