觀點(diǎn)一:25年來,微軟通過云計(jì)算、人工智能這些創(chuàng)新技術(shù),來加速中國(guó)企業(yè)的數(shù)字化轉(zhuǎn)型。中國(guó)公司和世界級(jí)的創(chuàng)新公司在引領(lǐng)全球,不少公司都來自深圳,我們大家一起努力,實(shí)現(xiàn)夢(mèng)想。
沈向洋博士指出,世界就是一臺(tái)計(jì)算機(jī),今天的世界已經(jīng)變成一臺(tái)龐大的計(jì)算機(jī),手機(jī)是計(jì)算機(jī),PC是計(jì)算機(jī),所有的計(jì)算被連接起來,分布在各處強(qiáng)大的計(jì)算能力,采集無處不在的傳感器數(shù)據(jù),應(yīng)用機(jī)器學(xué)習(xí)分析采集到的數(shù)據(jù),用人工智能創(chuàng)造出工作生活中的各種各樣的體驗(yàn),這是了不起的事情。
在新時(shí)代,微軟新的世界觀是“未來的世界就是云到邊緣的計(jì)算世界”,智能云(Intelligent Cloud)+智能邊緣(Intelligent Edge),為了達(dá)到這個(gè)遠(yuǎn)景,微軟誓要把Azure打造成世界新的計(jì)算機(jī),成為融入AI的最佳云和邊緣平臺(tái)。
在IoT領(lǐng)域,微軟呈現(xiàn)四大布局,分別是Azure云、Azure混合云、Azure 邊緣(Azure IoT Edge)、Azure Sphere?,F(xiàn)場(chǎng)重點(diǎn)介紹了后兩者的最新進(jìn)展。沈向洋表示,Azure IoT Edge,是一項(xiàng)將云端的人工智能和Azure服務(wù)直接部署和運(yùn)行在各種跨平臺(tái)物聯(lián)網(wǎng)設(shè)備上的全托管服務(wù),目前支持Windows、Lunix等多個(gè)系統(tǒng)。微軟展示了與科勒和大疆的合作項(xiàng)目,另外,半導(dǎo)體芯片開發(fā)商樂鑫(Espressif)也發(fā)布了ESP-32-Azure IoT Kit開發(fā)板。
微軟的Azure就是一臺(tái)世界的計(jì)算機(jī),覆蓋54個(gè)國(guó)家和地區(qū),獲得了安全和合規(guī)的認(rèn)證。全球覆蓋的區(qū)域和安全合規(guī)認(rèn)證遠(yuǎn)遠(yuǎn)高于其他公司。服務(wù)全球500強(qiáng)中超過百分之九十的公司。
觀點(diǎn)二、計(jì)算機(jī)視覺,計(jì)算機(jī)圖形,文本到語音合成,微軟在中國(guó)的創(chuàng)新已經(jīng)影響到全球。
沈向洋博士介紹說,微軟之所以可以在智能云和智能端取得如此大優(yōu)勢(shì),得益于微軟在人工智能領(lǐng)域20多年的研究和世界級(jí)的研發(fā)成果。
筆者梳理了這張圖片上的五大里程碑事件:
1、2016年,微軟亞洲研究院一支團(tuán)隊(duì)在圖片網(wǎng)絡(luò)(ImageNet)得全球圖像識(shí)別大賽中一鳴驚人,這個(gè)團(tuán)隊(duì)帶來得精妙算法叫殘存網(wǎng)絡(luò)(ResNet),它對(duì)10萬張照片進(jìn)行識(shí)別,并列入了1000個(gè)不同類別之下,其錯(cuò)誤率低到3.5%。2年后,谷歌的DeepMind研發(fā)出AlphaGo Zero,即能夠自學(xué)的新一代AlphaGo,殘差網(wǎng)絡(luò)就是它的核心技術(shù)模塊之一。
2、2017年8月20日,微軟首席語音科學(xué)家黃學(xué)東宣布微軟語音識(shí)別系統(tǒng)繼微軟對(duì)話語音識(shí)別技術(shù)達(dá)至人類專業(yè)水平,開啟人工智能新征程之后再次取得重大突破,錯(cuò)誤率由5.9%進(jìn)一步降低到5.1%,可與專業(yè)速記員比肩。此次突破大幅刷新原先記錄,并在語音識(shí)別行業(yè)樹立新的里程碑。
3、2018年 1 月,微軟研究院在斯坦福大學(xué)發(fā)起的 SQuAD 文本理解挑戰(zhàn)賽上獲的完成 SQuAD 閱讀理解測(cè)試的準(zhǔn)確率高達(dá) 88.5%,超越人類。2018 年 3 月,微軟宣布旗下機(jī)器翻譯技術(shù)取得突破,在中文翻譯英文準(zhǔn)確度可媲美人類。
4、2018年3月微軟宣布機(jī)器翻譯研究系統(tǒng)的準(zhǔn)確率達(dá)到69.9%。中英文翻譯,新聞高測(cè)試集測(cè)試比對(duì)準(zhǔn)確率達(dá)到69.9%。
5、2018年5月份Build 2018 大會(huì)上,微軟在公有云Azure平臺(tái)上推出了語音合成定制服務(wù)產(chǎn)品Custom Voice。將語音和對(duì)應(yīng)文本(500句)上傳,Custom Voice即可對(duì)聲音進(jìn)行模擬,并在線測(cè)試模擬效果。
“語音和語言是衡量人類智能的標(biāo)桿,人工智能的發(fā)展分支之一是語音識(shí)別,去年《經(jīng)濟(jì)學(xué)人》雜志總結(jié)了過去40年語音方面的進(jìn)展,過去20年,語音識(shí)別上有標(biāo)桿上的測(cè)試,兩人隨便聊天,看看計(jì)算機(jī)是否可以轉(zhuǎn)錄下來,包括吵架、談情說愛,錯(cuò)誤率高居不下,微軟轉(zhuǎn)錄系統(tǒng)在不考慮代價(jià)的情況下,轉(zhuǎn)錄水平可以超過專業(yè)人員。黃學(xué)東表示,微軟的語音合成技術(shù)除了端到端神經(jīng)網(wǎng)絡(luò)開發(fā),還使用了遷移學(xué)習(xí),最大特點(diǎn)就是支持各種定制化服務(wù)。但考慮到定制某個(gè)人聲音會(huì)涉及法律問題,定制化服務(wù)暫時(shí)不向個(gè)人開放。
沈向洋表示,微軟希望利用AI技術(shù)在所有感知方面超過人類水平,最近研發(fā)的是微軟還在研發(fā)OCR印刷體識(shí)別、手寫文字識(shí)別等技術(shù)。
觀點(diǎn)三、全球每年微控制器有90億量,隨著物聯(lián)網(wǎng)數(shù)量增加,MCU使用量會(huì)越來越大。微軟Azure Sphere三部分,芯片級(jí)的云+端物聯(lián)網(wǎng)安全解決方案,是基于Linux安全小型的操作系統(tǒng),包括認(rèn)證微控制器、操作系統(tǒng)、安全服務(wù)三方面,協(xié)同可以確保智能邊緣設(shè)備的安全。
沈向洋表示,Azure 給制造業(yè)帶來的機(jī)遇,憑借著Azure Sphere,制造業(yè)有全新的安全體驗(yàn)和新的商業(yè)模式,比如ROOBO做得語音芯片,做離線遠(yuǎn)程的語音控制,讓Azure集成語音服務(wù)放在任何設(shè)備上。長(zhǎng)虹集團(tuán)子公司四川愛聯(lián)發(fā)布了面向智能家電的嵌入式Azure Sphere模塊。除了語音之外,ROOBO發(fā)布了基于Azure Sphere及ROOBO嵌入式語音芯片的家電物聯(lián)網(wǎng)模塊,該解決方案支持通過多達(dá)400種離線語音指令控制家用電器,能為智能樓宇、智慧工廠等環(huán)境種的麥克風(fēng)的終端設(shè)備提供隱私安全保護(hù)。我們期待和更多的深圳廠商開發(fā)Azure Sphere的合作方案。
人工智能落地應(yīng)用加速:
全球首創(chuàng)Azure智能會(huì)議系統(tǒng)+IoT Edge 的視覺人工智能開發(fā)工具包
微軟作為智能語音行業(yè)的領(lǐng)先企業(yè)之一,認(rèn)為中國(guó)當(dāng)前技術(shù)下的語音識(shí)別效果還遠(yuǎn)沒有達(dá)到理想水平,微軟結(jié)合硬件技術(shù)合作伙伴有望借助技術(shù)優(yōu)勢(shì)撬動(dòng)市場(chǎng)。
黃學(xué)東表示,微軟在文本到語音合成方面達(dá)到了一個(gè)新的里程碑,利用深度神經(jīng)網(wǎng)絡(luò),使計(jì)算機(jī)合成的聲音幾乎與真人的錄音無法區(qū)分。微軟和儒波斯和簽訂了人工智能戰(zhàn)略合作備忘錄。
微軟在現(xiàn)場(chǎng)展示了“黑塔”全球首創(chuàng)的人工智能會(huì)議系統(tǒng),這款由Azure人工智能驅(qū)動(dòng)的邊緣設(shè)備,能同時(shí)追蹤、記錄多人會(huì)議的語音和圖像,對(duì)每個(gè)人發(fā)言進(jìn)行文字記錄,從中提取要點(diǎn)議題并生成會(huì)議紀(jì)要。
據(jù)悉與微軟合作開發(fā)這一系統(tǒng)的儒博(ROOBO)宣布與微軟達(dá)成戰(zhàn)略合作,將成為微軟智能語音轉(zhuǎn)錄服務(wù)于定制文本到語音服務(wù)的合作伙伴,將儒博在智能硬件開發(fā)于平臺(tái)運(yùn)維上的優(yōu)勢(shì),和微軟在人工智能與服務(wù)上的先進(jìn)技術(shù)結(jié)合,共同開發(fā)和拓展智能語音在物聯(lián)網(wǎng)、智能邊緣、智能家庭、智能教育等領(lǐng)域的應(yīng)用前景。
在這次大會(huì)上,微軟和儒博向行業(yè)展示了搭載Azure Sphere安全方案的語音模組,該產(chǎn)品搭載雙方自主研發(fā)的芯片,在保證物聯(lián)網(wǎng)設(shè)備安全的前提下,滿足端到云的物聯(lián)網(wǎng)安全解決方案,實(shí)現(xiàn)在低功耗下物聯(lián)網(wǎng)設(shè)備的離線、在線語音控制,完成IoT場(chǎng)景下的設(shè)備管理、數(shù)據(jù)管理、安全管理及設(shè)備升級(jí)服務(wù)。
在全球各地,各種智能設(shè)備正快速涌現(xiàn)在家庭和商業(yè)場(chǎng)合中,預(yù)計(jì)到2020年,其總數(shù)將超過200億臺(tái)。這些設(shè)備將非常智能,甚至無需一直連接到云端,就能具備看、聽、推理、預(yù)測(cè)的能力。對(duì)于智能邊緣計(jì)算,微軟已經(jīng)高通的合作,打造運(yùn)行 Azure IoT Edge 的視覺人工智能開發(fā)工具包。這一解決方案將為開發(fā)基于攝像頭的物聯(lián)網(wǎng)解決方案提供關(guān)鍵的硬件和軟件支持。
開發(fā)者可以利用 Azure 機(jī)器學(xué)習(xí)服務(wù)及高通視覺智能平臺(tái)與高通人工智能引擎的硬件加速開發(fā)應(yīng)用解決方案。攝像頭也可以用于更高級(jí)的 Azure 服務(wù),例如機(jī)器學(xué)習(xí)、流分析和認(rèn)知服務(wù),并且可以從云端下載到邊緣環(huán)境中在本地運(yùn)行。
通過近二十年的高強(qiáng)度研發(fā)投入,微軟在很多人工智能落地的關(guān)鍵賽道上已經(jīng)探索形成了一些明確的產(chǎn)品,下一步就是這些產(chǎn)品怎么規(guī)?;歪尫爬麧?rùn)的問題。我們從微軟這次全球大會(huì)上看到的是人工智能加上物聯(lián)網(wǎng)賦能多場(chǎng)景應(yīng)用的前景,但落地到底如何,還有待市場(chǎng)和客戶的檢驗(yàn)。