微軟的一個(gè)研究團(tuán)隊(duì)在開發(fā)語音識別技術(shù)方面取得了新成果,在語音識別準(zhǔn)確率上面超過了IBM的超級電腦沃森。微軟將其語音識別技術(shù)的出錯(cuò)率降到了6.3%,打破了沃森之前保持的6.9%的出錯(cuò)率紀(jì)錄。
微軟的目標(biāo)是讓計(jì)算機(jī)能夠理解語言以及人的意圖,從而幫助它改進(jìn)Cortana、Skype Translator和其他跟語言有關(guān)的服務(wù)。它在語音識別技術(shù)準(zhǔn)確性上的突破讓它朝著這個(gè)目標(biāo)又邁進(jìn)了一步。
語音將成為一種主流計(jì)算界面。數(shù)字化語音助手比如蘋果的Siri已經(jīng)成為移動(dòng)設(shè)備生態(tài)系統(tǒng)的一個(gè)組成部分,但是這項(xiàng)技術(shù)的執(zhí)行速度仍然較慢,而且出錯(cuò)率比較高?,F(xiàn)在,搜索功能和語言理解方面的技術(shù)研發(fā)取得了一些突破性成果,極大地提高了語音助手的準(zhǔn)確率和便利性。
為了在這場技術(shù)革命中處于領(lǐng)先的位置,很多技術(shù)公司包括亞馬遜、蘋果、谷歌和IBM都已經(jīng)開始面向消費(fèi)者提供語音識別技術(shù)。例如,蘋果在Siri中添加了第三方整合功能,允許它與第三方應(yīng)用通訊。這意味著用戶們將可以利用Siri服務(wù)呼叫Uber專車。
然而,要想成為消費(fèi)者最主要的計(jì)算平臺,語音助手仍需進(jìn)一步改進(jìn)和完善。據(jù)凱鵬華盈分析師瑪麗·米克爾(Mary Meeker)稱,語音識別的準(zhǔn)確率必須達(dá)到99%左右(現(xiàn)在大約是90%),語音指令才能成為最有效的計(jì)算輸入形式。
與此同時(shí),還沒有或者不打算投資語音技術(shù)的公司可能必須承擔(dān)被競爭對手甩在身后的風(fēng)險(xiǎn)。Facebook的Messenger副總裁大衛(wèi)·馬科斯(David Marcus)最近在TechCrunch Disrupt大會上接受采訪時(shí)重申了這一點(diǎn)。馬科斯承認(rèn),F(xiàn)acebook目前仍把重點(diǎn)放在文本上面,這可能會讓它無緣參與語音識別技術(shù)領(lǐng)域的競爭。