微軟已經(jīng)將 25 款“認知服務”(Cognitive Services)中的 3 項向公眾開放。今天早些時候,該公司宣布推出了帶‘內(nèi)容審核’(Content Moderator)的自定義語音服務(Custon Speech Service),而必應語音 API 則會在下月到來。這項語音服務原被稱作 CRIS,允許開發(fā)者使用微軟的語音轉(zhuǎn)文本引擎。內(nèi)容審核則可以隔離和檢查數(shù)據(jù),過濾掉那些可能會導致用戶不適的冒犯性內(nèi)容。
至于必應語音 API,它可以將語音轉(zhuǎn)成文本,理解其意圖,再用語音講述出來。
微軟向開發(fā)者提供了多種層級的通用服務(包括免費的版本),并且確信程序員們可以打造基于認知服務的自建應用程序接口(APIs)。
Microsoft Prism Skylabs
Using AI to help organizations search visual data
微軟語音與對話事業(yè)部首席研究員 Mike Seltzer 表示:“認知服務與我司機器學習和人工智能研究深有關聯(lián),且通過簡單易用的 API 向開發(fā)者們開放,讓他們省去了重新發(fā)明相關技術(設計無數(shù)數(shù)據(jù)、經(jīng)驗、計算來打造一個頂尖的機器學習模型)的大量時間和精力”。
Microsoft Human Interact Players
control the narrative in Starship Commander