傳統(tǒng)監(jiān)控攝像頭只能提供實時情況監(jiān)控,或者回看已經(jīng)發(fā)生的某些事情。而整合了人工智能技術(shù)的智能攝像機(jī),讓用戶能夠?qū)崟r監(jiān)控情況,并在問題發(fā)生之前識別出問題。數(shù)據(jù)科學(xué)家MaheshSaptharishi博士表示:“包含視頻分析功能的監(jiān)控系統(tǒng)可以實施分析視頻內(nèi)容,檢測出可能構(gòu)成威脅的異?;顒印;旧?,視頻分析技術(shù)可以幫助安全軟件‘學(xué)習(xí)’什么是正常情況,這樣它就可以檢測出異常情況,以及某個個人可能忽略的潛在危害行為。”這是人工智能與視頻監(jiān)控相結(jié)合的關(guān)鍵驅(qū)動因素之一。其背后的想法是,先進(jìn)的軟件可以完善人類的判斷力,提供更準(zhǔn)確、更安全的監(jiān)控。但這并不意味著取代人類監(jiān)控,而是讓這個過程更細(xì)致化和更個性化。
人工智能在視頻監(jiān)控落地
智能監(jiān)控旨在對監(jiān)控視頻中的物體、行為、事件等對象,通過檢測、識別、跟蹤等視覺模式識別技術(shù)進(jìn)行智能分析和判斷,從而減少或取代人力的干預(yù),所涵蓋的技術(shù)包括對人臉、行人、車輛、標(biāo)識等視覺對象識別和行為分析等,其應(yīng)用主要分為以下幾種:
1、人臉識別。人臉識別系統(tǒng)有很多潛在的價值,它可以與視頻監(jiān)控系統(tǒng)結(jié)合在一起,幫助執(zhí)法人員在人群中辨認(rèn)、識別目標(biāo)人員的面孔,這可能在未來有助于警方追蹤罪犯,甚至可以防范于未然,從源頭上組織犯罪的發(fā)生??捎糜谌四樅瞬?,安防人臉?biāo)阉鞯取?/div>
2、車牌識別。先拍攝到已停止汽車清晰的車牌圖像,然后再采用圖像檢測方法檢測出圖像中車牌的位置,接著進(jìn)行車牌文字的抽取和識別,通過對車道內(nèi)通行車輛的視頻流進(jìn)行采集,實現(xiàn)對同一車牌的多次識別,最后輸出經(jīng)過優(yōu)化選擇的結(jié)果,一般無需外界觸發(fā)信號、具有較強(qiáng)的適應(yīng)能力,對車輛遮擋情況有一定的抵抗能力。主要用于小區(qū)車輛的登記查詢以及收費(fèi),高速公路的違法車輛的抓拍。
3、語音識別。語音識別根據(jù)對說話人的要求分為特定人語音識別和非特定人語音識別。特定人語音識別是指當(dāng)前的語音識別系統(tǒng)被設(shè)計用來識別某個具體使用者的語音,這種情況下數(shù)據(jù)庫中的音頻樣本均來自于使用者本人,所以數(shù)據(jù)庫中語言的發(fā)聲習(xí)慣、語速、語調(diào)均與使用者一致,可以大幅提升識別準(zhǔn)確率。非特定人語音識別是指使用一套通用的系統(tǒng)來供所有用戶使用,使用門檻低,系統(tǒng)推廣性強(qiáng)。主要實現(xiàn)人機(jī)交互。
4、表情識別。表情識別是指從給定的靜態(tài)圖像或動態(tài)視頻序列中分離出特定的表情狀態(tài) ,從而確定被識別對象的心理情緒,實現(xiàn)計算機(jī)對人臉表情的理解與識別,從根本上改變?nèi)伺c計算機(jī)的關(guān)系,從而達(dá)到更好的人機(jī)交互。主要根據(jù)人的表情,推薦不同的商品。
5、年齡識別。攝像機(jī)通過核對識別對象的骨架結(jié)構(gòu),眼睛和嘴巴的位置以及眼睛和鼻子周圍的皺紋,幾乎可以準(zhǔn)確無誤地判斷出年齡。主要通過識別出來客人的年齡,實現(xiàn)精準(zhǔn)營銷。
水平不足、耗時費(fèi)力 還需技術(shù)突破
盡管當(dāng)前人工智能技術(shù)已經(jīng)極大改善了視頻監(jiān)控的應(yīng)用,但從實際應(yīng)用情況來看依然面臨著許多挑戰(zhàn)。畢竟無論是人工智能的發(fā)展,還是安防智能化的應(yīng)用,其整體水平仍處在早期或者起步的階段,系統(tǒng)的智能化程度在短時間內(nèi)還難以達(dá)到科幻大片展現(xiàn)的實戰(zhàn)效果。即使目前靜態(tài)人臉識別已經(jīng)很成熟了,但動態(tài)人臉識別還面臨著巨大挑戰(zhàn)。除了前端高清攝像機(jī)必須要能夠采集到高質(zhì)量的人臉信息之外,還需要強(qiáng)大的算法和算力支持。通過神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)、大數(shù)據(jù)自主訓(xùn)練以及高性能并行計算能力等等綜合提升才能解決當(dāng)前應(yīng)用難題。
而深度學(xué)習(xí)是需要進(jìn)行大量的大數(shù)據(jù)訓(xùn)練,目前有的人工智能企業(yè)采用人工對數(shù)據(jù)進(jìn)行標(biāo)注,費(fèi)時費(fèi)力。中科院自動化研究所李子青教授表示:“我認(rèn)為深度學(xué)習(xí)還有一定的發(fā)展空間,不管是提升算法、改進(jìn)網(wǎng)絡(luò)架構(gòu),還是通過增大數(shù)據(jù)標(biāo)注的方式,提升的空間并不大,它已經(jīng)接近天花板,具體是多少,我不能給一個定量,我們必須在這方面突破,必須像開復(fù)老師說的那樣,要形成應(yīng)用場景的數(shù)據(jù)閉環(huán),能夠利用生產(chǎn)環(huán)節(jié)的大數(shù)據(jù)進(jìn)行自主標(biāo)注、自主學(xué)習(xí),不管你會不會標(biāo)注,至少是自主學(xué)習(xí)”。
其次,安防視頻監(jiān)控是一個系統(tǒng)工程,人工智能技術(shù)在視頻監(jiān)控的應(yīng)用挑戰(zhàn),同樣貫穿于前端、傳輸、存儲、應(yīng)用等等每個環(huán)節(jié)。例如,在海量視頻數(shù)據(jù)中尋找目標(biāo),“天網(wǎng)”視頻監(jiān)控系統(tǒng)每天產(chǎn)生的大量圖像視頻,對于尋找目標(biāo)人與車輛猶如大海撈針。
此外,傳輸受限制預(yù)警不實時。尤其是高清、超高清攝像機(jī)的大量應(yīng)用,采集的數(shù)據(jù)量非常大,傳輸成本非常高,而且很難在第一時間匯集到數(shù)據(jù)總平臺,造成全局預(yù)警與搜索的困難。此外,針對交通擁堵情況,當(dāng)前的交通大數(shù)據(jù)主要還是以導(dǎo)航地圖、共享出行軟件等為主,視頻智能分析數(shù)據(jù)應(yīng)用還是比較少等等。
當(dāng)然隨著神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)、邊緣技術(shù)等技術(shù)的進(jìn)步、算法的不斷優(yōu)化、計算機(jī)性能提升,當(dāng)前面臨的種種問題都會逐步得到有效解決。
解析數(shù)據(jù)、精準(zhǔn)處理 擁抱智能時代
隨著人類社會科技演進(jìn)持續(xù)加速的態(tài)勢,人工智能時代奇點的來臨速度或許遠(yuǎn)超我們想象。市場調(diào)研機(jī)構(gòu)Strategy Analytics4月12日發(fā)布的研究報告《智能家居監(jiān)控攝像機(jī)市場分析與預(yù)測》指出,低于200美元價格點的配備全套軟件和服務(wù)功能的攝像機(jī)將推動智能家居監(jiān)控攝像機(jī)市場的增長。該報告預(yù)測,到2023年,全球市場消費(fèi)者在智能家居監(jiān)控攝像機(jī)上支出將超過97億美元。
中國工程程院院士、北京大學(xué)教授高文在參加2018年人工智能安防峰會時表示,城市大腦需要智慧之眼。“通過監(jiān)控攝像頭讓城市變得更智慧,不僅僅是單一的視頻檢索和計算機(jī)視覺問題,而是在面臨海量信息和突發(fā)事件時,能否迅速做出反應(yīng)、能否降低計算量、能否有效識別和檢索等一系列龐大的系統(tǒng)工程。”
未來攝像機(jī)將不再是自出廠之后就一成不變的,而是根據(jù)用戶的需要,通過加載不同軟件實現(xiàn)不同的業(yè)務(wù)功能,融入軟件定義產(chǎn)品的新時代。通過規(guī)模化、多樣化的智能前端攝像機(jī)進(jìn)行精準(zhǔn)的數(shù)據(jù)采集,后臺強(qiáng)大的云計算和視頻解析系統(tǒng)對采集的數(shù)據(jù)進(jìn)行準(zhǔn)確的解析和表述,龐大的大數(shù)據(jù)分析與挖掘系統(tǒng)對海量數(shù)據(jù)進(jìn)行高效精準(zhǔn)的處理,才能夠真正的讓視頻監(jiān)控協(xié)助用戶準(zhǔn)確的觀察、識別和應(yīng)對周邊的事物,做到真正的擁抱智能時代。
結(jié)語:視頻監(jiān)控整合人工智能技術(shù),雖然在加強(qiáng)監(jiān)控的同時也伴隨著一些潛在風(fēng)險,但是潛在的優(yōu)點顯然超過了缺點。且如今人工智能在算法與芯片領(lǐng)域的成熟及成本的下降,使得智能監(jiān)控的商業(yè)化落地更加快速地普及,同時智能監(jiān)控市場在尋求差異化競爭形成了百花齊放的形勢。