基于AI深度認(rèn)知技術(shù)在智慧城市安防中應(yīng)用與前景

責(zé)任編輯:zsheng

2018-08-18 16:18:44

摘自:《中國(guó)安防》

人工智能是計(jì)算機(jī)科學(xué)的一個(gè)分支,它企圖了解智能的實(shí)質(zhì),并生產(chǎn)出一種新的能以人類智能相似的方式作出反應(yīng)的智能機(jī)器,該領(lǐng)域的研究包括機(jī)器人、語(yǔ)言識(shí)別、圖像識(shí)別、自然語(yǔ)言處理和專家系統(tǒng)等。

人工智能是計(jì)算機(jī)科學(xué)的一個(gè)分支,它企圖了解智能的實(shí)質(zhì),并生產(chǎn)出一種新的能以人類智能相似的方式作出反應(yīng)的智能機(jī)器,該領(lǐng)域的研究包括機(jī)器人、語(yǔ)言識(shí)別、圖像識(shí)別、自然語(yǔ)言處理和專家系統(tǒng)等。

深度學(xué)習(xí)是當(dāng)前最熱的人工智能研究領(lǐng)域,實(shí)現(xiàn)人工智能有三種路線:一是基于邏輯方法進(jìn)行功能模擬的符號(hào)主義路線,代表領(lǐng)域有專家系統(tǒng)和知識(shí)工程;二是基于統(tǒng)計(jì)方法的仿生模擬的連接主義路線,代表領(lǐng)域有機(jī)器學(xué)習(xí)和人腦仿生;三是行為主義,希望從進(jìn)化的角度出發(fā),基于智能控制系統(tǒng)的理論、方法和技術(shù),研究擬人的智能控制行為。

安防領(lǐng)域一直被認(rèn)為是人工智能落地最快、最好的行業(yè)之一。首先,以視頻技術(shù)為核心的安防行業(yè)擁有海量的數(shù)據(jù)來(lái)源,可以充分滿足人工智能對(duì)于算法模型訓(xùn)練的要求;其次,安防行業(yè)事前預(yù)防、事中響應(yīng)、事后追查的訴求與人工智能的技術(shù)邏輯完全吻合。伴隨高清化、深度學(xué)習(xí)、云存儲(chǔ)、GPU 的研發(fā)進(jìn)展,人工智能為解決安防領(lǐng)域問(wèn)題提供了新的思路,逐漸由硬件向軟件、算法轉(zhuǎn)變,提高視頻價(jià)值,讓用戶看得完、看得懂。

基于AI的深度認(rèn)知技術(shù)在安防領(lǐng)域的關(guān)鍵技術(shù)

深度卷積神經(jīng)網(wǎng)絡(luò)解決視頻圖像識(shí)別

目前深度學(xué)習(xí)網(wǎng)絡(luò)有很多種架構(gòu),有基于自編碼器的架構(gòu),基于玻爾茲曼機(jī)的架構(gòu)以及基于卷積神經(jīng)網(wǎng)絡(luò)的架構(gòu)等。其中基于卷積神經(jīng)網(wǎng)絡(luò)的深度卷積神經(jīng)網(wǎng)絡(luò)(DCNN),已成為當(dāng)前語(yǔ)音分析和圖像識(shí)別領(lǐng)域的研究熱點(diǎn)。它的權(quán)值共享網(wǎng)絡(luò)結(jié)構(gòu)使之更類似于生物神經(jīng)網(wǎng)絡(luò),降低了網(wǎng)絡(luò)模型的復(fù)雜度,減少了權(quán)值的數(shù)量。為此,可以采用深度卷積神經(jīng)網(wǎng)絡(luò)解決視頻圖像識(shí)別問(wèn)題。

卷積神經(jīng)網(wǎng)絡(luò)與傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)一樣,擁有輸入層、隱含層和輸出層。其中它的隱含層包括低隱含層和高隱含層,低隱含層由卷積層和下采樣層交替成對(duì)組成;高隱含層是與傳統(tǒng)神經(jīng)網(wǎng)絡(luò)隱含層類似的全連接層。輸出層是一個(gè)分類器,可以用采集邏輯回歸、softmax回歸或者支持向量機(jī)等對(duì)圖像進(jìn)行分類。

卷積層

卷積神經(jīng)網(wǎng)絡(luò)主要是通過(guò)“局部感知野”和“權(quán)值共享”兩個(gè)理論來(lái)降低網(wǎng)絡(luò)模型復(fù)雜度、減少權(quán)值數(shù)量。

“局部感知野”是1962年Hubel和Wiesel通過(guò)對(duì)貓視覺(jué)皮層細(xì)胞的研究提出來(lái)的概念。一般認(rèn)為,視覺(jué)皮層的神經(jīng)元就是局部接受信息的(即,這些神經(jīng)元只響應(yīng)某些特定區(qū)域的刺激)。同理,人們推斷圖像的空間聯(lián)系也是局部的像素聯(lián)系較為緊密,而距離較遠(yuǎn)的像素相關(guān)性則較弱。因而,人工神經(jīng)網(wǎng)絡(luò)中,每個(gè)神經(jīng)元其實(shí)沒(méi)有必要對(duì)全局圖像進(jìn)行感知,只需要如下圖2所示,對(duì)局部進(jìn)行感知,然后在更高層將局部的信息綜合起來(lái)就得到了全局的信息。

采用局部感知區(qū)域?yàn)?0*10的方法,可以將1000*1000像素圖像每層之間1012個(gè)全連接參數(shù)降低至108個(gè)局部連接參數(shù)。“權(quán)值共享”是指圖像的一部分的統(tǒng)計(jì)特性與其他部分是一樣的。這也意味著我們?cè)谶@一部分學(xué)習(xí)的特征也能用在另一部分上,所以對(duì)于這個(gè)圖像上的所有位置,我們都能使用同樣的學(xué)習(xí)特征。在局部連接的神經(jīng)網(wǎng)絡(luò)中,“權(quán)值共享”意味著讓所有的局部感知區(qū)域的權(quán)值一致。采用權(quán)值共享的方法,可以將1000*1000像素圖像每層108個(gè)局部連接的參數(shù)降低至100個(gè)局部連接共享參數(shù)。

通過(guò)卷積的方式實(shí)現(xiàn)“局部感知野”和“權(quán)值共享”的神經(jīng)網(wǎng)絡(luò)就是卷積神經(jīng)網(wǎng)絡(luò)。

下采樣層

卷積神經(jīng)網(wǎng)絡(luò)在通過(guò)卷積獲得了特征之后,還需要再添加一個(gè)下采樣層與之配對(duì)。這是因?yàn)榫矸e一個(gè)大圖像(例如1000*1000)得到的特征向量維數(shù)將會(huì)非常大,容易出現(xiàn)過(guò)擬合。下采樣層通過(guò)對(duì)不同位置的特征進(jìn)行聚合統(tǒng)計(jì)(例如,計(jì)算圖像一個(gè)區(qū)域上的某個(gè)特定特征的平均值或最大值),不僅保留了有用信息,同時(shí)可以降低數(shù)據(jù)量、改善結(jié)果(不容易過(guò)擬合),更重要的是能夠保持某種不變性(旋轉(zhuǎn)、平移、伸縮等)。

由于圖像的識(shí)別特征具有層次性(具有“像素-低級(jí)特征-對(duì)象部分-對(duì)象”的層次結(jié)構(gòu)),其中低層圖像特征具有較低的抽象性,高層圖像特征具有較高的抽象性,通過(guò)組合底層特征能夠形成更加抽象的高層表示。因此本項(xiàng)目將建立一種含有四對(duì)“卷積層-下采樣層”的深度卷積學(xué)習(xí)模型。其中卷積核大小和卷積核數(shù)將會(huì)根據(jù)實(shí)際數(shù)據(jù)進(jìn)行對(duì)比測(cè)試確定,輸出層采用的分類模型將會(huì)根據(jù)采集邏輯回歸、softmax回歸以及支持向量機(jī)的具體表現(xiàn)進(jìn)行抉擇。

基于深度卷積網(wǎng)絡(luò)的圖像目標(biāo)檢測(cè)分類算法

基于深度卷積網(wǎng)絡(luò)的圖像目標(biāo)檢測(cè)分類,常用的算法包括:R-CNN、SPP-NET、FAST-R-CNN、FASTER-R-CNN、YOLO、SSD等。

2013年,Ross提出了R-CNN(Region cnn,基于區(qū)域的卷積神經(jīng)網(wǎng)絡(luò))的模型方法,采用對(duì)Region proposal(區(qū)域候選)提取CNN特征。R-CNN的目標(biāo)檢測(cè)主要方法包括采用回歸目標(biāo)窗口和滑動(dòng)窗口,它的主要測(cè)試過(guò)程如下:

● 給定一張圖片,利用selective search方法來(lái)產(chǎn)生2000個(gè)候選窗口。

● 利用CNN進(jìn)行對(duì)每一個(gè)候選窗口提取特征,特征長(zhǎng)度為4096維度。

● 最后用SVM分類器對(duì)這些特征進(jìn)行分類(每一個(gè)目標(biāo)類別一個(gè)SVM分類器)。

但是R-CNN的計(jì)算時(shí)間太長(zhǎng),重復(fù)計(jì)算太大,因此微軟亞洲研究院何凱明等人在R-CNN的基礎(chǔ)上提出了SPP-NET(Spatial Pyramid Pooling-Net,空間金字塔池化網(wǎng)絡(luò))的模型架構(gòu),SPP-NET主要是修改了最后一層卷積層后的最大池化層,將其用空間金字塔池化層代替,這樣做的好處在于首先對(duì)輸入圖像尺度無(wú)限制,同時(shí)輸出的是定長(zhǎng)特征,但運(yùn)用滑動(dòng)窗口的池化技術(shù)就無(wú)法達(dá)到這樣的效果;其次SPP可運(yùn)用不同大小的池化窗口,但CNN只能是單一的窗口;接著SPP可從尺度變化中提取特征;另外可以大大提高了圖像處理速度,是R-CNN方法的24-102倍。

盡管如此,SPP-NET仍舊存在缺陷:

一是SPP-NET雖然極大地提高了R-CNN的速度,但和R-CNN一樣,他們的訓(xùn)練過(guò)程都是一個(gè)多階段過(guò)程:即包含著特征抽取,網(wǎng)絡(luò)徹調(diào),分類器SVM的訓(xùn)練及最后的對(duì)BoundingBox(邊界框)回歸器的匹配。

二是SPP-NET中用到的微調(diào)技術(shù)只能更新FC層,這無(wú)疑限制了深度CNN的潛力。

FAST-R-CNN(fast region CNN,快速區(qū)域的卷積神經(jīng)網(wǎng)絡(luò))是在R-CNN和SPP-NET基礎(chǔ)上提出的一種利用深度卷積神經(jīng)網(wǎng)絡(luò)對(duì)快速檢測(cè)目標(biāo)的方法。

由于R-CNN和SPP-NET共同存在以下缺點(diǎn):

1.訓(xùn)練的時(shí)候傳遞途徑是隔離的,即首先提取候選框,然后利用CNN提取特征,之后用SVM分類器,最后再做邊界框的回歸。而FAST-R-CNN實(shí)現(xiàn)了端對(duì)端的聯(lián)合訓(xùn)練。

2.訓(xùn)練時(shí)間和空間開(kāi)銷大。R-CNN中ROI-centric的運(yùn)算開(kāi)銷大,所以FAST-R-CNN用了圖像中心的訓(xùn)練方式來(lái)通過(guò)卷積的共享特性來(lái)降低運(yùn)算開(kāi)銷;R-CNN提取特征給SVM訓(xùn)練的時(shí)候需要大量的磁盤空間存放特征,F(xiàn)AST-R-CNN去掉了SVM這一步,所有的特征都暫時(shí)存儲(chǔ)于顯存中,不需要額外的磁盤空間。

3.測(cè)試時(shí)間開(kāi)銷大。依然是因?yàn)镽OI的原因,這點(diǎn)SPP-NET己經(jīng)改進(jìn),然后FAST-R-CNN進(jìn)一步通過(guò)單尺度測(cè)試和SVD分解全連接來(lái)提升速度。

面向時(shí)空關(guān)聯(lián)語(yǔ)義分析的多源數(shù)據(jù)融合模型

視頻內(nèi)容的識(shí)別和理解是實(shí)現(xiàn)智慧型應(yīng)用服務(wù)的關(guān)鍵技術(shù)點(diǎn)。傳統(tǒng)的識(shí)別方法通常針對(duì)單一的分析源中的顏色、形狀、運(yùn)動(dòng)軌跡等特征進(jìn)行分析。這樣的分析結(jié)果往往導(dǎo)致本身存在強(qiáng)關(guān)聯(lián)的對(duì)象之間的關(guān)系無(wú)法建立,從而丟了視頻中本身包含的大量潛在信息。

通過(guò)對(duì)多種關(guān)聯(lián)數(shù)據(jù)進(jìn)行分析,可以挖掘出更有價(jià)值的應(yīng)用,例如刑偵線索分析、案件規(guī)律分析、社會(huì)輿情分析、金融詐騙分析、公共交通優(yōu)化等。如何對(duì)這些海量的融合數(shù)據(jù)進(jìn)行清洗和選擇,并建立有效的分析模型是一個(gè)有趣的挑戰(zhàn)。因此,本項(xiàng)目將采用多源數(shù)據(jù)融合的方式實(shí)現(xiàn)多通道、全時(shí)空的語(yǔ)義分析。

多源數(shù)據(jù)融合可以分為3種思路與方法:

數(shù)據(jù)層融合。先對(duì)各模態(tài)的視頻數(shù)據(jù)進(jìn)行簡(jiǎn)單組合形成新的特征向量,再進(jìn)行后續(xù)的常規(guī)分類或識(shí)別等過(guò)程。

特征層融合。從單模態(tài)視頻數(shù)據(jù)中提取有效互補(bǔ)的特征,通過(guò)時(shí)間尺度等規(guī)則將這些特征有機(jī)結(jié)合在一起,作為統(tǒng)一的多模態(tài)數(shù)據(jù)特征。

決策層融合。從不同模態(tài)的視頻數(shù)據(jù)中分別提取特征,通過(guò)模式識(shí)別過(guò)程獲得識(shí)別結(jié)果與權(quán)重,在通過(guò)融合策略獲得最后的判別或者識(shí)別結(jié)果。

與傳統(tǒng)基于單源數(shù)據(jù)的方法相比,多源數(shù)據(jù)融合把多個(gè)數(shù)據(jù)源在時(shí)間和空間上冗余或互補(bǔ)的信息依據(jù)某種準(zhǔn)則進(jìn)行組合,獲取被觀測(cè)對(duì)象的一致性解釋或描述,以便能夠擴(kuò)展時(shí)空的覆蓋范圍,減少信息的模糊性,增加對(duì)目標(biāo)行為確認(rèn)的可信度,改善系統(tǒng)的可靠性。尤其系統(tǒng)借助GIS獨(dú)特的地理空間分析能力、快速的空間定位搜索和復(fù)雜的查詢功能、強(qiáng)大的圖形處理和表達(dá)能力,可以直觀地在地圖上顯示各個(gè)攝像頭的位置,在事件發(fā)生時(shí)也會(huì)根據(jù)攝像頭的位置在地圖上標(biāo)出地點(diǎn),幫助辦案人員快速了解事件地點(diǎn)及其周邊信息。

基于AI的深度認(rèn)知技術(shù)在安防領(lǐng)域的應(yīng)用與前景

人工智能將在安防領(lǐng)域發(fā)展空間巨大

人工智能在安防領(lǐng)域的應(yīng)用主要分為警用、民用兩個(gè)方向。其中,在公安領(lǐng)域,可以通過(guò)海量數(shù)據(jù)提取線索、鎖定目標(biāo)軌跡;在交通領(lǐng)域,可以通過(guò)分析交通流量、提升通行效率;智能樓宇及園區(qū)領(lǐng)域,可以通過(guò)智能監(jiān)控建筑安防、降低能耗;民用安防領(lǐng)域,則通過(guò)提供差異化服務(wù)實(shí)現(xiàn)人性化管理。

在市場(chǎng)上,人工智能當(dāng)前還處于應(yīng)用前期,這注定其處于較高的價(jià)位,如要進(jìn)行大面積應(yīng)用,必然會(huì)對(duì)其價(jià)格提出較為適宜的要求。隨著人工智能在安防領(lǐng)域的大面積應(yīng)用,必然會(huì)催生更加適合應(yīng)用場(chǎng)景的技術(shù)創(chuàng)新,使得人工智能能夠適應(yīng)多種應(yīng)用場(chǎng)景,真正實(shí)現(xiàn)落地實(shí)用。

深度學(xué)習(xí)和高效計(jì)算加速人工智能在安防領(lǐng)域落地

支持人工智能在安防領(lǐng)域內(nèi)得以落地的關(guān)鍵技術(shù)就是深度學(xué)習(xí)與高效計(jì)算。眾所周知,由于深度學(xué)習(xí)的出現(xiàn)使得人臉識(shí)別技術(shù)得到突飛猛進(jìn)的發(fā)展,由原來(lái)的實(shí)驗(yàn)室階段一躍成為現(xiàn)場(chǎng)可使用的技術(shù),但是深度學(xué)習(xí)帶來(lái)的另外一個(gè)負(fù)面效應(yīng)就是超大計(jì)算量。由于傳統(tǒng)的CPU不適合并行的圖像運(yùn)算,使得人臉的解決方案面臨高昂的代價(jià),而GPU(或TPU)等高密度計(jì)算的出現(xiàn)極大地緩解了深度學(xué)習(xí)對(duì)計(jì)算資源的需求,使得人工智能最終實(shí)現(xiàn)落地。

人工智能在社會(huì)綜合防控的前景

健全社會(huì)治安形勢(shì)分析研判機(jī)制,情報(bào)主導(dǎo)警務(wù)的理念,利用人工智能對(duì)重點(diǎn)人員、重點(diǎn)車輛、重點(diǎn)物品所產(chǎn)生的海量監(jiān)測(cè)數(shù)據(jù)進(jìn)行實(shí)時(shí)收集、處理、挖掘,并通過(guò)機(jī)器學(xué)習(xí)的方法對(duì)數(shù)據(jù)進(jìn)行建模,建立健全社會(huì)治安情報(bào)信息分析研判機(jī)制,定期對(duì)社會(huì)治安形勢(shì)進(jìn)行分析研判。加強(qiáng)對(duì)社會(huì)輿情、治安動(dòng)態(tài)和熱點(diǎn)、敏感問(wèn)題的分析預(yù)測(cè),加強(qiáng)對(duì)社會(huì)治安重點(diǎn)領(lǐng)域的研判分析,及時(shí)發(fā)現(xiàn)苗頭性、傾向性問(wèn)題,提升有效應(yīng)對(duì)能力。建立健全治安形勢(shì)播報(bào)預(yù)警機(jī)制,增強(qiáng)群眾自我防范意識(shí)。

人工智能在智慧安防的應(yīng)用前景

安防本身業(yè)務(wù)應(yīng)用的需求決定了安防人工智能市場(chǎng)的潛在需求巨大。智慧安防技術(shù)主要由人工智能算法、高性能計(jì)算、分布式計(jì)算和存儲(chǔ)、大規(guī)模運(yùn)維等構(gòu)成。其中視覺(jué)智能算法主要涉及人臉識(shí)別、車輛車型識(shí)別、文字識(shí)別、目標(biāo)跟蹤、圖像特征搜索等技術(shù)。應(yīng)用先進(jìn)的人工智能算法,包括深度學(xué)習(xí)、統(tǒng)計(jì)建模技術(shù),創(chuàng)新性的解決技術(shù)和應(yīng)用結(jié)合的難題,能有效處理大規(guī)模樣本(億級(jí)訓(xùn)練樣本)和少量訓(xùn)練樣本的機(jī)器學(xué)習(xí)問(wèn)題。未來(lái)人工智能將在智慧城市中得到更加廣泛的應(yīng)用,是智慧安防的下一個(gè)技術(shù)發(fā)展風(fēng)口。

結(jié)語(yǔ)

智慧城市需要智慧的軀體和智慧的大腦,推進(jìn)城市超腦工程建設(shè),結(jié)合云計(jì)算、大數(shù)據(jù)、可視化運(yùn)行平臺(tái)、基于實(shí)景地圖與MR展示的智能分析應(yīng)用的建設(shè),讓人工智能在大數(shù)據(jù)環(huán)境下充分發(fā)揮碎片化大數(shù)據(jù)的認(rèn)知機(jī)理,通過(guò)深度學(xué)習(xí),讓機(jī)器能理解和會(huì)思考,有效整合各部門所掌握的全市經(jīng)濟(jì)社會(huì)信息資源,滿足政府業(yè)務(wù)對(duì)數(shù)據(jù)資源共享需要,進(jìn)而提升形勢(shì)分析預(yù)測(cè)水平,對(duì)政府在發(fā)展規(guī)劃、投資布局、資源環(huán)境、管理創(chuàng)新、科學(xué)決策等業(yè)務(wù)提供強(qiáng)有力支持,提高了政府部門掌控全市經(jīng)濟(jì)社會(huì)發(fā)展態(tài)勢(shì)的能力。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號(hào)-6京公網(wǎng)安備 11010502049343號(hào)