【中國安防展覽網(wǎng) 品牌專欄】 兩年前安防領域之所以引起明星計算機視覺創(chuàng)業(yè)公司的關注,主要由于安防領域的痛點還得不到有效解決。但隨著監(jiān)控設備商對自身問題解決的需求愈發(fā)強烈,以及算法的門檻的降低,使得傳統(tǒng)監(jiān)控設備商也開始利用 AI 技術解決視頻監(jiān)控難題。
近些年,安防巨頭們紛紛在人工智能的大環(huán)境下根據(jù)自身特點,提出新的戰(zhàn)略,如??低暤?ldquo;AI+”、大華的“視頻+”、宇視的“SMV”、東方網(wǎng)力的“強大腦”等等。
總體而言,“AI+安防”是從前、后端智能的模式升級,前端通過 GPU 運行算法,進行視頻的的采集,后端利用大數(shù)據(jù),進行分析和檢索等。
得益于多年來自身對安防業(yè)務的深入理解,大華、海康威視這類廠商在深耕 AI 安防方面有著更顯著的優(yōu)勢。
圖片來自易觀
2016 年,大華整合了上百臺高性能計算機,建設深度學習計算集群,現(xiàn)已完成了深度學習計算中心的建設。依托于 CPU、DSP、GPU 和 FGPA 等芯片平臺上的軟硬件研發(fā)能力,大華已經(jīng)形成了一系列基于深度學習的智能產(chǎn)品,包括前后端的人臉識別、卡口電警、視頻結(jié)構(gòu)化、雙目立體視覺和多目全景拼接產(chǎn)品。
本文雷鋒網(wǎng)將講述大華在 AI 領域的研究和實際落地案例,主要涵蓋數(shù)據(jù)結(jié)構(gòu)化化、車輛識別、人臉識別、深度學習等幾大方面。
一、大華在數(shù)據(jù)結(jié)構(gòu)化化方面的工作
*,傳統(tǒng)智能分析產(chǎn)品所產(chǎn)生的數(shù)據(jù)較為單一。業(yè)內(nèi)人士向雷鋒網(wǎng)表示,安防領域的大數(shù)據(jù)、云計算與其他行業(yè)有很大的差異,首先音視頻數(shù)據(jù)本身體量巨大,接入硬件數(shù)量較多,且高并發(fā)。
在這種環(huán)境下,它對平臺的擴充性、部署靈活性、運算能力要求均非??量?。
視圖萃取技術
格靈深瞳 CEO 趙勇曾給雷鋒網(wǎng)介紹到,目前以視頻數(shù)據(jù)為核心的安防監(jiān)控體系,其實給客戶帶來了大量的麻煩。從前端傳感器直接獲得的數(shù)據(jù)其實是一種非結(jié)構(gòu)化信息,把非結(jié)構(gòu)化的數(shù)據(jù)放在客戶跟前,然后尋找線索猶如大海撈針。只有在實現(xiàn)結(jié)構(gòu)化處理后,才能將其中有價值的數(shù)據(jù)直觀、的保存、處理和應用。
所以安防行業(yè)把希望寄托在智能化上,所謂智能化就是能夠把人工智能引進來,把所有的視頻數(shù)據(jù)除了引入人以外,還通過引進人工智能技術來分析它,自動把視頻數(shù)據(jù)里面的內(nèi)容和目標變成結(jié)構(gòu)化數(shù)據(jù)。
何為結(jié)構(gòu)化數(shù)據(jù)?結(jié)構(gòu)化數(shù)據(jù)就是數(shù)據(jù)能夠直接表達目標的性狀、屬性以及身份。這種數(shù)據(jù)可以大規(guī)模去檢索,大規(guī)模地分析、統(tǒng)計。
為此,大華股份在近些年研究視圖萃取技術解決這一問題。視圖萃取技術實現(xiàn)對海量視圖的實時結(jié)構(gòu)化提取,對人、車、物識別分離,提取有效結(jié)構(gòu)化數(shù)據(jù),并對視圖中的車、人臉進行深度結(jié)構(gòu)化處理,實時感知城市中的高危人員和車輛。
其不僅可以對實時監(jiān)控視圖做結(jié)構(gòu)化與應用,還可對歷史視圖做結(jié)構(gòu)化歸檔與應用。通過萃取技術,視圖存儲量降低到過去的 1/20 左右。結(jié)構(gòu)化后的高價值信息可以長期保存,讓事后偵查搜索目標變得更加快速。
而且這些數(shù)據(jù)可以隨時與公安業(yè)務系統(tǒng)做大數(shù)據(jù)碰撞,實時做預警、決策、聯(lián)動。
以下為萃取技術示意圖:
這里有人可能會有人問到,萃取和與之相似的濃縮摘要有何區(qū)別?
萃取面對需求以實時結(jié)構(gòu)化為主,所以應用主要針對重點區(qū)域的實時結(jié)構(gòu)化需求,濃縮摘要針對所有事后視頻的摘要分析。萃取對于視頻結(jié)構(gòu)化中除人車分離功能外還有對車輛進行二次分析及特征布控,而濃縮摘要主要側(cè)重人車分離,對于車臉識別及特征布控無法實現(xiàn)。
視頻萃取技術應用
目前大華股份的視圖萃取技術主要應用于公安業(yè)務,大致可分為以下幾個類型:
1.事前重點點位實時結(jié)構(gòu)化
通過地圖將重點區(qū)域進行實時結(jié)構(gòu)化,支持按照全時段、重要時段(如上下班時間)等方式進行配置。當事件發(fā)生后,可通過檢索結(jié)構(gòu)化信息的定位*、車信息。
2.事中即時性案件處理
接到報警后,如果需要馬上通過視頻進行追蹤,可通過地圖框選取案發(fā)地周邊點位后直接進行萃取,通過布控*員、車輛特征(如顏色等)的方式,掌握并跟蹤*員移動軌跡。
3.事后研判,軌跡還原
在地圖上進行時空分析,萃取系統(tǒng)分析的人員、車輛信息形成目標的時空軌跡,幫助辦案民警進行分析和研判。
上述提到的更多是為算法和技術解決方案,算法的正常運行都需要與業(yè)務緊密結(jié)合的基礎設施和底層架構(gòu)來支撐,為此大華在去年聯(lián)合英偉推出了視頻結(jié)構(gòu)化服務器“Deep Sense睿智”來助力視頻數(shù)據(jù)結(jié)構(gòu)化。
專用的數(shù)據(jù)結(jié)構(gòu)化服務器
“睿智”服務器采用 NVIDIA Tesla P4GPUs 作為核心處理負載,服務器多支持 192 路全清視頻實時結(jié)構(gòu)化分析,視頻處理能力將提高 50 倍以上。
在公安行業(yè),“睿智”服務器針對城市中無法直接產(chǎn)生數(shù)據(jù)的普通治安監(jiān)控視頻進行結(jié)構(gòu)化分析,得出多種實戰(zhàn)數(shù)據(jù),實現(xiàn)公安部門對于視頻布控預警、實時指揮、視頻偵查、情報收集等實戰(zhàn)應用需求。
“睿智”服務器對傳統(tǒng)安防的提升主要集中在兩點:
一是支持深層深度學習計算,完成對大數(shù)量人、車屬性特征的提取。二是能支持 192 路全實時高清視頻分析的服務器,該服務器是相同功能下支持路數(shù)多的視頻服務器??砂褜崟r視頻進行結(jié)構(gòu)化分析,將復雜場景中的人、機動車、非機動車分離,提取車輛特征,如車型、車系、車身顏色、車牌顏色、車牌號碼識別、主副駕駛是否系安全帶、是否打電話、有無遮陽板、有無年檢標、有無掛墜、有無紙巾盒等。
針對行人,還可多方面分析其相關特征,包括性別、表情、年齡段、服飾特征、攜帶物特征、運動特征等。
經(jīng)過結(jié)構(gòu)化處理之后的視頻數(shù)據(jù),可以進行長期保存,用戶按照尋找目標的特征,對人、機動車、非機動車的各種特征條件進行組合篩選,快速檢索目標,提高查詢效率。
當然,現(xiàn)階段交通車輛及車牌識別相對成熟,但是在一些場景中的人臉檢測、識別及分析應用上還有較大的提高空間。
二、深耕人臉識別 6 年的成果
據(jù)悉,大華在 2010—2011 年左右開始人臉檢測和識別技術研究的,從時間維度上來看,遠早于行業(yè)里絕大部分人臉識別公司。
2014 年 8 月,大華推出多款支持人臉檢測的 960H 智能 iDVR 新品,讓人臉識別落地在安防產(chǎn)品中。此產(chǎn)品具有人臉檢測回放功能,能快速定位錄像,并將報警信息推送到用戶手機等智能終端設備。
產(chǎn)品除了在人臉識別上擁有優(yōu)勢外,還在云存儲、P2P 私網(wǎng)穿透等方面的應用。
當然,前期大華在人臉技術上的應用相對較淺,首先是檢測和識別算法能力有限,其次是結(jié)構(gòu)化數(shù)據(jù)方面的工作并未成熟。
隨后大華的人臉識別技術團隊設計了一個上百層的深度網(wǎng)絡,并提出新的度量學習方法,可以使得同一人之間的相似度盡量高,同時約束不同人之間的相似度足夠低。在訓練時,結(jié)合在線采樣技術加快收斂速度。通過訓練多個模型以及一種非線性多模型融合技術,大華股份在 LFW(人臉識別公開測試集)上取得了 99.78% 的準確率,當時超越 Google、Facebook、百度、騰訊,排名,以下為大華人臉識別技術原理示意:
在人臉識別算法和結(jié)構(gòu)化數(shù)據(jù)基礎設施的不斷完善下,大華股份于 2016 年 4 月推出了人臉識別服務器 DH-IVS-F7300 天眼系列,能完成人臉實時抓拍、建庫、布控報警、比對等功能,主要應用于火車站、地鐵站、機場、小區(qū)等出入口,實現(xiàn)對敏感人群布控,以及人像歷史行動軌跡檢索等。
DH-IVS-F7300 人臉識別服務器有動態(tài)和靜態(tài)識別兩種區(qū)分:
動態(tài)人臉識別服務器:有 4 路、8 路軟硬一體化和 1×N 路軟件產(chǎn)品形態(tài),支持 1080P 視頻流接入,實現(xiàn)*區(qū)域的人臉檢測、人臉抓拍和人臉比對。抓拍到的人臉圖像不僅可按時間、地點、年齡范圍、性別等條件查詢,還能與*人臉庫進行實時對比。通過上傳*像照片,在 300 萬“路人庫”中可定位*歷史行動軌跡,反饋對比結(jié)果和搜索在秒級水平,支持 30 萬“黑名單”布控。
靜態(tài)人臉識別服務器:采用分布式架構(gòu),支持 2 個人像庫進行 n:N 比對,比如 30 萬黑名單與 3000 萬常駐人口庫比對,輸出兩個人臉庫中相似的人像;而 1:N 人臉對比,秒級反饋比對結(jié)果,可在幾千萬至幾億人口庫中確定一個人的身份。
三、大華AI方案在各個行業(yè)中的應用
在擁有數(shù)據(jù)結(jié)構(gòu)化方案和人臉識別、深度學習技術后,大華逐漸把人工智能應用到各行各業(yè)。
在公安領域,大華已經(jīng)構(gòu)建出基于車輛、行人、信息軌跡三大情報系統(tǒng);在制造業(yè),大華旗下的機器視覺產(chǎn)品也投入使用;在交通行業(yè),大華可提供實時的交通狀況分析和判斷;在農(nóng)牧業(yè),可以實現(xiàn)食品溯源;在森林,結(jié)合無人機做森林防火;在安監(jiān)領域,進行生產(chǎn)過程可視化管理與災難預警;在城市,在平安城市和智慧城市建設中建立全新的“數(shù)據(jù)大腦”。
可以預見,未來大華將會把以往更多用人眼視覺觀察分析的問題,交給用 AI 來解決。