【安防展覽網(wǎng) 品牌專欄】近日,依圖科技在ReID領(lǐng)域取得新突破,刷新三大數(shù)據(jù)集當(dāng)前優(yōu)成績(jī),算法性能達(dá)到業(yè)界迄今高標(biāo)準(zhǔn)。值得一提的是,考慮到算法對(duì)比的公平性,依圖的算法結(jié)果是在不利用時(shí)空信息,不進(jìn)行重排再優(yōu)化(Re-ranking)等限制下取得的。
在行人重識(shí)別技術(shù)領(lǐng)域,*命中率(Rank-1 Accuracy)和平均精度均值(Mean Average Precision,mAP)是業(yè)內(nèi)公認(rèn)的衡量算法水平的核心指標(biāo)。在三大ReID公認(rèn)數(shù)據(jù)集Market1501、DukeMTMC-ReID、CUHK03上,依圖將衡量算法性能的兩大關(guān)鍵指標(biāo)“*命中率”(Rank-1 Accuracy)及“平均精度均值”(Mean Average Precision,mAP)的六項(xiàng)數(shù)據(jù)全部提升,刷新世界記錄,充分顯示了技術(shù)實(shí)力,進(jìn)一步穩(wěn)固了中國(guó)AI在該任務(wù)下的*地位。
一、 什么是ReID?
行人重識(shí)別(ReID,也稱“行人再識(shí)別”),是指在多攝像設(shè)備網(wǎng)絡(luò)下對(duì)行人進(jìn)行檢索,利用步態(tài)動(dòng)作、身體特征等更為全面的信息來識(shí)別人物,無論單獨(dú)使用還是與人臉識(shí)別相結(jié)合,都能發(fā)揮更大的應(yīng)用價(jià)值。特別是當(dāng)攝像頭無法抓拍到清晰的人臉時(shí),行人重識(shí)別技術(shù)就發(fā)揮著非常重要的作用。
然而,由于ReID需要從不同攝像機(jī)拍攝的圖像或視頻中找出同一個(gè)人物,而這些攝像機(jī)所覆蓋的范圍彼此并不重疊,導(dǎo)致缺乏連貫的信息,而且不同畫面中人物的姿態(tài)、行為甚至外觀(比如: 正身、側(cè)身、背身)會(huì)發(fā)生較大變化,不同時(shí)間、場(chǎng)景的光照、背景和遮擋物各不相同(背景中常還有體型、衣著相似的其他人物干擾),攝像機(jī)的分辨率也有高有低,人物在畫面中出現(xiàn)的位置有遠(yuǎn)有進(jìn),這些都對(duì)ReID技術(shù)提出了極大的挑戰(zhàn)。
二、技術(shù)攻堅(jiān):深度優(yōu)化ReID算法框架,AutoML取代人工算法調(diào)優(yōu)
需要指出,*命中率高,意味著算法能夠在眾多圖像中準(zhǔn)確找出容易識(shí)別或者匹配的那張,并不能反應(yīng)模型的真實(shí)能力,尤其是應(yīng)對(duì)復(fù)雜場(chǎng)景的表現(xiàn);而mAP值越高,說明系統(tǒng)的實(shí)用性越好,既能查得全也能查得準(zhǔn),能夠較好地應(yīng)對(duì)多遮擋、光線暗、畫面模糊等情況。因此,評(píng)價(jià)ReID算法性能時(shí)需要結(jié)合mAP值,它反映的是系統(tǒng)的綜合檢索性能。
依圖科技憑借自身工程與研發(fā)實(shí)力,深度優(yōu)化了ReID算法框架,顯著提升了算法效率,通過結(jié)合AutoML等前沿技術(shù),進(jìn)一步創(chuàng)新性地實(shí)現(xiàn)了模型參數(shù)的自動(dòng)搜索與迭代,突破了依賴算法研究員手工設(shè)計(jì)與調(diào)優(yōu)的傳統(tǒng)算法開發(fā)流程,在降低人力成本的同時(shí),使得算法的泛化性能更強(qiáng)。
三、同時(shí)突破算法+算力,加速ReID商業(yè)化落地加速
依圖研發(fā)人員表示,這次刷榜只是一次嘗試,依圖在工業(yè)界實(shí)戰(zhàn)落地的ReID項(xiàng)目,其規(guī)模與問題的復(fù)雜程度已經(jīng)遠(yuǎn)超三大數(shù)據(jù)集,可以說,學(xué)術(shù)界現(xiàn)有ReID基準(zhǔn)已經(jīng)無法體現(xiàn)工業(yè)界算法的高水平。
舉個(gè)例子, Market-1501在清華大學(xué)內(nèi)采集,行人(ID)基本上是穿短袖、短褲和裙裝的亞洲人,DukeMTMC-reID在杜克大學(xué)內(nèi)采集,ID主要是身著冬季服飾的歐美人,這些在特定場(chǎng)景,特定時(shí)間段采集的數(shù)據(jù)往往與真實(shí)世界中的圖像分布不一致。在真實(shí)場(chǎng)景下ReID算法需要做到在跨時(shí)間段、跨場(chǎng)景、跨不同成像質(zhì)量的圖像采集設(shè)備下進(jìn)行高精度的快速識(shí)別,數(shù)據(jù)分布遠(yuǎn)遠(yuǎn)與問題復(fù)雜程度遠(yuǎn)遠(yuǎn)大于現(xiàn)有的學(xué)術(shù)數(shù)據(jù)集。
這些現(xiàn)實(shí)因素導(dǎo)致了現(xiàn)有ReID學(xué)術(shù)界數(shù)據(jù)集無法有效模擬或者還原實(shí)際真實(shí)情況。因此,基于現(xiàn)有ReID數(shù)據(jù)集的基準(zhǔn)具有很大的局限性,依圖研究人員表示,業(yè)界需要更好的ReID數(shù)據(jù)集,也需要更全面的算法衡量數(shù)據(jù)集,至少對(duì)于商業(yè)化落地的算法是如此。
實(shí)戰(zhàn)場(chǎng)景下的ReID任務(wù),不僅對(duì)算法提出更高要求,也需要更高效的芯片提供強(qiáng)大的算力支持,二者缺少任意一個(gè),都會(huì)影響ReID的實(shí)際應(yīng)用價(jià)值。目前看來,依圖是當(dāng)下同時(shí)具備算法和算力能力的公司。依圖在2017年投入云端AI芯片QuestCore™(求索)的研發(fā),并于2019年5月“發(fā)布即商用”。QuestCore™是首顆云端視覺AI芯片,提供強(qiáng)大算力,單路攝像頭功耗不到1W。
在ReID實(shí)戰(zhàn)應(yīng)用中,依圖研發(fā)人員針對(duì)本次提出的算法做了進(jìn)一步優(yōu)化, 依托依圖自研AI芯片, 在僅憑穿著、體態(tài)特征的條件下,已能將ReID做到2017年~2018年人臉識(shí)別的精度。自研AI芯片QuestCore™加上*算法的創(chuàng)新融合,不僅突破了算力和算法的應(yīng)用瓶頸,同時(shí)也為ReID的實(shí)戰(zhàn)應(yīng)用帶來無限想象空間。
在智能城市領(lǐng)域,ReID技術(shù)能通過軌跡還原功能,快速篩查可疑人員并進(jìn)一步鎖定出行區(qū)域,進(jìn)而做到精準(zhǔn)預(yù)防和打擊。例如,在疫情期間,人員戴口罩或者臉部遮擋的情況下,如何控制傳染源四處流動(dòng)就成為防控疫情的重要內(nèi)容。ReID技術(shù)依靠行人的整體姿態(tài)來做檢索,通過分析行人的穿著和體態(tài),可將排查的時(shí)間由數(shù)天縮短到數(shù)秒,有效助力疫情防控。
應(yīng)用到智能園區(qū)和智能交通領(lǐng)域,ReID可對(duì)于陌生人等可疑人員進(jìn)行*刻畫,有效保障園區(qū)安全;在人流密集的超市、園區(qū)等大型公共場(chǎng)所,ReID能夠幫助實(shí)現(xiàn)不慎走失的兒童、老人的迅速查找;在地鐵站、機(jī)場(chǎng)等交通樞紐區(qū)域,ReID技術(shù)可以配合人臉、局部的動(dòng)作和姿態(tài)進(jìn)行快速識(shí)別,大幅提升人員過檢速度。
由于道路車流量的不斷增加、交通狀況日趨繁雜,交通違章、交通事故和阻塞等現(xiàn)象頻頻發(fā)生,ReID有助于在道路、車輛和駕駛員之間建立快速的智能通信聯(lián)系,形成人、車、道路的完整調(diào)動(dòng)閉環(huán),精準(zhǔn)感知交通路口各個(gè)方向的車輛數(shù)量、流量和密度,為交警決策提供準(zhǔn)確依據(jù);在無人駕駛領(lǐng)域,ReID可有效對(duì)車輛、行人、障礙物、道路以及交通信號(hào)燈和交通標(biāo)識(shí)進(jìn)行感知,構(gòu)建真正智能的交通體系,帶給人們更加安全、便捷的出行體驗(yàn)。
不難想象,未來該技術(shù)還將不斷解鎖在智能城市、智能社區(qū)、智能零售等更多場(chǎng)景和規(guī)模下的實(shí)戰(zhàn)落地。
*ReID算法,加上自研AI芯片,業(yè)界期待的下一個(gè)計(jì)算機(jī)視覺領(lǐng)域“殺手級(jí)應(yīng)用”已然到來。