【中國安防展覽網(wǎng) 企業(yè)關(guān)注】人臉識(shí)別技術(shù),作為計(jì)算機(jī)視覺的*當(dāng)家花旦,在國內(nèi)人工智能領(lǐng)域近成為了一顆璀璨的新星。
早在去年年底,阿里系的曠視科技(Face++)就獲得了1 億美元融資,而本月聚焦計(jì)算機(jī)視覺技術(shù)的商湯科技更是獲得了4.1億美元的B輪融資,創(chuàng)下人工智能領(lǐng)域單輪融資高紀(jì)錄;云從科技、依圖科技、深醒科技等人臉識(shí)別玩家在近期均獲得了千萬美元級(jí)融資,這些清一色的輕資產(chǎn)算法公司,能獲得資本市場如此巨量的融資,本身就是一個(gè)奇特的現(xiàn)象,難怪連看好人臉識(shí)別領(lǐng)域的李開復(fù),也驚嘆這個(gè)產(chǎn)業(yè)“竟然能養(yǎng)活四只獨(dú)角獸”。
另外除了這些上游算法提供商,??低?、大華股份等傳統(tǒng)安防行業(yè)巨頭均投入大量資金進(jìn)行人臉識(shí)別的技術(shù)研發(fā)之中,如根據(jù)??低暷陥?bào)披露,海康在2016年研發(fā)投入達(dá)到24.33億元之巨。
人臉識(shí)別投資邏輯:誘人的市場空間
由于*的原因,中國成為了人臉識(shí)別技術(shù)成長的佳沃土。2016年中國平安城市的相關(guān)招標(biāo)額總計(jì)達(dá)到660 億元,而整個(gè)中國安防行業(yè)的規(guī)模更是千億級(jí)市場。根據(jù)中安網(wǎng)數(shù)據(jù),中國安防行業(yè)市場規(guī)模從 2012 年的 3240 億元增長到 2016 年的 5400 億元,年復(fù)合增長率達(dá)到驚人的 15%,而其中2016年視頻監(jiān)控產(chǎn)品產(chǎn)值約達(dá)到962 億元。
中國視頻監(jiān)控行業(yè)在過去十年經(jīng)歷了高清化、網(wǎng)格化的升級(jí)換代后,已經(jīng)形成了累計(jì)投入近萬億的硬件基礎(chǔ)設(shè)施,在視頻監(jiān)控領(lǐng)域完成“看得見、看得清”兩步以后,人臉識(shí)別技術(shù)就猶如“看得懂”這臨門一腳,是實(shí)現(xiàn)AI+安防重要的一步,如果人臉識(shí)別技術(shù)確實(shí)能為安防這個(gè)正在不斷被做大的千億級(jí)蛋糕,增加畫龍點(diǎn)睛的一筆的話,其市場規(guī)模足以讓人睡著都笑醒。
除安防以外,人臉識(shí)別技術(shù)在交通、金融、教育、房地產(chǎn)、移動(dòng)支付等多領(lǐng)域都將有廣泛應(yīng)用,如金融中的遠(yuǎn)程開戶、支付、鑒權(quán)等,人臉識(shí)別具備在多個(gè)行業(yè)領(lǐng)域大規(guī)模普及的潛力,而除了這些B端、G端以外,人臉識(shí)別尚且還有一個(gè)尚未打開的C端。這個(gè)誘人的大蛋糕組合,就是人臉識(shí)別技術(shù)背后的投資邏輯。
人臉識(shí)別技術(shù)成熟度曲線:你微笑了嗎?
始于馬云的“刷臉支付”,隨著人臉識(shí)別技術(shù)逐漸成為熱點(diǎn),科技媒體不乏各種類似“人臉識(shí)別新技術(shù)準(zhǔn)確率超99%,比肉眼更加”等報(bào)道,具有較強(qiáng)的誤導(dǎo)性,具有較強(qiáng)的誤導(dǎo)性,而事實(shí)并非完全如此。
在學(xué)術(shù)界中,人臉識(shí)別算法準(zhǔn)確率確實(shí)能達(dá)到99%以上,如在人臉識(shí)別界的兩個(gè)經(jīng)典榜單LFW和FDDB中,幾乎主流玩家都能做到識(shí)別準(zhǔn)確率99.5%以上,特別是國內(nèi)團(tuán)隊(duì),分?jǐn)?shù)遠(yuǎn)超google。但是,LFW和FDDB僅是兩個(gè)數(shù)據(jù)量不算太多的學(xué)術(shù)數(shù)據(jù)庫,比如LFW僅有1萬多張人臉圖像,通過對(duì)主流人臉識(shí)別算法的不斷調(diào)參,識(shí)別結(jié)果很容易刷到非常高的水平,熟悉機(jī)器學(xué)習(xí)的人都知道“過擬合”的概念,但由于種種原因,LFW和FDDB等學(xué)術(shù)榜單都成了人臉識(shí)別算法商用于市場宣傳的噱頭,就如安卓手機(jī)商每出一款新機(jī)型,都要為安兔兔等榜單密集優(yōu)化一樣,但實(shí)際手機(jī)使用體驗(yàn)和測評(píng)分?jǐn)?shù)是兩個(gè)概念。而對(duì)于人臉識(shí)別技術(shù)同樣如此。工業(yè)界真實(shí)的識(shí)別場景,和學(xué)術(shù)界數(shù)據(jù)庫是完全不同的。在真實(shí)場景應(yīng)用中,受到攝像頭位置、抓拍角度、光線、遮擋物等影響,識(shí)別率將會(huì)大幅下降。
人臉識(shí)別技術(shù)中核心的人臉比對(duì),可分為1:1、1:N以及N:N三種比對(duì)場景,目前1:1(對(duì)當(dāng)前人臉與人像數(shù)據(jù)庫的對(duì)應(yīng)人臉數(shù)據(jù)進(jìn)行快速比對(duì))是應(yīng)用落地廣的場景,比如考生身份確認(rèn)、證照比對(duì)以及早前招行ATM機(jī)的刷臉取款也是屬于這種形式,由于攝像頭位置、光線可控,以及能要求用戶配合,1:1比對(duì)的識(shí)別率可達(dá)到商業(yè)可用的級(jí)別。而1:N比對(duì)則是從海量的人像數(shù)據(jù)庫中檢索當(dāng)前用戶的人臉數(shù)據(jù)并進(jìn)行匹配,典型的應(yīng)用場景是排查**,即監(jiān)控?cái)z像頭抓拍一張人臉后,從海量嫌疑犯人臉數(shù)據(jù)中檢索是否在列。1:N比對(duì)目前的核心應(yīng)用問題是當(dāng)N很大的時(shí)候,需要大量的計(jì)算資源,如騰訊云上萬象優(yōu)圖2.0產(chǎn)品,將N值大限制為10000,當(dāng)N太少的時(shí)候大大限制了應(yīng)用的場景。后N:N相當(dāng)于在人像數(shù)據(jù)庫同時(shí)檢索多張人臉,對(duì)計(jì)算資源的要求更加嚴(yán)苛,往往會(huì)產(chǎn)生很高的錯(cuò)誤率從而影響識(shí)別結(jié)果,目前難以大規(guī)模應(yīng)用。
通過上述介紹我們可以看到,人臉識(shí)別技術(shù)是一項(xiàng)場景性非常強(qiáng)的領(lǐng)域,在不同場景之間,如證照比對(duì)、*排查、有配合的1:1識(shí)別、無配合1:1識(shí)別(即不能要求對(duì)象在攝像頭前站好,攝像頭從隱蔽處抓拍人臉),其應(yīng)用難點(diǎn)與技術(shù)路線有非常大的差別,甚至其核心技術(shù)能力不在于算法本身,而在于對(duì)場景的深耕研究。
所謂的場景深耕,就是緊密圍繞場景需求,以商業(yè)上能接受的代價(jià)(價(jià)格、計(jì)算延遲、維護(hù)性等),針對(duì)場景的特征并大量收集場景數(shù)據(jù),不斷調(diào)試方法或者使用多個(gè)方法的組合,走過一輪輪alpha、beta到zeta的版本號(hào),終實(shí)現(xiàn)產(chǎn)品化,其過程并不是一個(gè)算法打天下這么簡單。
但這里擺在人臉識(shí)別技術(shù)提供商面前的一道難題是,人臉識(shí)別技術(shù)自身并很難構(gòu)成一項(xiàng)單獨(dú)的應(yīng)用,必須與其他業(yè)務(wù)或者產(chǎn)品結(jié)合。比如技術(shù)+攝像頭,成為智能視頻監(jiān)控設(shè)備,或者與傳統(tǒng)支付產(chǎn)品結(jié)合,在密碼/手機(jī)驗(yàn)證碼上再加一層人臉識(shí)別驗(yàn)證,類似還有ATM機(jī)上增加人臉識(shí)別,才能在特定場景中形成具備商用價(jià)值的應(yīng)用。
在上述背景下,人臉識(shí)別技術(shù)提供商與應(yīng)用場景之間,存在一定的距離,它們不得不站在其他產(chǎn)品或商業(yè)模式的后面,導(dǎo)致缺乏對(duì)場景的深入把控,甚至難以獲得升級(jí)技術(shù)賴以為生的場景數(shù)據(jù),而缺乏對(duì)場景的把控,將導(dǎo)致技術(shù)本身難以通過有效的場景深耕而獲得質(zhì)變。終的結(jié)局,有可能就是通過賣License或者賣服務(wù)的模式,提供了效果實(shí)屬一般的算法技術(shù)。
人臉識(shí)別獨(dú)角獸公園:誰在沖刺,誰又在假裝奔跑?
目前,我們看到了人臉識(shí)別技術(shù)供應(yīng)商,紛紛與在安防等領(lǐng)域具備場景縱深的企業(yè)深度合作。如商湯科技與老牌安防上市公司東方網(wǎng)力成立合資公司深網(wǎng)視界,利用雙方優(yōu)勢(shì)推動(dòng)人臉識(shí)別技術(shù)在安防產(chǎn)業(yè)的落地,另外還有云從科技綁定智慧城市上市公司佳都科技,以及依圖科技+傳統(tǒng)身份識(shí)別領(lǐng)域解決方案神思電子的案例,當(dāng)然少不了曠視科技自身的阿里系背景,畢竟單靠技術(shù)算法本身,在缺乏場景深耕的情況下是難以有所作為的。
通過場景+技術(shù)這兩個(gè)視角,觀察人臉識(shí)別獨(dú)角獸公園中各奇珍異獸走向的邏輯就清晰了:、是否具備人臉識(shí)別應(yīng)用場景深耕的稟賦,或者能與具備場景的合作方深度綁定?第二,能否在具體場景中取得商業(yè)化突破,并反映在具體的銷售收入數(shù)據(jù)上?第三,回歸到算法技術(shù),除了CNN等傳統(tǒng)計(jì)算機(jī)視覺技術(shù)外,是否能取得技術(shù)的突破,比如引入人臉3D信息、多特征融合、或者在1:N/N:N上海量人臉比對(duì)場景中更的搜索策略?后這點(diǎn)可反映在各公司發(fā)表的論文主題及質(zhì)量上。
后,我們可以為這篇文章的題目下個(gè)初步的結(jié)論了:通過引入深度學(xué)習(xí)技術(shù),人臉識(shí)別領(lǐng)域近年確實(shí)在算法上取得了突破,以前單單憑借fancy的算法人臉識(shí)別初創(chuàng)公司往往就能拿到不錯(cuò)的投資,但事實(shí)是,人臉識(shí)別的工業(yè)界應(yīng)用遠(yuǎn)未達(dá)到成熟,而更尷尬的是人臉識(shí)別技術(shù)本身難以作為一項(xiàng)獨(dú)立的產(chǎn)品,需要結(jié)合場景去深耕才能獲取到識(shí)別效果和商業(yè)化的突破。在通往奇點(diǎn)的賽道上,人臉識(shí)別或許還有很長一段路程去沖刺,如果將這項(xiàng)奇點(diǎn)賽跑看作接力賽的話,那么人臉識(shí)別團(tuán)隊(duì)的接力棒,才剛從學(xué)術(shù)界轉(zhuǎn)交到工業(yè)界手上,而這一批已經(jīng)獲得了不菲融資的中國本土人臉識(shí)別公司,衷心希望他們充分擁抱場景,奮力奔跑。
當(dāng)然,在這場賽事上還有仍抱著學(xué)術(shù)界思維、以算法刷榜為榮的假裝奔跑者,或許留給他們的時(shí)間已經(jīng)不多了。
原標(biāo)題 人臉識(shí)別,是否將成為AI+時(shí)代臨近的奇點(diǎn)?