【
中國(guó)安防展覽網(wǎng) 視點(diǎn)跟蹤】 百度這兩年年在人工智能能上是下足了功夫,無(wú)人車(chē)、百度大腦、百度人工智能機(jī)器人都昭示了百度強(qiáng)大的技術(shù)力量,霸滿(mǎn)了新聞?lì)^條。人們?cè)隗@嘆的同時(shí)也在好奇,百度下一步打算做什么?
林元慶:百度在人臉識(shí)別上走的是技術(shù)路線(xiàn)
2月21日,《麻省理工科技評(píng)論》公布了2017年度突破技術(shù),其中的“刷臉支付”一項(xiàng),代表公司主要為百度等以中國(guó)為主要市場(chǎng)的公司。在參加完MIT科技評(píng)論年度突破技術(shù)中國(guó)發(fā)布會(huì)現(xiàn)場(chǎng)演講后,百度深度學(xué)習(xí)實(shí)驗(yàn)室(IDL)主任林元慶接受了采訪。
林元慶透露,百度人臉識(shí)別技術(shù)在2016年取得“突破性(進(jìn)展)”,百度花了很多力量在研發(fā)和推廣該技術(shù)。在林元慶看來(lái),百度人工智能機(jī)器人在《強(qiáng)大腦》圖像識(shí)別環(huán)節(jié)3:2戰(zhàn)勝人類(lèi),“是一個(gè)標(biāo)志性事件。”
“百度進(jìn)入人臉識(shí)別行業(yè),走的是技術(shù)路線(xiàn)”
“人臉識(shí)別技術(shù),就算在一些的情況下,百度都能做得很。”林元慶稱(chēng)。人臉識(shí)別是圖像識(shí)別的一種。百度圖像技術(shù)是基于深度學(xué)習(xí)算法,可以智能識(shí)別圖像中的文字內(nèi)容和含義、分析人臉圖像以及檢測(cè)圖片色情度的人工智能技術(shù)。百度圖像技術(shù)分為文字識(shí)別、人臉識(shí)別、黃反識(shí)別等。
林元慶一直在強(qiáng)調(diào)技術(shù)的重要性,“百度進(jìn)入人臉識(shí)別行業(yè),走的是技術(shù)路線(xiàn)。”作為百度圖像識(shí)別的核心技術(shù),百度人臉識(shí)別可以實(shí)現(xiàn)人臉檢測(cè)、人臉對(duì)比、人臉查找,并已應(yīng)用于百度魔圖、百度網(wǎng)盤(pán)、百度識(shí)圖等產(chǎn)品中。
以在百度內(nèi)部測(cè)試的人臉識(shí)別閘機(jī)為例,其基于深度神經(jīng)網(wǎng)絡(luò)機(jī)器學(xué)習(xí)算法對(duì)檢測(cè)到的多個(gè)人臉面部特征點(diǎn)進(jìn)行學(xué)習(xí)、識(shí)別。整個(gè)項(xiàng)目貫穿了研發(fā)、硬件、技術(shù)支持、深度學(xué)習(xí)實(shí)驗(yàn)室、AI平臺(tái)部、流程信息管理部以及內(nèi)部溝通部等部門(mén)。
與一些做人臉識(shí)別的初創(chuàng)公司相比,百度在人臉識(shí)別技術(shù)上優(yōu)勢(shì)明顯。除了有吳恩達(dá)、林元慶等業(yè)界技術(shù)“坐鎮(zhèn)”,還與其在計(jì)算、數(shù)據(jù)、算法上的投入和積累密不可分。據(jù)介紹,百度已布設(shè)數(shù)十萬(wàn)臺(tái)服務(wù)器,研發(fā)的超級(jí)計(jì)算機(jī)Minwa,相當(dāng)于2個(gè)天河一號(hào)。在數(shù)據(jù)方面,百度全網(wǎng)已存儲(chǔ)萬(wàn)億網(wǎng)頁(yè)EB級(jí)數(shù)據(jù)。在算法上,百度已達(dá)到大規(guī)模的DNN,支持萬(wàn)億參數(shù)、千億樣本、千億特征訓(xùn)練。
此外,百度人臉識(shí)別技術(shù)將和百度的其他人工智能技術(shù)協(xié)同起來(lái),形成多模塊的保障。“人工智能在自動(dòng)駕駛、金融產(chǎn)品等方面的應(yīng)用,人臉識(shí)別只是其中一個(gè)模塊,百度還會(huì)增加大數(shù)據(jù)等多模塊的保障。并且需要每個(gè)方面都做得特別好。”林元慶表示“人工智能很多技術(shù),做一套系統(tǒng)很容易,但是要做一套很多人都在用的系統(tǒng),是有非常高的技術(shù)門(mén)檻的。”
“1:N人臉識(shí)別技術(shù),百度是行業(yè)*。”林元慶表示。林元慶不避諱百度人臉識(shí)別技術(shù)在研發(fā)過(guò)程中的缺陷。林元慶介紹,百度大廈的人臉識(shí)別閘機(jī),大約在半年前開(kāi)始布局,“剛開(kāi)始問(wèn)題挺多,識(shí)別的精度,光線(xiàn)的影響,還發(fā)生了不是百度的人也放進(jìn)去的情況。”林元慶接著表示,“我們一直在調(diào)系統(tǒng),現(xiàn)在,百度的免工卡刷臉通行閘機(jī)系統(tǒng)基本上能夠做到把非百度公司的人拒之門(mén)外。”
在林元慶看來(lái),身份認(rèn)證的高境界就是不用認(rèn)證,“人就直接走。”百度科學(xué)家吳恩達(dá)此前表示,目前核心的人工智能技術(shù)就是圖像技術(shù),因?yàn)樾枰褂脠D像技術(shù)來(lái)理解這張圖里面的內(nèi)容到底是什么,也需要用圖像技術(shù)來(lái)做視覺(jué)定位,才可以實(shí)時(shí)把虛擬技術(shù)放進(jìn)去,如果有人臉也可以做虛擬內(nèi)容。
百度方面宣稱(chēng),目前,百度人臉識(shí)別準(zhǔn)確率達(dá)99.7%,在人臉識(shí)別技術(shù)兩個(gè)為的評(píng)測(cè)——FDDB與LFW中已經(jīng)獲得了雙料世界。
百度人臉識(shí)別商業(yè)化
林元慶坦承,百度人臉識(shí)別技術(shù)在商業(yè)化方面“有點(diǎn)滯后”。
在場(chǎng)景應(yīng)用上,林元慶透露,百度在2016年主要將人臉識(shí)別技術(shù)應(yīng)用到百度內(nèi)部上線(xiàn)的“免工卡刷臉通行閘機(jī)”,以及游客通過(guò)“刷臉”在烏鎮(zhèn)景區(qū)各處閘機(jī)處通行(游客需要在入園時(shí)提供*掃描并錄入一張實(shí)時(shí)拍攝照片)。此外,百度還與泰康人壽達(dá)成合作,將人臉識(shí)別技術(shù)用于微信投保的回執(zhí)和回訪環(huán)節(jié),在線(xiàn)校驗(yàn)客戶(hù)身份。
林元慶透露,2017年,至少會(huì)有100個(gè)4A、級(jí)旅游景區(qū)啟用百度人臉識(shí)別系統(tǒng)。如果說(shuō)2016年是百度人臉識(shí)別技術(shù)取得“突破性進(jìn)展”的一年,那2017年將會(huì)是它的落地之年。
林元慶透露,目前,百度已經(jīng)在內(nèi)部確定了人臉識(shí)別技術(shù)的四大落地方向:1,閘機(jī)。百度希望將“刷臉通行閘機(jī)”落地到景區(qū),以及大企業(yè)和大型寫(xiě)字樓里;2,交通。目前,百度在非常積極地尋求和火車(chē)站、機(jī)場(chǎng)達(dá)成合作;3,金融。長(zhǎng)遠(yuǎn)來(lái)看,金融方面是百度人臉識(shí)別重要的應(yīng)用方向;4,手機(jī)。“百度和國(guó)內(nèi)幾大手機(jī)廠商在談人臉識(shí)別技術(shù)上的合作。希望有一天能夠像指紋一樣代替鍵盤(pán)。”
在百度視之為人臉識(shí)別重要應(yīng)用方向的金融領(lǐng)域,百度借助大數(shù)據(jù)+人工智能技術(shù),百度風(fēng)控部門(mén)已經(jīng)為有信貸需求的群體繪制用戶(hù)畫(huà)像,建立信用體系,加上圖像識(shí)別等人工智能技術(shù)的實(shí)際應(yīng)用,構(gòu)成了遠(yuǎn)程授信的技術(shù)基礎(chǔ)。
“百度非常喜歡有一定門(mén)檻的技術(shù),百度在(這樣的技術(shù))方面能做出好的應(yīng)用。”林元慶表示。林元慶透露,百度人臉識(shí)別技術(shù)主要由IDL主導(dǎo)。“公司沒(méi)給我們定硬性指標(biāo)。我們是有KPI的,但會(huì)更聚焦過(guò)程。會(huì)定收入目標(biāo),但現(xiàn)在很多技術(shù)都還處于探索階段,定多、定少都不合適。”林元慶透露。
林元慶一再?gòu)?qiáng)調(diào),百度在人臉識(shí)別技術(shù)上奉行技術(shù)為先的策略,因此其商業(yè)落地的案例不多。
2017年春節(jié)前夕,“票證人自助核驗(yàn)閘機(jī)”(“刷臉檢票”系統(tǒng))“火”了一把,該系統(tǒng)在北京、上海、廣州、深圳等多地大型火車(chē)站投入使用。日本電氣股份有限公司(NEC)是該刷臉進(jìn)站系統(tǒng)的研發(fā)方之一。林元慶稱(chēng),“鐵路相關(guān)部門(mén)沒(méi)有來(lái)找百度,百度也沒(méi)有去找過(guò)他們。”
林元慶透露,《強(qiáng)大腦》節(jié)目組一開(kāi)始也不知道百度在研發(fā)人臉識(shí)別技術(shù),還透露有美國(guó)、歐洲的公司就人臉識(shí)別技術(shù)在與百度積極接觸,希望百度人臉識(shí)別技術(shù)能夠應(yīng)用到他們的產(chǎn)品中。“特別是幾家美國(guó)公司,我們覺(jué)得挺不錯(cuò)的,他們?cè)緫?yīng)該是找谷歌的。”林元慶稱(chēng)。
軟硬件結(jié)合
除了商業(yè)化,百度人臉識(shí)別技術(shù)還在做軟硬件結(jié)合的嘗試。
林元慶透露,進(jìn)景區(qū)的閘機(jī),百度也需要在硬件上一體化的維度來(lái)做優(yōu)化。在解決景區(qū)下午過(guò)曬的陽(yáng)光影響攝像頭工作的問(wèn)題,百度也在考慮能否開(kāi)發(fā)出來(lái)足夠好的攝像頭,把主要的曝光集中在人臉上。“現(xiàn)在,人工智能技術(shù)很多要落地的話(huà),很多的系統(tǒng)都需要考慮軟硬結(jié)合,把性能給真正地發(fā)揮出來(lái)。”林元慶表示。
林元慶進(jìn)一步表示,百度原來(lái)覺(jué)得不需要做硬件,也盡量不做硬件。現(xiàn)在,百度挺強(qiáng)調(diào)軟件結(jié)合。“因?yàn)檫@也是應(yīng)用驅(qū)動(dòng)的,我們也不是一成不變的。”林元慶說(shuō)。
百度在硬件制作上已經(jīng)開(kāi)始行動(dòng)了。其中的一個(gè)例子是,2月16日,百度宣布全資收購(gòu)渡鴉科技有限責(zé)任公司,創(chuàng)始人呂騁攜團(tuán)隊(duì)正式加盟百度,并出任百度智能家居硬件總經(jīng)理。
除了計(jì)算、數(shù)據(jù)、算法方面的優(yōu)勢(shì),百度人臉識(shí)別有其獨(dú)到的研發(fā)策略。
林元慶介紹說(shuō),人臉識(shí)別技術(shù)方面,形成閉環(huán)是非常重要的。算一個(gè)數(shù)據(jù),研發(fā)步的技術(shù),做代的產(chǎn)品,產(chǎn)品到給用戶(hù),用戶(hù)產(chǎn)生數(shù)據(jù),數(shù)據(jù)回來(lái)進(jìn)一步提高技術(shù),獲得更多的數(shù)據(jù)、更好的算法。“算法并非一成不變,很多時(shí)候算法和技術(shù)是一起發(fā)展的。這才是非常好的正循環(huán)。”林元慶告訴澎湃新聞。
建立人臉識(shí)別技術(shù)閉環(huán)的重要性不僅于此。林元慶表示,一旦建立人臉識(shí)別技術(shù)的閉環(huán),對(duì)收集數(shù)據(jù)等各方面都將有極大的助力。林元慶還介紹,搜索數(shù)據(jù)非常重要,搜索到數(shù)據(jù)之后,還要分類(lèi)、打標(biāo)簽,“能告訴你是這個(gè)人還是別的人。”
林元慶進(jìn)一步表示,算法的強(qiáng)弱取決于兩點(diǎn),一是要去設(shè)計(jì)比較好的計(jì)算方法。在深度學(xué)習(xí)里面,要設(shè)計(jì)位置、連線(xiàn)等,以此反映出深度學(xué)習(xí)的一些架構(gòu)。二是要有足夠多的數(shù)據(jù),以及能把這個(gè)算法“訓(xùn)練”出來(lái)的好項(xiàng)目。
林元慶還表示,百度人臉識(shí)別的應(yīng)用會(huì)聚焦在互聯(lián)網(wǎng)相關(guān)的方向上,“這是我們的競(jìng)爭(zhēng)優(yōu)勢(shì)所在。安防等領(lǐng)域可能也會(huì)涉及,但應(yīng)該會(huì)非常少。”
林元慶透露,百度在人臉識(shí)別上的“野心”不止于閘機(jī)、交通、金融、手機(jī)四大落地方向,它還將與百度地圖、圖片識(shí)別、大數(shù)據(jù)、百度糯米等打包起來(lái),更貼身地服務(wù)用戶(hù),以實(shí)現(xiàn)百度董事長(zhǎng)兼執(zhí)行官李彥宏在2017年新春內(nèi)部講話(huà)中提出的“連接服務(wù)”的目標(biāo)。
此外,百度人臉識(shí)別計(jì)劃還將在百度內(nèi)容分發(fā)上大有“作為”。“內(nèi)容分發(fā)是一個(gè)非常重要的領(lǐng)域,我們是一定要贏的。”林元慶稱(chēng)。林元慶還提到,人臉識(shí)別技術(shù)不一定會(huì)應(yīng)用到百度醫(yī)療中。但他透露百度正在搭建一個(gè)“非常強(qiáng)大”的醫(yī)療圖像分析團(tuán)隊(duì)。
百度方面也坦言,人臉識(shí)別技術(shù)研究的困難,不同于普通的圖像識(shí)別。就人的臉部特征而言,每個(gè)人的臉部結(jié)構(gòu)都是相似的,這對(duì)于利用人臉區(qū)分人類(lèi)個(gè)體不利,還有一些特殊情況,比如雙胞胎甚至多胞胎。其次就是表情、光照條件、整容等外因影響。不同的表情、角度觀察,光照條件的影響,人臉遮蓋物,如口罩、墨鏡、頭發(fā)、胡須,甚至是整容、P圖等行為,都增加了人臉識(shí)別的難度。
在回答記者提出的“陸奇將怎樣影響百度的人工智能戰(zhàn)略”的問(wèn)題時(shí),林元慶表示,陸奇的執(zhí)行力非常強(qiáng),作為人工智能專(zhuān)家,陸奇非常想知道具體的技術(shù),甚至在算法級(jí)別。林元慶透露,他已經(jīng)和陸奇深度溝通過(guò)幾次,“每次和陸總開(kāi)完會(huì),他總是會(huì)要求我給他發(fā)幾篇論文。”
“現(xiàn)在,百度在執(zhí)行力方面會(huì)非常強(qiáng)。這是我們特別需要的。”林元慶補(bǔ)充道。在2月21日公布的MIT科技評(píng)論年度突破技術(shù)榜單中,百度也進(jìn)入“強(qiáng)化學(xué)習(xí)(ReinforcementLearning)”、“自動(dòng)駕駛貨車(chē)(Self-DrivingTrucks)”兩項(xiàng)技術(shù)的主要公司名單。