【安防展覽網(wǎng) 品牌專欄】AI技術(shù)進入全面滲透、加速創(chuàng)新的新階段,新一代人工智能方興未艾。12月20日,依圖科技CTO顏水成受邀出席“2019新一代人工智能院士高峰論壇”,并發(fā)表主題演講“Transform AI into Affordable Intelligence”。
顏水成博士分享說,只有在高效能的AI模型和高效能的AI芯片綜合驅(qū)動下,“A.I.”才能轉(zhuǎn)換成為“Affordable Intelligence”,讓終用戶買得起、用得好。
依圖科技CTO顏水成博士
“2019新一代人工智能院士高峰論壇”由鵬城實驗室和新一代人工智能產(chǎn)業(yè)技術(shù)創(chuàng)新戰(zhàn)略聯(lián)盟主辦,是國內(nèi)人工智能平臺建設(shè)高水平的精英會,中國工程院院士、鵬城實驗室主任高文,中國科學(xué)院院士、美國科學(xué)院外籍院士蒲慕明等十余位院士現(xiàn)場點評,集中討論AI創(chuàng)新應(yīng)用成果。
作為產(chǎn)業(yè)界代表,顏水成博士與百度CTO、深度學(xué)習(xí)技術(shù)及應(yīng)用國家工程實驗室主任王海峰,騰訊 AI Lab & Robotics X 主任張正友等一同發(fā)表了主題演講,并從算法和算力兩個維度,介紹了依圖提升AI基礎(chǔ)設(shè)施和AI解決方案產(chǎn)業(yè)效能,從而提高人工智能落地廣度和深度的探索。
小明整理了顏水成博士演講要點,與大家共享。
讓AI成為“Affordable Intelligence”
隨著AI不斷往前發(fā)展,越來越多場景中都可以見到人工智能。但是,讓“A.I.”成為“Affordable Intelligence”,還存在很大的挑戰(zhàn)。
AI創(chuàng)業(yè)公司和大廠AI實驗室的核心使命是讓AI真正落地。
要想解鎖一個AI場景,需要兩個維度不同的引擎。其中一個是算法,首先要保證可以用,算法精度足夠高,能夠真正解鎖一個場景,其次要足夠用,如今有很多場景僅憑單模態(tài)的算法已經(jīng)無法提供用戶滿意的解決方案,圖像、語音等相結(jié)合的多模態(tài)AI愈發(fā)關(guān)鍵。
第二個引擎是算力,比如說支撐計算的AI芯片,首先要買得起,并發(fā)性能足夠高,能解析很多路數(shù)的視頻,其次要用得起,使用時功耗足夠低,不然數(shù)據(jù)中心的電費和運維費用會使得用戶承受不起。
所以,真正讓AI在一個場景落地,要從算法、算力兩個維度實現(xiàn)“準(zhǔn)、全、快、省”。
基于模型的Affordable Intelligence
我們來看一些例子,不同場景解鎖的重點是不一樣的,比如同為人臉識別,不同的場景對算法有著不同的要求。
門禁系統(tǒng)要求的精度可能很多公司都能做到,但是對于百萬、千萬甚至上億量級的刷臉支付,中國能提供這種技術(shù)的公司*。
只有不斷提升算法精度,才能真正解鎖這些不同的場景。
此外,在現(xiàn)有基礎(chǔ)上進一步提升,比如一個城市有很多的攝像頭,但當(dāng)我們希望處理百萬量級的攝像頭系統(tǒng)時,將它們合在一起作為群體智能考慮,對解決方案就是大的挑戰(zhàn)。
研究表明,訓(xùn)練和測試人工智能模型所需要的算力,每三個半月就會翻一番,這比摩爾定律已經(jīng)快了很多。今年剛開完的NeurIPS會議,大家都在討論,AI用得越來越多,消耗的電力越來越高,會不會對環(huán)境產(chǎn)生影響?
依圖在高效能的AI模型上一直在不斷探索,也取得了很多突破。近我們和Facebook合作,提出了“八分音符卷積”。我們發(fā)現(xiàn),與圖像類似,F(xiàn)eature Map也會有高頻和低頻之分,對于低頻的部分可以進一步壓縮,以低分辨率的格式保存和處理。
于是我們就讓Feature Map變得異構(gòu)化,設(shè)計相應(yīng)卷積操作,輸出異構(gòu)的Feature Map,模型變得比以前更小。因為僅對低頻部分進行壓縮,信息損失很小,同時這種多尺度結(jié)構(gòu)增加了感受野,模型分類效能可以顯著提高。同時由于模型資源開銷變小,所以同樣的算力可以訓(xùn)練更大的模型。
實際使用非常方便,我們提供了多個示例在 GitHub 上,只要直接使用我們提供的Python包替換即可,無需調(diào)參數(shù),也無需改變網(wǎng)絡(luò)結(jié)構(gòu)。
基于芯片的Affordable Intelligence
依圖在三年前就布局芯片。今年5月,依圖發(fā)布了第一款芯片“求索”(QuestCore™),做視頻全解析,單芯片功耗低于1W。
發(fā)布的時候,我們現(xiàn)場連接了兩百路視頻,做實時的人臉檢測和人臉識別,實現(xiàn)了“發(fā)布即商用”。
為什么依圖設(shè)計出來的芯片有競爭力?因為我們在設(shè)計芯片時想得清楚,要遵循“算法即芯片”原則。當(dāng)我們在設(shè)計這款芯片的時候,我們知道這款芯片典型的使用場景,因此能確保芯片能達到高效能,同時我們能預(yù)測這個領(lǐng)域里前沿算法的發(fā)展趨勢,由此去優(yōu)化芯片的架構(gòu)和工具鏈,從而實現(xiàn)算法和芯片的相互優(yōu)化。
不僅如此,我們也做到芯片和算法分層解耦,確保第三方也能使用依圖的這款芯片去加速他們的算法。
這款芯片發(fā)布后,跟市面上先進的解決方案相比,單路視頻解析功耗能降低到五分之一到十分之一。現(xiàn)在我們提供AI服務(wù)器和邊緣盒子這兩種形式的產(chǎn)品,希望終用戶在使用我們解決方案時,首先數(shù)據(jù)中心的建設(shè)成本足夠低,其次運維費用也能大幅減少。
當(dāng)我們把高效能的AI模型和高效能的AI芯片相融合,就可以打造軟硬一體化的解決方案,解鎖更多的場景,在不同的場景中發(fā)揮價值。比如說智能城市軌交刷臉支付,可以用邊緣盒子滿足對于計算的需求,智能商業(yè)刷臉支付也可以采用邊緣盒子,而對于醫(yī)療場景,比如智慧醫(yī)院進行海量醫(yī)療圖像分析,就可以使用云端AI服務(wù)器。
隨著AI融合進入越來越多的場景,我們不斷追求高精度和高性能,對于算力的要求也越來越高。這時候AI的“Affordable”就會變得越來越重要,而要讓“A.I.”成為“Affordable Intelligence”,高效能的AI模型和高效能AI芯片是推動這一轉(zhuǎn)換的雙引擎,只有這樣才能讓我們終的用戶能夠買得起和用得起。
謝謝大家!