avav588con,最近2019中文免费字幕在线观看,欧美一道本一区二区三区,九九热在线观看,经典好看免费AV

移動版

當前位置:智慧城市網(wǎng)資訊中心企業(yè)關(guān)注

新發(fā)產(chǎn)品更多
計算機視覺已橫跨感知與認知智能
2018年01月04日 10:15:00來源:艾瑞咨詢點擊量:35386
導讀2017年下半年,數(shù)家計算機視覺公司單筆融資上億美元,再次將計算機視覺推向人工智能領(lǐng)域受關(guān)注的方向之一。
  【中國安防展覽網(wǎng) 企業(yè)關(guān)注】2017年下半年,數(shù)家計算機視覺公司單筆融資上億美元,再次將計算機視覺推向人工智能領(lǐng)域受關(guān)注的方向之一。
 
  一、計算機視覺技術(shù)概述
 
  計算機視覺橫跨感知與認知智能,現(xiàn)階段應用以感知為主
 
  視覺使人類得以感知和理解周邊的世界,人的大腦皮層大約有70%的活動在處理視覺相關(guān)信息。計算機視覺即通過電子化的方式來感知和理解影像,以達到甚至超越人類視覺智能的效果。從1966年學科建立(MIT:The SummerVision Project)至今,盡管計算機視覺在感知與認知智能方向仍有大量難以解決、尚待探索的問題,但得益于深度學習算法的成熟應用(2012年,采用深度學習架構(gòu)的AlexNet模型,以超越第二名10個百分點的成績在ImageNet競賽中奪冠),側(cè)重于感知智能的圖像分類技術(shù)在工業(yè)界逐步實現(xiàn)商用價值,助力金融、安防、互聯(lián)網(wǎng)、手機、醫(yī)療、工業(yè)等領(lǐng)域智能升級。
 
  現(xiàn)階段有較好商業(yè)化進展的主要為語義感知中的分類任務
 
  與人類實時選擇性處理視覺信息不同(如人在駕駛時不需在意公路邊草地的紋理或形狀,也不用知道每輛車的確切形狀),計算機仍難以從實際需求出發(fā)自主選擇性輸入并計算影像信息,通常需要人類對具體任務進行分解并使用與之匹配的計算方法,建立完整理想的智能視覺系統(tǒng)仍有很大挑戰(zhàn)。另外,與可結(jié)合常識做猜想和推理進而輔助識別的人類智能系統(tǒng)相比,現(xiàn)階段的視覺技術(shù)往往僅能利用影像表層信息,缺乏常識以及對事物功能、因果、動機等深層信息的認知把握。
 
  數(shù)據(jù)與算力是深度學習的重要支撐
 
  日益豐富的影像內(nèi)容為深度學習算法提供了大量的數(shù)據(jù)支撐。據(jù)思科公司評估,2021年單月上傳至網(wǎng)絡的視頻總時長將超過500萬年,每秒將誕生1百萬分鐘的網(wǎng)絡視頻內(nèi)容,網(wǎng)絡視頻流量將占據(jù)所有網(wǎng)絡用戶流量的81.44%。需要說明的是,現(xiàn)在的學習多為有監(jiān)督學習(需要對數(shù)據(jù)進行充分標注),而且并非所有類型的影像數(shù)據(jù)都易得易標注(比如醫(yī)療影像數(shù)據(jù)需由專業(yè)醫(yī)師標注病灶),業(yè)界的視覺公司一般會有數(shù)百人的標注團隊(多為外包,但需專業(yè)培訓,實時指導)。另一方面,深度學習學習過程中的“訓練”與應用部署后的“推斷”均涉及大量并行計算,傳統(tǒng)CPU算力不足,而GPU、FPGA (現(xiàn)場可編程門陣列) 、ASIC (TPU、NPU等AI專屬架構(gòu)芯片)等具有良好并行計算能力的芯片可提供數(shù)十倍乃至于上百倍于CPU的性能,與云服務一起,大幅縮短計算過程(在過去,往往數(shù)周甚至數(shù)月才能跑出一次結(jié)果,然后調(diào)整模型架構(gòu),效率極低),易于短期調(diào)整多種模型架構(gòu),顯著提升分類模型的進步速度。2010年以后,CPU內(nèi)部晶體管數(shù)量的增長明顯放緩,傳統(tǒng)摩爾定律失效,而GPU類處理器依然保持著快速增長的勢頭(2016年GPU的計算力為10個TFLOP/S ,2017年達到了120個TFLOP/S ,TPU則實現(xiàn)了驚人的180個TFLOP/S ),驗證著AI時代的摩爾定律。
 
  開源環(huán)境僅降低計算機視覺領(lǐng)域的入門技術(shù)門檻
 
  工業(yè)界和學術(shù)界先后推出了用于深度學習模型訓練的開源工具和框架,包括Caffe、Theano、Torch、MXNet、TensorFlow、PaddlePaddle、CNTK等等,極大降低了人工智能技術(shù)在工業(yè)實踐中的入門門檻。盡管不同框架各有所長,但它們并不能真正滿足企業(yè)在處理實際復雜業(yè)務時所面對的挑戰(zhàn),性能、顯存支持、生態(tài)系統(tǒng)完善性、使用效率等不同層面的不足要求企業(yè)需要針對性的調(diào)整框架以適合自身業(yè)務所需。而在數(shù)據(jù)處理、計算集群管理、網(wǎng)絡設計、應用端性能優(yōu)化等若干重要環(huán)節(jié)都存在各種各樣非開源技術(shù)或已成熟方案所能解決,極度依賴相關(guān)技術(shù)專家去探索求解的重要問題。對于前沿算法的突破創(chuàng)新以及算法在不同使用環(huán)境中的優(yōu)化升級,不同公司的技術(shù)高低差異依然很大。
 
  計算機視覺比賽的意義在于推動算法思想的進步
 
  2007年由李飛飛教授發(fā)起的ImageNet計劃將人工智能領(lǐng)域的影像數(shù)據(jù)推向了的規(guī)模,至今已有1400萬張經(jīng)過人工清洗標注的圖片,含有2萬個分類,為計算機視覺領(lǐng)域做出巨大貢獻。自2010年每年一度的ImageNet物體識別競賽(對1000類接近50萬張圖片的單標簽識別),更是成為了計算機視覺領(lǐng)域受關(guān)注的比賽。2017年,ImageNet舉行了后一屆圖像分類競賽,Top 5的錯誤率降至2.25%(大幅人眼),該競賽完成了歷史使命,而更多的關(guān)于圖像語義分割(像素級的分類問題)、1:N人臉識別、圖像及視頻理解(看圖寫話)方向的數(shù)據(jù)集與比賽將逐步登上舞臺,推動更多領(lǐng)域更貼近真實世界場景的算法革新。
 
  二、計算機視覺行業(yè)概況
 
  計算機視覺行業(yè)圖譜
 
  中國計算機視覺行業(yè)市場規(guī)模
 
  2016年下半年,1:N人臉識別、視頻結(jié)構(gòu)化等計算機視覺相關(guān)技術(shù)在安防領(lǐng)域的實戰(zhàn)場景中突破工業(yè)化紅線,敲響了計算機視覺行業(yè)市場大規(guī)模爆發(fā)的前奏。伴隨人臉識別、物體識別等分類、分割算法不算提升精度,在2017年占比較高的安防、視頻廣告、泛金融、手機及互聯(lián)網(wǎng)娛樂領(lǐng)域之外,醫(yī)療影像、工業(yè)制造、批發(fā)零售等現(xiàn)階段的創(chuàng)新領(lǐng)域也將逐步解鎖,成為行業(yè)整體快速發(fā)展的重要支撐。
 
  前端智能的滲透率將逐步提升,與后端協(xié)同智能計算
 
  伴隨AI專用芯片及嵌入式感知系統(tǒng)的成熟研發(fā),前端設備即可完成相對基礎(chǔ)的視覺感知,并將識別、分類的結(jié)果實時應用,實現(xiàn)前端智能。對于需要大量計算、存儲資源,利用多維度數(shù)據(jù)關(guān)聯(lián)分析的諸多場景,后端服務器計算依然是當前主流。前端智能的滲透率將逐步提升,與后端智能協(xié)同加速產(chǎn)業(yè)升級,不僅可滿足特定場景對實時性、隱私性的要求,還可在前端成像(千萬像素、千幀/秒)提供越來越多數(shù)據(jù)信息的背景下,讓前端智能選擇預處理過的結(jié)構(gòu)化的高質(zhì)量數(shù)據(jù)及分析結(jié)果傳輸至后端,減少因帶寬壓力過大導致的丟包、壓縮所引起的信息丟失或誤差,提升智能分析的準確性。
 
  前端智能系統(tǒng)的功耗、穩(wěn)定性、存儲空間、數(shù)據(jù)及系統(tǒng)更新的網(wǎng)絡傳輸?shù)戎T多重要問題仍有待解決,現(xiàn)階段主要通過壓縮算法模型、挖掘硬件潛力以及在壓縮模型的同時針對現(xiàn)有芯片進行優(yōu)化的方式來解決功耗有限、運算能力低的問題。
 
  三、計算機視覺的應用場景
 
  1、安防影像分析領(lǐng)域
 
  主要應用場景之人臉識別
 
  對道路卡口、車站、地鐵站、機場等地方的監(jiān)控視頻進行智能分析,檢測出動態(tài)視頻中的人臉與黑名單庫中的影像記錄做實時比對,比對成功則立即報警推送給警務人員處置。
 
  主要應用場景之視頻結(jié)構(gòu)化
 
  2012年南京“1.6”案件發(fā)生后,南京警方從全市1萬多個攝像頭共提取了近2000T的視頻數(shù)據(jù),調(diào)動1500多名公安干警查閱搜索視頻線索,共耗時一個多月。海量視頻的有效利用存在巨大挑戰(zhàn),完全依靠人工費時費力,而安防影像智能分析則可有效緩解這一問題。視頻結(jié)構(gòu)化可針對已經(jīng)生成的海量視頻內(nèi)容進行自動化處理,提供行人、機動車、非機動車等關(guān)鍵目標的監(jiān)測、跟蹤、屬性分析,輔以以圖搜圖等檢索功能,讓案件偵辦和治安布控更加智能便捷。
 
  安防行業(yè)的千億市場為視覺智能改造提供充分空間
 
  2016年中國安防行業(yè)總產(chǎn)值為5410億,占據(jù)2016年中國GDP的7‰,其中1900億屬于安防產(chǎn)品產(chǎn)值。從產(chǎn)品結(jié)構(gòu)角度,安防產(chǎn)品可劃分為視頻監(jiān)控、防盜報警、出入口控制等,安防影像的智能分析屬于視頻監(jiān)控產(chǎn)品的升級改造,是各地區(qū)平安城市項目建設中的重要組成。2011年至2016年中國安防市場連續(xù)5年保持2位數(shù)增長,結(jié)合國家政府對建設更高水平的平安中國、進一步提升人民安全性的要求,未來中國的安防市場依然會保持穩(wěn)定增長,對人工智能、計算機視覺技術(shù)的升級改造也提出了更高的期待。
 
  智能安防相關(guān)產(chǎn)業(yè)鏈條分析
 
  計算機視覺技術(shù)供應商在提供智能安防影像分析的時候,可能面對監(jiān)控設備及平臺軟件廠商、集成商、公安等三大類客戶。在終的使用者公安以外,其他三類參與者關(guān)系復雜,各自的業(yè)務定位都在發(fā)展變化,合作間有競爭。
 
  2、泛金融身份認證領(lǐng)域
 
  主要應用場景及相關(guān)影像采集設備
 
  與安防影像分析中人臉的“1:N”識別不同,目前泛金融領(lǐng)域以人臉“1:1”身份認證為主,部分場景涉及“1:N”識別,如銀行網(wǎng)點中對VIP客戶的智能識別。
 
  刷臉認證的優(yōu)勢與功效
 
  3、手機及互聯(lián)網(wǎng)娛樂領(lǐng)域
 
  為消費級產(chǎn)品帶來全新智能體驗
 
  計算機視覺技術(shù)的成熟進步為同質(zhì)化的手機產(chǎn)品及互聯(lián)網(wǎng)娛樂應用帶來了新的活力。2017年諸多國內(nèi)外手機廠商推出了具有刷臉解鎖的旗艦機型,而手機與影像相關(guān)的拍照優(yōu)化、相冊分類、編輯處理等也于近幾年得以智能升級。人臉識別、特征點定位以及場景識別、物體識別等技術(shù)也豐富了直播、短視頻等互聯(lián)網(wǎng)應用的娛樂性,同時為影像內(nèi)容的智能審核及分類做出貢獻。
 
  4、商品識別領(lǐng)域
 
  拓寬信息邊界,連接人與商品
 
  鍵入關(guān)鍵詞,搜索引擎可連接人與信息,大幅提升人類獲取信息、搜集知識的效率,為世界創(chuàng)造巨大價值。計算機視覺則將信息的邊界再度拓寬,縮短設計、原料采購、生產(chǎn)制造、線上與線下零售等各個環(huán)節(jié)的人與商品的距離,為商品供應鏈帶來效能提升。
 
  5、工業(yè)制造領(lǐng)域
 
  產(chǎn)品質(zhì)檢及3D分揀
 
  伴隨年輕人從事重復性體力勞動的意愿降低,相關(guān)領(lǐng)域的勞動力成本極速上升,工廠對智能自動化設備的需求日益凸顯,為計算機視覺技術(shù)在工業(yè)制造領(lǐng)域的研發(fā)落地提供了市場基礎(chǔ)。產(chǎn)品(尤其3C產(chǎn)品)質(zhì)檢是現(xiàn)有視覺技術(shù)有望在未來3-5年在工業(yè)制造領(lǐng)域大規(guī)模落地的應用場景,目前產(chǎn)品質(zhì)檢依然依靠大量人力做肉眼判斷,效率低、成本高、漏檢誤檢嚴重,而深度學習算法可支持多種缺陷類型,增量學習也能不斷提升產(chǎn)品適用性。另外,工業(yè)場景中存在大量的沖壓件、組合件等不規(guī)則物體,不規(guī)則物體的分揀(無序抓取并有序放置,涉及物體識別、姿態(tài)估計、尺寸測量、運動規(guī)劃等)需借助3D視覺技術(shù),即使技術(shù)相對的國外產(chǎn)商相關(guān)產(chǎn)品也不足夠成熟,出現(xiàn)問題難以即時相應(往往郵件溝通,售后服務難以保障),給予目前尚處于產(chǎn)品研發(fā)測試階段的國內(nèi)新興廠商反超機會。
 
  6、廣告營銷領(lǐng)域
 
  智能挖掘影像內(nèi)容廣告位,構(gòu)建新型營銷模式
 
  計算機視覺技術(shù)可在長視頻、短視頻等點播平臺、直播平臺以及利用手機攝像頭的AR應用中,為廣告主提供多種形式的互動化、與內(nèi)容強相關(guān)的場景廣告。
 
  7、醫(yī)療影像分析領(lǐng)域
 
  智能醫(yī)療影像分析對病種的要求及重要指標
 
  相比計算機視覺在其他領(lǐng)域的數(shù)據(jù)標注工作,醫(yī)療影像的標注門檻較高,需由專業(yè)醫(yī)師標注,而且非典型病例的標注意見較難統(tǒng)一。標注工作之外,醫(yī)療影像分析對數(shù)字化程度、數(shù)據(jù)量、臨床路徑、對應檢測量都有著苛刻的要求,不同病種的情況不同,難以一概而論。另外,對具體系統(tǒng)分析能力的考核,不能僅依據(jù)簡單的準確率,特異性與敏感性是基本的兩個指標。
 
  8、自動駕駛領(lǐng)域
 
  自動駕駛技術(shù)剖析
 
  自動駕駛系統(tǒng)主要涉及傳感器融合、感知、高精地圖、定位、規(guī)劃及控制等若干技術(shù)環(huán)節(jié),以解決“我在哪兒,周圍有什么,環(huán)境將發(fā)生什么變化以及我該怎么做“等四個問題,計算機視覺則在環(huán)境感知(周圍有什么)與地圖繪制(我在哪兒)中發(fā)揮重要作用。
 
  從起步到落地,自動駕駛?cè)孕杞?jīng)歷長期測試
 
  自動駕駛汽車主要由車輛本身、內(nèi)部硬件(傳感器、計算機等)以及用于做出駕駛決策的自動駕駛軟件等三個子系統(tǒng)組成。車輛本身需由OEM認證;內(nèi)部硬件也需在各種條件下充分測試其穩(wěn)定性,達到車規(guī)級要求;自動駕駛軟件方面,相關(guān)系統(tǒng)需經(jīng)過百億甚至千億公里以上的測試來充分驗證其安全性(人類司機平均每1億公里發(fā)生致命事故1~3起,自動駕駛技術(shù)要想大規(guī)模落地應用,必須優(yōu)于人類司機的安全性)。與此同時,大規(guī)模路測也是收集相關(guān)場景數(shù)據(jù)以便改進感知、決策等智能技術(shù)的必要手段。然而,100萬輛10萬公里總里程/年的車輛行駛1年才能達到千億公里的數(shù)據(jù)量級(Waymo在過去8年積累350萬英里以上的自動駕駛數(shù)據(jù)),仿真環(huán)境下的虛擬路測(如今每天有多達25000輛虛擬的Waymo無人車在模擬器中駕駛高達八百萬英里的里程)與不涉及實際控制的影子模式可作為常規(guī)測試的補充,有效降低路測成本。
 
  自動駕駛,起步于限定場景
 
  數(shù)據(jù)驅(qū)動的感知及決策算法難以應對開放、動態(tài)的環(huán)境的千變?nèi)f化,自動駕駛車輛如何理解人類意圖、如何與人工駕駛車輛的司機溝通交互也面對巨大挑戰(zhàn)。在清晰簡單的限定場景中,規(guī)則易總結(jié),數(shù)據(jù)易收集,相關(guān)算法就越容易達到安全性要求。因此,相比開放環(huán)境下大眾乘車出行的一般場景,自動駕駛技術(shù)將先在高速貨運、低速擺渡、特定生產(chǎn)等場景落地應用。大眾出行領(lǐng)域,自動駕駛也會逐步在特定速度限制下(時速60公里內(nèi)的L3級自動駕駛汽車已有量產(chǎn)),停車場,乃至高速或環(huán)線等相對簡單的封閉道路中替代人類駕駛。另外在自動駕駛實現(xiàn)以前,視覺監(jiān)控系統(tǒng)也可對車內(nèi)駕駛員進行疲勞檢測、注意力檢測和手勢識別等,為L3級自動駕駛?cè)藱C控制權(quán)的交接提供支撐,兼顧安全、駕駛輔助和車內(nèi)互動娛樂。
 
  智能出行公司為大眾帶來無人駕駛出行體驗
 
  美國交通部和美國高速公路安全管理局( NHTSA)在今年9月份發(fā)布《自動駕駛制度方針 2.0》,預計將在2025之后實現(xiàn)全面自動的安全功能以及高速公路的自動駕駛。國內(nèi)科技公司相對樂觀,紛紛發(fā)聲將在2021年前后實現(xiàn)僅在特殊情況需人類介入的L4級自動駕駛乘用車的量產(chǎn)。考慮到現(xiàn)有算法技術(shù)的能力邊界,2021年其實難以實現(xiàn)通用場景的L4級自動駕駛,小概率的意外缺陷都有可能引發(fā)致命事故,但2021年成為創(chuàng)業(yè)者*的時候,它將促進“預言的自我實現(xiàn)”,技術(shù)的突破性進展及不斷拓寬的行駛場景依然值得期待。
 
  自動駕駛的到來需要在汽車中裝配大量的軟硬件設備,共享出行可減輕自動駕駛在推進消費市場時的阻礙,由出行服務商評測系統(tǒng)安全性,承擔并消化成本。智能化與共享化是汽車產(chǎn)業(yè)生態(tài)的重要發(fā)展趨勢,車企、科技公司、出行服務商間(三方均已布局自動駕駛研發(fā))的合作結(jié)盟也會愈發(fā)頻繁,智能出行公司隨之誕生。
 
  四、計算機視覺行業(yè)發(fā)展趨勢
 
  不斷提升限定場景識別準確率,優(yōu)化性能滲透更多行業(yè)應用
 
  雖然愿景道阻且長,但分類任務的日益已解鎖并將不斷解鎖更多場景應用。如同過去5年計算機視覺技術(shù)在人臉識別上的不斷突破,誤報率從2015年的千分之一提升至2017年的十億分之一(在通過率為90%的情況下),商業(yè)服務、城市安全、大眾娛樂等諸多場景均體會到不同層次的智能升級,商品、道路環(huán)境、醫(yī)療影像、遙感影像等更多對象的識別、分類問題也將會逐步突破工業(yè)化紅線,從僅做輔助補充的非關(guān)鍵性應用拓展到切實提升核心業(yè)務效率的關(guān)鍵性應用。各行各業(yè)的創(chuàng)新型智能應用將紛至沓來,而人臉識別的性能亦將繼續(xù)攀升,追求百億、千億規(guī)模上的可行性。
 
  前沿算法之外,商業(yè)壁壘有賴于產(chǎn)品、服務、市場等綜合建設
 
  對于更為廣泛的傳統(tǒng)行業(yè)或線下使用場景的潛在客戶,計算機視覺的技術(shù)落地往往涉及對具體業(yè)務場景的硬件設備改造、軟件集成以及本地計算設施的部署,算法、技術(shù)的實際功效更需要建立在對客戶真實業(yè)務場景的深層理解之上的針對性開發(fā)。不斷增長的市場需求要求更加全面、及時的售前、售中、售后服務,而在對視覺技術(shù)能夠達到的有效幫助缺乏足夠認知或部分暫時缺乏科學完善的評測標準或技術(shù)相對同化的業(yè)務場景,市場銷售的重要性尤為凸顯。既要注重前沿算法研發(fā),又要注意現(xiàn)階段商業(yè)落地與市場拓展,這些都為以高新技術(shù)人才為主的計算機視覺公司提出了更為綜合的挑戰(zhàn)。(原標題:2017年中國計算機視覺行業(yè)研究報告)
關(guān)鍵詞 視覺深度學習
相關(guān)閱讀更多
版權(quán)與免責聲明:

凡本網(wǎng)注明“來源:智慧城市網(wǎng)”的所有作品,均為浙江興旺寶明通網(wǎng)絡有限公司-智慧城市網(wǎng)合法擁有版權(quán)或有權(quán)使用的作品,未經(jīng)本網(wǎng)授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用上述作品。已經(jīng)本網(wǎng)授權(quán)使用作品的,應在授權(quán)范圍內(nèi)使用,并注明“來源:智慧城市網(wǎng)”。違反上述聲明者,本網(wǎng)將追究其相關(guān)法律責任。

本網(wǎng)轉(zhuǎn)載并注明自其它來源(非智慧城市網(wǎng))的作品,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點或和對其真實性負責,不承擔此類作品侵權(quán)行為的直接責任及連帶責任。其他媒體、網(wǎng)站或個人從本網(wǎng)轉(zhuǎn)載時,必須保留本網(wǎng)注明的作品第一來源,并自負版權(quán)等法律責任。

如涉及作品內(nèi)容、版權(quán)等問題,請在作品發(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。

正在閱讀:計算機視覺已橫跨感知與認知智能
我要投稿
  • 投稿請發(fā)送郵件至:(郵件標題請備注“投稿”)afzhan@foxmail.com
  • 聯(lián)系電話0571-87756384
智慧城市行業(yè)“互聯(lián)網(wǎng)+”服務平臺
智慧城市網(wǎng)APP

功能豐富 實時交流

智慧城市網(wǎng)小程序

訂閱獲取更多服務

微信公眾號

關(guān)注我們

抖音

智慧城市網(wǎng)

抖音號:afzhan

打開抖音 搜索頁掃一掃
i

視頻號

AF智慧城市網(wǎng)

視頻號ID:sphF7DOyrojJnp8

打開微信掃碼關(guān)注視頻號

小紅書

智慧城市

小紅書ID:2537047074

打開小紅書 掃一掃關(guān)注
反饋