【
中國安防展覽網(wǎng) 企業(yè)關(guān)注】在近期舉行的 Google Cloud Next 大會(huì)上,Google Cloud 人工智能與機(jī)器學(xué)習(xí)科學(xué)家 李飛飛公布了一種新技術(shù),該技術(shù)基于 Google 新的 視頻智能 API(Video Intelligence API)。Google 進(jìn)行了現(xiàn)場演示,首先播放了一段商業(yè)廣告片段,系統(tǒng)正確地識(shí)別出廣告中出現(xiàn)的臘腸犬,后正確判斷出這是一段廣告視頻。在另一個(gè)演示中,輸入「海灘」,系統(tǒng)便列出了所有包含海灘場景的視頻。視頻智能 API可以對(duì)視頻進(jìn)行完整分析(到每一幀),記錄每一個(gè)場景,以及每個(gè)場景出現(xiàn)的物體,這有助于幫助如視頻編輯類似職位的人員快速找到想要的視頻素材。在以往,如果沒有給視頻進(jìn)行人工標(biāo)記,系統(tǒng)是無法分辨視頻中的事物的,Google 的這些演示不禁讓人感到驚訝。
谷歌新科技 未來可對(duì)視頻進(jìn)行識(shí)別
據(jù)報(bào)道,視頻識(shí)別依然是一個(gè)新技術(shù)。目前許多互聯(lián)網(wǎng)公司無法識(shí)別視頻內(nèi)容,要求用戶在上傳時(shí)提供諸多的標(biāo)簽,從而利用標(biāo)簽作為搜索依據(jù)。未來,和圖片文件的標(biāo)簽一樣,視頻的標(biāo)簽將成為一種落后技術(shù)。李飛飛表示,通過視頻識(shí)別技術(shù),“我們將開始給數(shù)字星空中一個(gè)黑暗的物質(zhì)照亮光芒。”過去,谷歌已經(jīng)把許多機(jī)器學(xué)習(xí)的技術(shù)及時(shí)變成了軟件開發(fā)接口,讓應(yīng)用到自己的軟件產(chǎn)品中。據(jù)悉,谷歌也正在把上述的視頻內(nèi)容識(shí)別變成接口,對(duì)外開放。
視頻識(shí)別將具有重大的應(yīng)用場景,比如在安全、打擊恐怖主義等領(lǐng)域,政府或者警方可以對(duì)視頻畫面進(jìn)行實(shí)時(shí)的監(jiān)控和分析,快速抓捕*。
另外,寬帶的發(fā)展已經(jīng)讓互聯(lián)網(wǎng)進(jìn)入了網(wǎng)絡(luò)視頻時(shí)代,短視頻、視頻直播等新應(yīng)用不斷出現(xiàn),但是與此同時(shí),視頻搜索的長期落后,成為行業(yè)的一個(gè)短板。不少消費(fèi)者已經(jīng)發(fā)現(xiàn),在一些搜索引擎的視頻搜索服務(wù)中,出現(xiàn)了準(zhǔn)確率太低的現(xiàn)象,主要原因是搜索企業(yè)對(duì)于視頻內(nèi)容完全無法識(shí)別,他們只能根據(jù)視頻周邊的文字內(nèi)容、視頻標(biāo)題等附加信息進(jìn)行搜索,這導(dǎo)致差錯(cuò)率大大提高,也影響了用戶發(fā)現(xiàn)更多精彩的視頻內(nèi)容。
值得一提的是,在人工智能、機(jī)器學(xué)習(xí)和圖像識(shí)別方面,谷歌和Facebook展開了一場軍備競賽。在去年的一次開發(fā)大會(huì)上,F(xiàn)acebook相關(guān)團(tuán)隊(duì)負(fù)責(zé)人也曾經(jīng)表示,F(xiàn)acebook已經(jīng)具備了成熟的圖像識(shí)別技術(shù),目前正在進(jìn)行視頻識(shí)別的研究,希望能夠盡早識(shí)別出視頻中的人臉,方便搜索好友之間發(fā)送的大量視頻。
在中國方面,人工智能的進(jìn)程也在加速,今年兩會(huì)的政府工作報(bào)告明確提出,加快培育壯大新興產(chǎn)業(yè),全面實(shí)施戰(zhàn)略性新興產(chǎn)業(yè)發(fā)展規(guī)劃,加快新材料、人工智能、集成電路、生物制藥、第五代移動(dòng)通信等技術(shù)研發(fā)和轉(zhuǎn)化,做大做強(qiáng)產(chǎn)業(yè)集群。
這是“人工智能”被寫入政府工作報(bào)告。這表明國家對(duì)新興產(chǎn)業(yè)的重視,將人工智能提高到促進(jìn)經(jīng)濟(jì)發(fā)展的新高度,而資本市場的表現(xiàn)則反映了投資人對(duì)人工智能的看好。
另外,在2月3日,《紐約時(shí)報(bào)》發(fā)表了一篇名為《China Gains on the U.S in the Artificial Intelligence Arms Race》的文章,該標(biāo)題可以翻譯為“中國在人工智能的軍備競賽上正在趕超美國”,文中對(duì)中美科技公司以及政府政策等諸多環(huán)境進(jìn)行了對(duì)比,其中各項(xiàng)數(shù)據(jù)指標(biāo)顯示,中國的人工智能實(shí)力正在一定程度上超過美國。根據(jù)此前美國白宮發(fā)布的報(bào)告顯示,從2014年開始,在深度學(xué)習(xí)領(lǐng)域(目前人工智能的主要進(jìn)展),論文發(fā)表數(shù)量和被引用的次數(shù)兩個(gè)標(biāo)準(zhǔn)上,中國均已超過美國。高盛在2016年12月發(fā)布的一份有關(guān)人工智能的報(bào)告中也提及“人工智能的前沿重要參與者可能會(huì)繼續(xù)來自于美國和中國”。
1.深度學(xué)習(xí)的反超
深度學(xué)習(xí)從各國每年發(fā)表的“深度學(xué)習(xí)”及“深度神經(jīng)網(wǎng)絡(luò)”相關(guān)主題論文數(shù)量,中國在近五年內(nèi)的學(xué)術(shù)論文呈現(xiàn)出趕超之勢,而在2014年次超越了美國,進(jìn)入到位置。此外,2014年谷歌科學(xué)家、深度學(xué)習(xí)領(lǐng)域?qū)<覅嵌鬟_(dá)加入到百度,也從側(cè)面說明了中國人工智能發(fā)展的潛力。而2017年前微軟執(zhí)行副總裁陸奇也宣布加入百度,同樣也是看到了中國人工智能的巨大機(jī)會(huì)。2016年微軟聲稱其開發(fā)的某套軟件,語義理解已經(jīng)達(dá)到人類水平,而來自百度硅谷實(shí)驗(yàn)室的AI專家表示,他們在兩年前就完成了具有同樣技術(shù)水平的中文軟件。
2.語音技術(shù)普及
在去年2016年的百度Deep Speech2深度語音識(shí)別技術(shù),被《麻省理工評(píng)論》列為突破性技術(shù)之一,與生物技術(shù)、航天技術(shù)、納米技術(shù)并列,也是一家入選的中國公司。在去年的百度語音開放平臺(tái)三周年上,百度加大了在語音開放的力度,向開放了情感合成、遠(yuǎn)場方案、喚醒二期技術(shù)和長語音方案技術(shù)。
除了百度和科大訊飛之外,國內(nèi)還有云之聲、出門問問、搜狗語音、思必馳等諸多公司群雄逐鹿,競爭猛烈程度遠(yuǎn)超美國,也正說明了中國有著更大的市場需求,激烈競爭之下也必將催生出更的語音技術(shù)。
再反觀美國,語音技術(shù)的競爭遠(yuǎn)遠(yuǎn)不如國內(nèi)激烈,在開放平臺(tái)方面只有微軟與Nuance比較積極以外,其他巨頭都有些意興闌珊,例如谷歌直到去年的云計(jì)算大會(huì)上,才向第三方提供了語音開放API,而IBM viaVoice雖然在2003年就入場,但是目前則早已退出。
3.政策吸引力更大
2017年正式當(dāng)選美國總統(tǒng),也為各行業(yè)帶來了巨大的不確定性,而對(duì)科技界的影響也尤為巨大,早先就一直要求蘋果公司將工廠搬回國內(nèi),另一方面也在加強(qiáng)人口的流動(dòng)限制。此前頒布的“穆斯林禁令”要求90天內(nèi)停止向*7國發(fā)放簽證,這引發(fā)整個(gè)科技圈的集體不滿。對(duì)于其他科技企業(yè)來說,該種舉措也會(huì)影響到其人才引進(jìn),而日后如果繼續(xù)加強(qiáng)該政策,那么還會(huì)影響人才穩(wěn)定。
但反觀國內(nèi),政府與科技公司的關(guān)系向來較好,科技公司經(jīng)常協(xié)助政府完成各種政務(wù)工作,例如微博問政、微信問政,大數(shù)據(jù)交通規(guī)劃等等,在一定程度上不斷減輕政府工作負(fù)擔(dān),因此“互聯(lián)網(wǎng)+”的鼓勵(lì)政策也會(huì)應(yīng)運(yùn)而生。
同時(shí)我國也更為歡迎技術(shù)人才的引進(jìn),近幾年很多硅谷技術(shù)人才,尤其是華人工程師們,都開始紛紛來到機(jī)會(huì)更大的國內(nèi)發(fā)展,吳恩達(dá)、陸奇這兩位華人人工智能領(lǐng)域的人物加盟百度,則有著標(biāo)志性意義,未來階段更多人工智能領(lǐng)域華人回歸國內(nèi),也是大概率事件。