avav588con,最近2019中文免费字幕在线观看,欧美一道本一区二区三区,九九热在线观看,经典好看免费AV

移動(dòng)版

當(dāng)前位置:智慧城市網(wǎng)資訊中心企業(yè)關(guān)注

新發(fā)產(chǎn)品更多
AI“讀唇術(shù)”再獲突破 準(zhǔn)確度超人類專家
2018年08月07日 08:43:35來源:前瞻網(wǎng)點(diǎn)擊量:36833
導(dǎo)讀數(shù)以千萬計(jì)的聽障人士,催生了龐大的助聽器市場(chǎng)。接下來,AI的發(fā)展可能會(huì)全面摧毀這個(gè)產(chǎn)業(yè),同時(shí)給聽障人士帶來無比的便利性和更加正常的生活。不過,對(duì)于正常人來說,這意味著又多了一個(gè)信息泄露的手段。
  【中國(guó)安防展覽網(wǎng) 企業(yè)關(guān)注】數(shù)以千萬計(jì)的聽障人士,催生了龐大的助聽器市場(chǎng)。接下來,AI的發(fā)展可能會(huì)全面摧毀這個(gè)產(chǎn)業(yè),同時(shí)給聽障人士帶來無比的便利性和更加正常的生活。不過,對(duì)于正常人來說,這意味著又多了一個(gè)信息泄露的手段。
 
  對(duì)于聽障人士來說,讀唇無疑是優(yōu)于手語和助聽器的交流方式,既不會(huì)阻隔和正常人的交流(手語就不行),也不會(huì)給生活帶來太大不便(助聽器就不行)。的缺點(diǎn)就是,讀唇術(shù)太難學(xué),而且誤差也很大。幸運(yùn)的是,AI就是專門用來解決這種問題的。
 
  現(xiàn)在,研究人員正在報(bào)告一個(gè)新的人工智能程序,它比專業(yè)的唇讀本和的人工智能程序要好得多,它的錯(cuò)誤率只有以前佳算法的一半。如果完善并集成到智能設(shè)備中,這種方法可以讓每個(gè)人都能讀懂唇語。
 
  根據(jù)《Science》網(wǎng)站上的一篇文章,國(guó)外科研人員開發(fā)出了一個(gè)新的AI讀唇程序,比現(xiàn)有的無論是專業(yè)人員還是AI程序,效率和性都高得多,它的錯(cuò)誤率較現(xiàn)有佳算法下降了50%。試想,若將這種程序和未來的智能設(shè)備,比如AI眼鏡相結(jié)合,聽障人士的日常交流即可暢通無阻。倫敦瑪麗皇后大學(xué)計(jì)算機(jī)科學(xué)家貝兒(Helen Bear)驚嘆:“這是一項(xiàng)了不起的杰作!”
 
  毫無疑問,讓人類自己學(xué)會(huì)唇語,然后編寫成計(jì)算機(jī)代碼,巨大的工作量并非人力所能完成的。在這種情況下,機(jī)器學(xué)習(xí)再次發(fā)揮了作用??茖W(xué)家們只需在系統(tǒng)內(nèi)存入數(shù)千小時(shí)的視頻和錄音,計(jì)算機(jī)就能自己解決問題。
 
  因此,研究人員從YouTube下載了14萬小時(shí)的視頻,囊括了人們?cè)诟鞣N各樣情境下的交談內(nèi)容。隨后,他們編寫程序,用以細(xì)致標(biāo)注不同的口腔運(yùn)動(dòng)、讀音。隨后,這個(gè)程序自動(dòng)過濾掉了非英語的語音、未說話人員、低質(zhì)量的視頻內(nèi)容和非直接拍攝的內(nèi)容。然后,他們將剩余長(zhǎng)達(dá)近4000小時(shí)、包括超過12.7萬個(gè)英語單詞的片段保留了下來。
 
  哥倫比亞大學(xué)計(jì)算機(jī)科學(xué)家阿克巴里(Hassan Akbari)評(píng)論稱,這個(gè)過程,以及由此產(chǎn)生的數(shù)據(jù)集——比當(dāng)前大的同類數(shù)據(jù)集大7倍——對(duì)于任何開發(fā)類似讀唇系統(tǒng)來的人來說,都是“重要而價(jià)值連城”的。
 
  在接下來的開發(fā)過程中,近年來逐漸成熟的神經(jīng)網(wǎng)絡(luò)系統(tǒng)扮演了重要角色。對(duì)于一些簡(jiǎn)單的計(jì)算元素,這種模仿人類神經(jīng)系統(tǒng)建立的計(jì)算系統(tǒng),可以地“思考”和“學(xué)習(xí)”。而經(jīng)過剪輯和歸類的視頻片段,就是這種簡(jiǎn)單的計(jì)算元素。
 
  如前文所說,當(dāng)研究小組給程序輸入未標(biāo)注的視頻時(shí),程序會(huì)自動(dòng)篩選出一些口腔運(yùn)動(dòng)片段。而神經(jīng)網(wǎng)絡(luò)提取了這些片段后,可以計(jì)算每個(gè)視頻幀可能的音素和它們的概率,后利用可能的音素序列生成英語單詞序列。這個(gè)就是AI的“學(xué)習(xí)”過程。
 
  研究人員曾對(duì)新AI程序進(jìn)行過37分鐘的測(cè)試。據(jù)他們提交給arXiv網(wǎng)站的一篇文章,在一段陌生的對(duì)話視頻中,AI正確識(shí)別了41%的唇語內(nèi)容。這看起來不多,但卻是目前的佳成績(jī)。在同一項(xiàng)研究中,專業(yè)唇讀者出錯(cuò)率為93%(在現(xiàn)實(shí)生活中,有語境和肢體語言的情況下,準(zhǔn)確率會(huì)大大提高)。
 
  目前,對(duì)已經(jīng)學(xué)習(xí)的內(nèi)容,AI程序已經(jīng)掌控到非常精細(xì)的程度,例如,它可以通過發(fā)出“t”時(shí)的不同唇形,判斷整個(gè)詞是“boot”還是“beet”,這對(duì)于提高準(zhǔn)確性大有幫助。
 
  貝兒表示,除了為聽障人士解決交流難題,解讀歷*,甚至可以解開世界大的謎題之一:在2006年的*決賽中,齊達(dá)內(nèi)在聽到馬特拉齊說的話后,憤怒地用一記頭槌撞向馬特拉齊胸口,導(dǎo)致自己被罰下場(chǎng)。而馬特拉齊到底說了什么?現(xiàn)在仍是個(gè)謎。
 
  這種技術(shù)還能用在分析安全視頻,甚至可能成為特工裝備??梢钥隙ǖ氖?,對(duì)于那些看重隱私的人來說,這種技術(shù)就是噩夢(mèng)般的存在。那種走在街上,隨便說什么都會(huì)被攝像頭捕捉到的感覺,也許會(huì)讓他們很不好受。
 
  原標(biāo)題:聾人福音or隱私殺手?AI“讀唇術(shù)”再獲突破 準(zhǔn)確度超人類專家
 
 
關(guān)鍵詞 安防語音識(shí)別
相關(guān)閱讀更多
版權(quán)與免責(zé)聲明:

凡本網(wǎng)注明“來源:智慧城市網(wǎng)”的所有作品,均為浙江興旺寶明通網(wǎng)絡(luò)有限公司-智慧城市網(wǎng)合法擁有版權(quán)或有權(quán)使用的作品,未經(jīng)本網(wǎng)授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用上述作品。已經(jīng)本網(wǎng)授權(quán)使用作品的,應(yīng)在授權(quán)范圍內(nèi)使用,并注明“來源:智慧城市網(wǎng)”。違反上述聲明者,本網(wǎng)將追究其相關(guān)法律責(zé)任。

本網(wǎng)轉(zhuǎn)載并注明自其它來源(非智慧城市網(wǎng))的作品,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)或和對(duì)其真實(shí)性負(fù)責(zé),不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。其他媒體、網(wǎng)站或個(gè)人從本網(wǎng)轉(zhuǎn)載時(shí),必須保留本網(wǎng)注明的作品第一來源,并自負(fù)版權(quán)等法律責(zé)任。

如涉及作品內(nèi)容、版權(quán)等問題,請(qǐng)?jiān)谧髌钒l(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。

正在閱讀: AI“讀唇術(shù)”再獲突破 準(zhǔn)確度超人類專家
我要投稿
  • 投稿請(qǐng)發(fā)送郵件至:(郵件標(biāo)題請(qǐng)備注“投稿”)afzhan@foxmail.com
  • 聯(lián)系電話0571-87756384
智慧城市行業(yè)“互聯(lián)網(wǎng)+”服務(wù)平臺(tái)
智慧城市網(wǎng)APP

功能豐富 實(shí)時(shí)交流

智慧城市網(wǎng)小程序

訂閱獲取更多服務(wù)

微信公眾號(hào)

關(guān)注我們

抖音

智慧城市網(wǎng)

抖音號(hào):afzhan

打開抖音 搜索頁(yè)掃一掃
i

視頻號(hào)

AF智慧城市網(wǎng)

視頻號(hào)ID:sphF7DOyrojJnp8

打開微信掃碼關(guān)注視頻號(hào)

小紅書

智慧城市

小紅書ID:2537047074

打開小紅書 掃一掃關(guān)注
反饋