天天躁夜夜躁狠狠躁2021a2,亚洲区综合区小说区激情区,国产亚洲精品美女在线

今日熱點更多

精彩視頻更多

“向新出發(fā) 智造未來”itc邀請您來當(dāng)云廠長

虹卓軟件智慧餐廳、智慧運維等方案
2025-06-24
申哲智慧停車與防爆門禁系列展示
2025-06-20

推薦展會更多

2026中國(上海)機器視覺展

熱搜話題更多

#新時代黃金賽道低空經(jīng)濟發(fā)展正當(dāng)時

#我國部署建設(shè)10個國家數(shù)據(jù)要素綜合試驗區(qū)

#2025年中國教育裝備展示會

新發(fā)產(chǎn)品更多

陽臺儲能MID電表
安科瑞電氣股份有限公司
￥525
水上運動救生衣
東臺市港輝船舶設(shè)備有限公司
面議
德國ME K3A100 20kN/60kN型壓力傳感器
北京漢達森機械技術(shù)有限公司
￥6288
儲能系統(tǒng)諧波監(jiān)測三相電表
安科瑞電氣股份有限公司
￥1736
手持式激光測云儀
山東天合環(huán)境科技有限公司
￥188000
景區(qū)出入口閘機
深圳市遠(yuǎn)韜智能設(shè)備有限公司
面議

新發(fā)現(xiàn)！人工智能系統(tǒng)可對多場景聲音進行識別

2016年06月17日 14:13:16來源：元器件交易網(wǎng)點擊量：14692

導(dǎo)讀人工智能已經(jīng)突破了一項聲音障礙。麻省理工學(xué)院（MIT）的研究人員開發(fā)了一款人工智能系統(tǒng)，可以“觀看”無聲的視頻并且生成一段聲音，效果十分逼真，以至于多數(shù)觀眾無法分辨出這些聲音是否是計算機生成的。

　　【中國安防展覽網(wǎng) 新聞】人工智能已經(jīng)突破了一項聲音障礙。麻省理工學(xué)院（MIT）的研究人員開發(fā)了一款人工智能系統(tǒng)，可以“觀看”無聲的視頻并且生成一段聲音，效果十分逼真，以至于多數(shù)觀眾無法分辨出這些聲音是否是計算機生成的。
　　
　　MIT計算機科學(xué)和人工智能實驗室（MIT Computer Science and Artificial Intelligence Laboratory）稱，其“深度學(xué)習(xí)算法”是頭一個通過“聲音圖靈測試”的，生成的聲音能夠以假亂真。
　　
　　這款視覺指示聲音系統(tǒng)（Visually Indicated Sounds，簡稱Vis）受到訓(xùn)練，能夠?qū)髯訐舸?、刮擦或者捅一系列物體（從樹葉、水到土壤和鋼鐵）時發(fā)出的聲音進行分析。
　　
　　研究人員稱，Vis的本領(lǐng)可以延伸至很多其他場景。例如，未來的版本可以為電影和電視生成比傳統(tǒng)方法（比如在鋁箔上撒鹽以模擬雨聲）更逼真的聲音效果。
　　
　　該項目的負(fù)責(zé)人安德魯·歐文斯（Andrew Owens）稱，更重要的應(yīng)用或許是幫助機器人理解物體的物理屬性、更好地與它們所在的環(huán)境互動。該項目將于本月晚些時候在拉斯維加斯舉行的計算機視覺與模式識別大會（CVPR）上展出。
　　
　　“機器人可以看著人行道、本能地知道水泥地是硬的而草地是軟的，因此知道如果它踩上兩種地面會發(fā)生什么，”他說，“能夠預(yù)測聲音，是預(yù)測與世界進行物理互動的后果的重要步。”
　　
　　該MIT團隊“訓(xùn)練”Vis的方法是，向其輸入包含4.6萬種聲音的1000段視頻，這些聲音是鼓槌在不同堅實度的物體上敲打或劃過而產(chǎn)生的。之后，幫計算機在大量數(shù)據(jù)中找到模式的“深度學(xué)習(xí)”算法對這些聲音進行解構(gòu)。
　　
　　為了從無聲視頻片斷中預(yù)測一種新聲音，Vis會查看可能與每個視頻畫面相關(guān)的音頻屬性，并把這些音頻串在一起編輯成連貫的聲音。Vis可以模擬快節(jié)奏和舒緩的微妙聲音，無論是斷斷續(xù)續(xù)拍打巖石的聲音，還是穿過常春藤時發(fā)出的細(xì)小沙沙聲。它既可以模擬擊打墊子發(fā)出的低沉砰砰聲，又可以模擬敲擊欄桿時發(fā)出的刺耳聲音。
　　
　　為了測試這些聲音在人耳聽起來的逼真性，研究人員對400名觀眾進行了調(diào)查。他們觀看了兩遍視頻，其中一遍聽的是真實聲音，另一遍聽的是Vis的模擬版。他們要說出哪一次是真實的聲音。
　　
　　如果Vis生成的聲音與真實的聲音無法區(qū)分，Vis版被選擇的概率應(yīng)為50%。結(jié)果調(diào)查得出的概率為40%，這是一個相當(dāng)不錯的分?jǐn)?shù)。
　　
　　當(dāng)聲音清晰、尖銳時——比如敲木頭或金屬的聲音——該系統(tǒng)的表現(xiàn)差，在生成由樹葉或泥土產(chǎn)生的較輕柔、持續(xù)時間較長的聲音時，Vis表現(xiàn)好。有時，如果棍子剛好停在目標(biāo)物之前，它還會“幻想出”假的敲擊聲。
　　
　　歐文斯的夢想是在沒有明確視覺線索的情況下讓Vis模擬聲音。“從微風(fēng)輕撫、到筆記本電腦的嗡嗡作響，任何時候環(huán)境中都存在著許多與我們正盯著看的東西無關(guān)的聲音，”他說。

關(guān)鍵詞識別生物識別人工智能

谷歌為企業(yè)客戶推出人工智能數(shù)字化助手Spring board

傳感器：“聽見你的聲音” 讓冰川無所遁形

相關(guān)閱讀更多

《人臉識別技術(shù)應(yīng)用安全管理辦法》正式實施：從技術(shù)狂歡到理性治理的數(shù)字權(quán)利革命
《人臉識別技術(shù)應(yīng)用安全管理辦法》經(jīng)2024年9月30日國家互聯(lián)網(wǎng)信息辦公室2024年第23次室務(wù)會會議審議通過，并經(jīng)公安部同意，自...
人臉識別生物識別
2025-06-03
2025年6月1日開始施行重要新規(guī)一覽
6月即將到來，一個端午小長假等待著您，同時又有一些新規(guī)將實施。哪些與你我有關(guān)，我們的生活又將迎來怎樣的變化，小編帶你一探究竟！
新規(guī)生物識別
2025-05-30
專家解讀｜國家網(wǎng)絡(luò)身份認(rèn)證公共服務(wù)筑牢數(shù)字安全屏障
近期，公安部第一研究所于銳研究員關(guān)于國家網(wǎng)絡(luò)身份認(rèn)證公共服務(wù)進行了專題宣講，以下是文字實錄：
數(shù)字安全生物識別
2025-05-27
數(shù)字化時代的制度之困：當(dāng)技術(shù)便利成為弱勢群體的隱形門檻
在數(shù)字化高歌猛進的時代，我們的制度設(shè)計正在系統(tǒng)性地將老年人、殘障人士等弱勢群體推向社會的邊緣。技術(shù)本應(yīng)帶來普惠，卻在執(zhí)行中異化為新...
人臉識別生物識別
2025-05-16
世界讀書日：數(shù)字墨香無紙化閱讀進校園
據(jù)《2023全球數(shù)字閱讀報告》顯示，全球數(shù)字閱讀用戶已突破15億，中國數(shù)字閱讀市場規(guī)模達到592億元，同比增長11.4%。
無紙化閱讀生物識別
2025-04-23
不刷臉行不行？人臉識別新規(guī)將落地
近年來，人臉識別技術(shù)以“無感通行”“一鍵核驗”等便利性迅速滲透至社區(qū)門禁、商場消費、酒店入住等場景。
人臉識別生物識別
2025-03-27

版權(quán)與免責(zé)聲明：

凡本網(wǎng)注明“來源：智慧城市網(wǎng)”的所有作品，均為浙江興旺寶明通網(wǎng)絡(luò)有限公司-智慧城市網(wǎng)合法擁有版權(quán)或有權(quán)使用的作品，未經(jīng)本網(wǎng)授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用上述作品。已經(jīng)本網(wǎng)授權(quán)使用作品的，應(yīng)在授權(quán)范圍內(nèi)使用，并注明“來源：智慧城市網(wǎng)”。違反上述聲明者，本網(wǎng)將追究其相關(guān)法律責(zé)任。

本網(wǎng)轉(zhuǎn)載并注明自其它來源（非智慧城市網(wǎng)）的作品，目的在于傳遞更多信息，并不代表本網(wǎng)贊同其觀點或和對其真實性負(fù)責(zé)，不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。其他媒體、網(wǎng)站或個人從本網(wǎng)轉(zhuǎn)載時，必須保留本網(wǎng)注明的作品第一來源，并自負(fù)版權(quán)等法律責(zé)任。

如涉及作品內(nèi)容、版權(quán)等問題，請在作品發(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系，否則視為放棄相關(guān)權(quán)利。

avav588con,最近2019中文免费字幕在线观看,欧美一道本一区二区三区,九九热在线观看,经典好看免费AV