avav588con,最近2019中文免费字幕在线观看,欧美一道本一区二区三区,九九热在线观看,经典好看免费AV

移動版

當(dāng)前位置:智慧城市網(wǎng)資訊中心科技動態(tài)

新發(fā)產(chǎn)品更多
聲音堪比DNA 在AI加持下妙用無限
2019年06月12日 08:45:34來源:智能制造網(wǎng)點擊量:66573
導(dǎo)讀近,一項由美國麻省理工學(xué)院給出的研究表明,經(jīng)過訓(xùn)練的AI不僅能從聲音中獲取人們的性別、種族、年齡等信息,甚至連你長什么樣它都能聽出來!
  【安防展覽網(wǎng) 科技動態(tài)】如果讓你單純聽一個人的聲音,你能聽出哪些信息?年齡?性別?還是家鄉(xiāng)?對于AI來說,這些都太沒難度了。近期,一項由美國麻省理工學(xué)院給出的研究表明,經(jīng)過訓(xùn)練的AI不僅能從聲音中獲取人們的性別、種族、年齡等信息,甚至連你長什么樣它都能聽出來!
 
  據(jù)了解,這一能完成“聽聲辨人”操作的AI,主要依賴一個叫Speech2Face的神經(jīng)網(wǎng)絡(luò)模型來完成訓(xùn)練。該模型分為兩部分,一個是語音編碼器,負(fù)責(zé)對輸入的語音進行面部特征分析和預(yù)測;另一個是面部解碼器,對輸入的面部特征進行整合與生成。
 
  在實際操作中,研究人員通過將一個百萬視頻剪輯而成的數(shù)據(jù)集放入模型,然后讓AI進行一段時間的自我訓(xùn)練,之后只需憑借6秒鐘左右的語音,AI就能實現(xiàn)對人臉特征的采集和還原,并且呈現(xiàn)出效果不錯的圖像。
 
  從MIT研究團隊給出的部分訓(xùn)練成果,我們可以發(fā)現(xiàn):Speech2Face能較好地識別出性別,對白種人和亞洲人也能較好地分辨出來,另外對30-40歲和70歲的年齡段聲音命中率稍微高一些。不過,由于AI的“聽覺”不是100%可靠,并且訓(xùn)練素材不夠豐富,其也會產(chǎn)生不少的識別錯誤,同時對黑人聲音的辨別能力也偏弱。
 
  雖然該技術(shù)還不是很完善,但滿足MIT初的設(shè)想已經(jīng)綽綽有余。研究團隊指出,他們訓(xùn)練AI這項功能并不是為了準(zhǔn)確還原說話者模樣,而只是單純?yōu)榱搜芯空Z音與相貌之間的關(guān)系,并以此來用語音生成各種可愛的卡通用戶頭像。
 
  可能你會覺得這樣一個技術(shù)用作頭像生成有點大材小用,別擔(dān)心!因為其實類似的技術(shù),目前其他研究機構(gòu)也在積極開展中,并且有的已經(jīng)投入到了一些有意義的應(yīng)用場景。
 
  比如卡內(nèi)基梅隆大學(xué)曾發(fā)表過相似的研究,能夠從聲音猜測說話者的年齡、身高、體重、所處空間和環(huán)境信息。該大學(xué)研究人員認(rèn)為聲音就像是人類的DNA一樣,蘊藏著豐富而獨特的信息,在各行各業(yè)中能夠獲得妙用。
 
  他們在該技術(shù)識別和還原準(zhǔn)確度超過60%的時候,開始正式投入社會進行應(yīng)用測試。目前,美國海岸警衛(wèi)隊仍在利用這項技術(shù)來識別惡意報警者,這項技術(shù)幫他們分辨出了報警者是否為惡作劇,同時縮小了調(diào)查的范圍,這讓他們每年減少了近150個惡作劇電話,節(jié)約了大量警力資源。
 
  而據(jù)了解,卡內(nèi)基梅隆大學(xué)的研究團隊終的設(shè)想,是用AI這項“聽音識人”技術(shù)來遠(yuǎn)程確診帕金森等疾病。希望這項技術(shù)能夠打開現(xiàn)代醫(yī)療的創(chuàng)新大門,為疑難雜癥和一些絕癥提供解決思路與辦法。
 
  除了將類似技術(shù)用于刑偵和醫(yī)療之外,現(xiàn)實中,相同的技術(shù)還被應(yīng)用到了銀行、保險、客服、招聘等眾多場景與領(lǐng)域。其中,匯豐、摩根等銀行采用聲紋識別的方式來保障用戶賬戶安全;大都會人手保險公司利用AI系統(tǒng)來識別客戶的情緒與感受;一些保險公司用這項技術(shù)來判斷來電者的意圖;還有一些公司則將該技術(shù)用于招聘......
 
  此外,2017年豐田汽車還曾在CES大會上,將該技術(shù)應(yīng)用到了駕駛當(dāng)中。AI被加載在攝像頭、傳感器、車載語音系統(tǒng)之上,協(xié)助判斷司機是否處于疲勞駕駛狀態(tài),并及時作出提醒。這項技術(shù)讓司機的駕駛有更加了智能化的保障。
 
  總而言之,不管是何種應(yīng)用,AI“聽音辨人”的功能無疑是價值重大的,我們有理由相信,這項技術(shù)終會越來越多的出現(xiàn)在往后的生活與生產(chǎn)之中。不過,AI未來如果想真正成為人們的好幫手和好伙伴,眼下還需要進一步的升級與突破,發(fā)展之路還需期待!
關(guān)鍵詞 聽音辨人AI
相關(guān)閱讀更多
版權(quán)與免責(zé)聲明:

凡本網(wǎng)注明“來源:智慧城市網(wǎng)”的所有作品,均為浙江興旺寶明通網(wǎng)絡(luò)有限公司-智慧城市網(wǎng)合法擁有版權(quán)或有權(quán)使用的作品,未經(jīng)本網(wǎng)授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用上述作品。已經(jīng)本網(wǎng)授權(quán)使用作品的,應(yīng)在授權(quán)范圍內(nèi)使用,并注明“來源:智慧城市網(wǎng)”。違反上述聲明者,本網(wǎng)將追究其相關(guān)法律責(zé)任。

本網(wǎng)轉(zhuǎn)載并注明自其它來源(非智慧城市網(wǎng))的作品,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點或和對其真實性負(fù)責(zé),不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。其他媒體、網(wǎng)站或個人從本網(wǎng)轉(zhuǎn)載時,必須保留本網(wǎng)注明的作品第一來源,并自負(fù)版權(quán)等法律責(zé)任。

如涉及作品內(nèi)容、版權(quán)等問題,請在作品發(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。

正在閱讀:聲音堪比DNA 在AI加持下妙用無限
我要投稿
  • 投稿請發(fā)送郵件至:(郵件標(biāo)題請備注“投稿”)afzhan@foxmail.com
  • 聯(lián)系電話0571-87756384
智慧城市行業(yè)“互聯(lián)網(wǎng)+”服務(wù)平臺
智慧城市網(wǎng)APP

功能豐富 實時交流

智慧城市網(wǎng)小程序

訂閱獲取更多服務(wù)

微信公眾號

關(guān)注我們

抖音

智慧城市網(wǎng)

抖音號:afzhan

打開抖音 搜索頁掃一掃
i

視頻號

AF智慧城市網(wǎng)

視頻號ID:sphF7DOyrojJnp8

打開微信掃碼關(guān)注視頻號

小紅書

智慧城市

小紅書ID:2537047074

打開小紅書 掃一掃關(guān)注
反饋