【
中國安防展覽網(wǎng) 科技動態(tài) 】 數(shù)碼工具會讓越來越多的人都有能力進(jìn)行偽造。過不了多久,所有人都可以通過人工智能對一張圖片或是對視頻進(jìn)行復(fù)雜的處理。
Smile Vector 是一個(gè)推特機(jī)器人,可以生成任何明星照片微笑的動圖,如果輸入一張人臉圖片,它可以通過深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)生成它們微笑的表情。雖然這些圖片也許并不,但它們完全是自動生成的,這是人工智能在圖像處理領(lǐng)域的又一進(jìn)步。也許不久之后,圖片、聲音和視頻造假都將變得容易。想象一下,假如新版本的 Photoshop 可以像用 Word 編輯文字一樣輕松編輯圖片,你還會相信自己的眼睛嗎?
這將是一個(gè)技術(shù)上的飛躍?!肝曳浅4_定這將是一個(gè)技術(shù)上的飛躍,」Smile Vector 的,Victoria 大學(xué)設(shè)計(jì)學(xué)院講師 Tom White 說到?!高@不僅意味著我們具有修改圖像的能力,更意味著它簡便易行,適用于所有人?!筗hite 將它的作品比作對現(xiàn)實(shí)世界的「*」,意在宣示人工智能的技術(shù)能力?!肝矣X得現(xiàn)在科技圈以外的人還不知道機(jī)器學(xué)習(xí)能夠做什么,你可以想象一下如果我們在 Instagram 中加入這樣一個(gè)濾鏡,你只需選擇『大笑』或者『微笑』,圖片瞬間就處理好了,所有人在自己的手機(jī)上都可以這樣做?!?br />
Smile Vector 只是新技術(shù)的冰山一角,我們很難對現(xiàn)代人工智能多媒體處理技術(shù)做出全面的概述,但我們能夠找出其中一些有意思的應(yīng)用。例如:從一張 2D 圖片中創(chuàng)建 3D 面部模型;使用人類「模型」實(shí)時(shí)改變視頻中人物的面部表情;改變圖片中的光源和陰影;為無聲視頻自動生成聲音;在總統(tǒng)選舉直播中讓變成禿頭;用視頻剪輯「復(fù)活」朋友等等。這些事例只是其中的一小部分。
「這一領(lǐng)域正在迅速發(fā)展,」Wyoming 大學(xué)的計(jì)算機(jī)科學(xué)教授 Jeff Clune 說道?!该總€(gè)月我都會看到新的產(chǎn)品出現(xiàn)?!笴lune 的研究并不包含修改圖像,而是直接生成圖像。他和他的團(tuán)隊(duì)從 2015 年開始通過對象識別訓(xùn)練神經(jīng)網(wǎng)絡(luò)。這項(xiàng)研究源自于 2005 年 Quian Quiroga 等人的一項(xiàng)神經(jīng)學(xué)研究,他們確定了當(dāng)面對某些圖像時(shí)人類大腦中產(chǎn)生興奮的神經(jīng)元,并教導(dǎo)整個(gè)網(wǎng)絡(luò)產(chǎn)生大化這種刺激的圖像。
在2015年,他們生成的圖像是這樣:
到了2016年,他們的研究有了很大進(jìn)展:
為了生成這些圖片,需要在此類圖片的數(shù)據(jù)庫上訓(xùn)練神經(jīng)網(wǎng)絡(luò)。一旦它學(xué)習(xí)了足夠的螞蟻、紅腳鷸和火山的圖像,它可以根據(jù)命令生成自己的版本。當(dāng)前的兩個(gè)瓶頸是圖像分辨率(這些圖片都不大于 256×256),還有搜集足夠數(shù)量標(biāo)記過的圖片來訓(xùn)練神經(jīng)網(wǎng)絡(luò)。Clune 表示:「我們當(dāng)前遭遇的挑戰(zhàn)不在于模型本身,而是缺乏更高分辨率的數(shù)據(jù)集,需要多長時(shí)間才能生成出真實(shí)的全高清圖像?我們無從得知,不過它應(yīng)該只需要幾年,而不是幾十年」
當(dāng)這些技術(shù)完善之后,它們將會很快的流行起來?!革L(fēng)格轉(zhuǎn)換」就是一個(gè)很好的例子,這個(gè) APP 應(yīng)用神經(jīng)網(wǎng)絡(luò)把一張圖片的風(fēng)格應(yīng)用于另外一張圖片上。這個(gè)方向的一篇重要論文是在 2015 年 9 月份發(fā)表的,隨后,論文的研究者在 2016 年一月份把他們的研究做成了一個(gè)開源的網(wǎng)絡(luò)應(yīng)用。6 月,一家俄羅斯初創(chuàng)公司開創(chuàng)性地改善了這些代碼,做出了手機(jī) app——Prisma,這個(gè)應(yīng)用讓所有人都可以在手機(jī)上制作不同藝術(shù)風(fēng)格的照片,然后將制作的照片分享到社交網(wǎng)絡(luò)中。Prisma 瞬間成為社交網(wǎng)絡(luò)的寵兒,今年 11 月,F(xiàn)acebook 發(fā)布了自己版本的風(fēng)格轉(zhuǎn)換應(yīng)用,在 Prisma 基礎(chǔ)上增添了一些新功能。不到一年時(shí)間,這個(gè)技術(shù)完成了從前沿研究到商業(yè)產(chǎn)品成型的過程,這就是此類工具發(fā)展成型的節(jié)奏。
Clune 認(rèn)為人工智能圖像生成應(yīng)用在未來將在創(chuàng)意產(chǎn)業(yè)中起到重要作用。家具設(shè)計(jì)師可以使用它作為一個(gè)「靈感源(intuition pump)」,在為神經(jīng)網(wǎng)絡(luò)提供椅子的數(shù)據(jù)集后,就可以要求它自動生成這些椅子的變種,這是一種創(chuàng)新的創(chuàng)作方式。圖像生成的其他用途可能會在視頻游戲和虛擬現(xiàn)實(shí)等領(lǐng)域里,根據(jù)用戶實(shí)時(shí)說出的內(nèi)容生成場景。想要條巨龍?只要下達(dá)命令就能生成了。研究人員已經(jīng)在研究這些前沿交互方式了,在下面的圖片中,右側(cè)的圖像僅僅只是是基于左邊的字幕生成的。
它顯然可以用來搞惡作劇。有一個(gè)叫 Face2Face 的程序,它將視頻中的人物變成了木偶,讓你的表情映射到了他們的臉上。研究人員使用和奧巴馬等人的鏡頭證明了這一點(diǎn)。在 Adobe 發(fā)布的新研究中(Project VoCo),用戶可以編輯人類語音,該公司表示它可以像 Photoshop 編輯圖片一樣用于調(diào)整視頻中的發(fā)音和對話。你現(xiàn)在可以創(chuàng)建政治家、名人、演說家的視頻片段,并且不論內(nèi)容如何。然后你可以在任何社交網(wǎng)絡(luò)的頁面上發(fā)布你的剪輯,并看看它會如何迅速遍布整個(gè)互聯(lián)網(wǎng)。
圖:Face2Face實(shí)時(shí)改變視頻中人物的口型
這并不意味著,機(jī)器學(xué)習(xí)編輯工具會讓我們的社會變得再無真相。畢竟人類造假的歷史由來已久,潤飾照片的實(shí)踐早都是在暗室里進(jìn)行的,媒體也經(jīng)常會把假圖片誤報(bào)成真的。從朝鮮的「導(dǎo)彈發(fā)射」到本拉登的「尸體」,這些圖片在英國一些小報(bào)的頁面上隨處可見。同樣,視頻也是一樣——例如,2015 年美國計(jì)劃生育協(xié)會(Planned Parenthood)丑聞,將隱藏拍攝的鏡頭經(jīng)過編輯去支持一些聳人聽聞的錯(cuò)誤言論。
但我們不能否認(rèn)的是,數(shù)碼工具會讓越來越多的人都有能力進(jìn)行偽造。過不了多久,所有人都可以通過人工智能對一張圖片或是對視頻進(jìn)行復(fù)雜的處理。一旦每個(gè)人都能像寫 Word 一樣快速處理照片,事情一定會變得復(fù)雜起來?,F(xiàn)在,查驗(yàn)人工智能所做的偽造和處理并不難(模糊處理是一種常見的方法,低分辨率就會讓它「看上去就是假的」),但是研究人員一直在努力改善他們的技術(shù)。
如果每個(gè)人都能像專業(yè)人員一樣既快速又簡便地修改一張照片,這個(gè)世界會發(fā)生什么?
現(xiàn)實(shí)中偽造的事情越來越多,這對陰謀論者來說是一件愉快的事,但同時(shí)也會大大降低人們對新聞業(yè)的信心。一旦人們知道目前有偽造的圖片在新聞業(yè)流通,即使他們看到真圖,也會開始懷疑,不管原因是什么。(例如,2012 年報(bào)道颶風(fēng)桑迪的博客圖片,經(jīng)證實(shí),里面有偽造的圖片,但也有真實(shí)的圖片)如果新的軟件能夠讓我們像處理圖片一樣輕松處理音頻、視頻內(nèi)容,這其實(shí)又削弱了媒體「真實(shí)可信」證據(jù)的另一大支柱。
這一領(lǐng)域的人工智能研究者們已經(jīng)對即將到來的媒體環(huán)境有了直接的體驗(yàn)。Clune 說:「我目前正處在讓我頭暈?zāi)垦5默F(xiàn)實(shí)世界當(dāng)中?!埂溉藗儼l(fā)給我一些真實(shí)的圖片,但我還是不禁會想它們看起來像不像是假的。當(dāng)他們給我發(fā)送一些偽造的圖片的時(shí)候,我又在假設(shè)這些圖片是真的,因?yàn)榈拇_質(zhì)量很高。漸漸地,我開始在想,我們是不會知道真和假之間的區(qū)別的。這取決于人們自我嘗試和自我學(xué)習(xí)的能力?!?/div>
關(guān)鍵詞
機(jī)器人 圖像識別 視頻識別
版權(quán)與免責(zé)聲明:
凡本網(wǎng)注明“來源:智慧城市網(wǎng)”的所有作品,均為浙江興旺寶明通網(wǎng)絡(luò)有限公司-智慧城市網(wǎng)合法擁有版權(quán)或有權(quán)使用的作品,未經(jīng)本網(wǎng)授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用上述作品。已經(jīng)本網(wǎng)授權(quán)使用作品的,應(yīng)在授權(quán)范圍內(nèi)使用,并注明“來源:智慧城市網(wǎng)”。違反上述聲明者,本網(wǎng)將追究其相關(guān)法律責(zé)任。
本網(wǎng)轉(zhuǎn)載并注明自其它來源(非智慧城市網(wǎng))的作品,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)或和對其真實(shí)性負(fù)責(zé),不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。其他媒體、網(wǎng)站或個(gè)人從本網(wǎng)轉(zhuǎn)載時(shí),必須保留本網(wǎng)注明的作品第一來源,并自負(fù)版權(quán)等法律責(zé)任。
如涉及作品內(nèi)容、版權(quán)等問題,請?jiān)谧髌钒l(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。