近日一段AI換臉視頻火爆網(wǎng)絡(luò),一個(gè)網(wǎng)名叫換臉哥的Geek,將朱茵在94版射雕中的黃蓉?fù)Q成了楊冪。
后來(lái)甚至有的主播利用類似技術(shù),在直播平臺(tái)上利用實(shí)時(shí)換臉技術(shù),直接把自己換成某些一線明星來(lái)吸引眼球。
后來(lái)?yè)Q臉哥直接下架了相關(guān)視頻,并發(fā)聲明稱希望大家專注于技術(shù)本身。這起事件看起來(lái)只是一個(gè)娛樂(lè)版的頭條,但是深入思考一下也會(huì)發(fā)現(xiàn),視頻換臉技術(shù)其實(shí)也給金融業(yè)普遍使用的如:客戶交易視頻資料留檔、人臉交易授權(quán)等風(fēng)控手段帶來(lái)了一定風(fēng)險(xiǎn)。
◆ ◆ ◆
一、AI換臉技術(shù)的前世今生
其實(shí)對(duì)于PS中各種美顏、瘦臉和磨皮的技術(shù),我想大家都不十分陌生了,甚至有的女生是專門根據(jù)美顏功能的高低而去選擇相應(yīng)手機(jī)的,不過(guò)這類圖像處理技術(shù)的應(yīng)用范圍始終還是被圈定在靜態(tài)圖片的處理上。直到17年底一個(gè)網(wǎng)名叫”deepfakes”的人出現(xiàn),在Reddit上發(fā)布了一段成人視頻,而視頻的主角卻從根本從未參加過(guò)拍攝,一時(shí)之間受害的女星還很多,不過(guò)她們卻發(fā)現(xiàn)deepfakes做法好像沒(méi)有什么對(duì)應(yīng)的法律能夠約束,只能轉(zhuǎn)向Reddit投訴,后來(lái)Reddit近于壓力干脆直接封殺了deepfaks的賬號(hào)。不過(guò)這次封殺卻讓deepfaks直接開源了其換臉項(xiàng)目的代碼。
接下來(lái)的18年中AI換臉技術(shù)在科研學(xué)術(shù)研究領(lǐng)域和開源社區(qū)兩個(gè)方向上都獲得了不小的發(fā)展,在SIGGRAPH(暨國(guó)際計(jì)算機(jī)圖形學(xué)會(huì))的18年年會(huì)上一個(gè)由斯坦福大學(xué)、慕尼黑技術(shù)大學(xué)、巴斯大學(xué)等科研究機(jī)構(gòu)聯(lián)系研發(fā)的”Deep Video portrait”系統(tǒng)橫空出世,該技術(shù)不但能讓被替換的人臉完全模板原視頻中人物的表情,甚至在放大對(duì)比時(shí),兩個(gè)視頻在發(fā)絲和睫毛的表現(xiàn)上都能做到極度的精確,后來(lái)描述該技術(shù)的論文被發(fā)表在了《ACM圖形交易上》,不過(guò)所幸的是研發(fā)”Deep Video portrait”技術(shù)的幾家機(jī)構(gòu)并沒(méi)有公開其項(xiàng)目的源代碼。
而在開源社區(qū)中AI換臉技術(shù)也是得到了相當(dāng)多的關(guān)注,筆者初步在github上看了一下,由deepfaks衍生(如faceswap, deepfacelab)而來(lái)的開源項(xiàng)目數(shù)量不下十幾個(gè),其中以faceswap、Openfaceswap等開源項(xiàng)目為代碼的換臉技術(shù)在github上的更新與討論十分熱烈,可以說(shuō)完全看不到趨冷的跡象,極快的推動(dòng)了開源換臉技術(shù)的迭代速度。而以FaceApp為代表的項(xiàng)目雖然沒(méi)有開源,但是它們都提供了支持一鍵式操作的應(yīng)用程序,極大的降低了換臉技術(shù)的使用門檻。
依據(jù)筆者在周末的親身測(cè)試結(jié)果,如果有一定編程知識(shí)和基礎(chǔ)的程序員大概只需要半天就能在開源社區(qū)的幫助下建立好相應(yīng)的開發(fā)環(huán)境,代碼調(diào)試中的問(wèn)題也都能得到很快的解決;而如果完全沒(méi)有編程基礎(chǔ)的人士,只需要一塊NVIDA的中高端顯卡也能能夠使用faceApp的應(yīng)用程序來(lái)進(jìn)行換臉操作,只是如果遇到問(wèn)題需要另外付費(fèi)咨詢。
◆ ◆ ◆
二、AI怎么能把人臉換的毫不違和?
我們將原視頻中的人物面部信息簡(jiǎn)稱為faceA,將要被替換人物的面部信息簡(jiǎn)稱為faceB.
1、人臉偵測(cè)和識(shí)別。首先要讓機(jī)器通過(guò)含有faceA的視頻定位并識(shí)別到其中的人臉特征值,通過(guò)深度學(xué)習(xí)將faceA還原到正面、平行均勻光照、標(biāo)準(zhǔn)亮度的場(chǎng)景下。接下來(lái)對(duì)含faceB的視頻進(jìn)行相同操作,將aceB也還原到正面、平行均勻光照、標(biāo)準(zhǔn)亮度的場(chǎng)景下。
2、確定變換矩陣:接下來(lái)我們對(duì)原視頻的人臉信息進(jìn)行定位與偵測(cè),并進(jìn)行特征提?。ㄒ韵潞?jiǎn)稱featureA),然后用featureA與faceA對(duì)比,找出faceA轉(zhuǎn)換到featureA的所需扭曲、光照等變換的矩陣(以下簡(jiǎn)稱transferA)。
3、人臉替換:對(duì)faceB進(jìn)行基于transferA的變換,也就是把faceB還原到原視頻的拍攝角度及光源場(chǎng)景下,形成新的人臉信息featureB,使用featureB對(duì)featureA進(jìn)行替換。
4、對(duì)于視頻中的每一禎信息重復(fù)以上操作直至結(jié)束。
所以了解清楚了AI的換臉原理,我們也能看出目前實(shí)時(shí)換臉的技術(shù),還只能用在人正面面向鏡頭且不劇烈運(yùn)動(dòng)的場(chǎng)景,因?yàn)槿绻鹴ransferA非常復(fù)雜,對(duì)其進(jìn)行計(jì)算的時(shí)間要求較高,基本無(wú)法達(dá)到實(shí)時(shí)換臉的效果。
不過(guò)實(shí)時(shí)換臉的這種局限也不能令我們放心,由于Depfakes算法本身就考慮了換臉時(shí)的光線、角度等方面,使其生成的假視頻難以被反偵測(cè);而且隨著各類開源項(xiàng)目的興起,換臉技術(shù)的應(yīng)用對(duì)于大眾來(lái)說(shuō)其技術(shù)門檻也在不斷降低。
◆ ◆ ◆
三、奇點(diǎn)來(lái)臨,如何應(yīng)對(duì)
在一年多之前視頻偽造還幾乎是個(gè)不可能完成的任務(wù),不過(guò)隨著技術(shù)的發(fā)展,AI換臉甚至AI換一切的技術(shù)都必然出現(xiàn)。那么面臨這樣一個(gè)如此具有顛覆性技術(shù)的到來(lái),我們到底如何應(yīng)對(duì)?
讀到這里我相信很多讀者都有這樣的疑問(wèn),能否利用AI技術(shù)本身對(duì)于偽造的視頻進(jìn)行鑒定呢?而這個(gè)問(wèn)題在開源社區(qū)中已經(jīng)有過(guò)比較充分的討論了。我們知道凡是機(jī)器學(xué)習(xí)都會(huì)有損失函數(shù),是可以利用這個(gè)函數(shù)對(duì)兩個(gè)面部特征不同的視頻做做替換關(guān)鑒定,不過(guò)這種方法也有相當(dāng)?shù)木窒?,由于損失函數(shù)是換臉后的視頻相對(duì)于原視頻的概念,而不巧的是當(dāng)你只有一個(gè)視頻情況下,還沒(méi)有任何穩(wěn)定的方法能夠鑒定它是否被修改過(guò)。所以結(jié)論就是如果幾段視頻中有真有假,AI可以幫助你鑒定真假,而如果一段孤本的視頻,則沒(méi)有辦法去鑒定它是否為真。
所以我們必須要正視換臉技術(shù)所帶來(lái)的直接沖擊,那就是視頻影像材料做為證據(jù)的效力大幅減弱。筆者在之前《為什么黎曼猜想會(huì)和你的錢包有關(guān)系》的文章中曾經(jīng)介紹過(guò),目前金融業(yè)的信息安全體系主要有對(duì)稱和非對(duì)稱加密兩種,其中對(duì)稱加密是防盜的,沒(méi)我的鑰匙就打不開我的箱子;非對(duì)稱加密是防篡改的,改了我說(shuō)的話就和我的簽名對(duì)不上了,這里不加贅述,感興趣的讀者可以翻閱一下之前的文章。而目前視頻可以被任意修改而無(wú)法被鑒定的根本原因,就在于目前還沒(méi)有一種視頻編碼規(guī)范,能夠滿足可追溯、防篡改的要求。
其實(shí)訪問(wèn)照PDF文件的格式規(guī)范,簡(jiǎn)單來(lái)講在每禎視頻后加入簽名信息,其實(shí)就能達(dá)到防篡改的目的,即便AI能夠轉(zhuǎn)錄換臉,但是由于拿不到原作者的簽名,很容易鑒別真?zhèn)巍T谶@里我們也呼吁國(guó)家盡快建立基于國(guó)密算法的防篡改視頻標(biāo)準(zhǔn),并盡力能夠使其成為國(guó)際標(biāo)準(zhǔn),個(gè)人認(rèn)為這也是我們國(guó)家的國(guó)密算法走向國(guó)際化的一個(gè)契機(jī)。
最后筆者還要指出,這種呼之欲出的視頻編碼規(guī)范,其實(shí)和區(qū)塊鏈的機(jī)制具有強(qiáng)關(guān)聯(lián)性的。我們知道區(qū)塊鏈揚(yáng)名立腕的根本就是其防篡改、分布式和時(shí)間戳的屬性,那么我們不妨開個(gè)腦洞將監(jiān)控、取證等證據(jù)效力要求較高的視頻簽名信息定時(shí)送上區(qū)塊鏈,利用區(qū)塊鏈的安全機(jī)制為視頻防篡改多加一層保險(xiǎn),以達(dá)到提升安全性的目的。也讓我們拭目以待,看看被AI打破的信任,能否被區(qū)塊鏈重建。
< end >
如果您對(duì)本文有好的想法,就留下您的寶貴建議吧!
聯(lián)系客服