作者︱慨之
編輯 ︱赫貧
隨著ZAO的爆火,“AI換臉技術(shù)”在人們的日常生活更加遍及。這是一種前所未有的體驗——用戶通過ZAO這個APP,可以把視頻中的主人公替換成自己想要的臉,從而獲得非同一般的滿足感。但這個新技術(shù)火的背后,質(zhì)疑的聲音也越來越大。不論是個人隱私,還是倫理道德的問題,目前ZAO還沒有給用戶確切答案。
ZAO 為什么一夜爆火?
“AI換臉技術(shù)”,也不是ZAO首創(chuàng)。在2017年,國外一網(wǎng)友就創(chuàng)造出了一個換臉算法——即后來被廣泛稱為的deepfakes,但它還是基于很多開源庫才能完成。這套算法后來被一位高手封裝成了一個桌面應(yīng)用,可以運行deepfakes算法,無需安裝Python 等。僅需要“支持CUDA的高性能GPU”。
盡管它大幅度降低了操作難度,但對于普通初學(xué)者來說,仍是一個不小的工程。而ZAO,才是真正的簡單上手——用戶想要體驗AI換臉,不再需要電腦,高性能GPU,數(shù)據(jù)集,編程與AI知識,只需要一部手機,一張自拍,就可以把多種影視場景中主角的臉替換掉。
如此強大的功能,不得不說它如此“用途廣泛”。當(dāng)年一個由deepfakes算法愛好者組建的論壇社區(qū),一個月內(nèi)聚集了1.5萬訂閱者,大量的換臉視頻。隨后,這個社區(qū)卻變成了一個生產(chǎn)假冒黃色電影的聚集區(qū)——不少人用換臉技術(shù),把小電影中的主角換成了明星的臉。也正是如此,這個社區(qū)引發(fā)了巨大爭議以至于最后關(guān)掉;也正是這個原因,ZAO的出現(xiàn),讓人們反思,自己“臉”使用權(quán)的問題。
對ZAO的詬病
最受人們質(zhì)疑的,就是ZAO 的那一份用戶協(xié)議——一連串“完全免費”,“不可撤銷”,“永久”的字眼,彷佛是在向用戶宣告,只要你用了我們的軟件服務(wù),你的肖像就要成為“共用商品”。
大家當(dāng)然不希望自己的臉出現(xiàn)在那些不堪入目的視頻里,當(dāng)然,有些人想得更遠,更憂慮——支付寶被盜刷現(xiàn)象,是不是也會隨著”AI換臉技術(shù)”的普及而出現(xiàn)?
用戶把自己的隱私交給公司保管,即使給了你一系列保證,但你不能排除自己個人隱私的泄露。臉,甚至聲音,通過這項技術(shù)都可以模仿到位,很可能,未來的某一天你完成了一起不在場犯罪——因為一些別有用心者,盜用了你的形象,成為了一個犯罪嫌疑人。
作為這項技術(shù)的使用者,暴露出來的問題就如此之多,那么,這項技術(shù)背后的開發(fā)者,和數(shù)據(jù)標注員們面對的挑戰(zhàn),是否更多呢?
ZAO背后的數(shù)據(jù)標注員們
人工智能需要巨量的數(shù)據(jù)訓(xùn)練,如果說ZAO等軟件龐大的用戶群體是人工智能的飼料,那么數(shù)據(jù)標記員、數(shù)據(jù)供養(yǎng)人等產(chǎn)業(yè)就是飼養(yǎng)員,他們每天的任務(wù)就是在人臉照片上點點,將五官標記出來供AI訓(xùn)練。
數(shù)據(jù)標注,越來越成為“一個高端技術(shù)下的低級市場“,作為光輝人工智能的基石和陰暗面,它顯得格外粗糲與拙樸。懂些內(nèi)幕的人知道,數(shù)據(jù)標注事實上,這是一份只要會用鼠標就能干的工作。數(shù)據(jù)標注員們通過對實物不斷地進行定點標記,標注大量用于訓(xùn)練機器學(xué)習(xí)模型的數(shù)據(jù),讓機器越來越像”人“。簡單的來說,就是反復(fù)地教給機器用于辨別實物的特征的手段,來完成識別。
如果要讓機器實現(xiàn)準確地辨別,那么作為訓(xùn)練者的人的標點必須更加精確。要錄入一個人的特征,只要露出了頭,脖子,胸口,標注員們就需要從這個人的左上角開始畫矩形,框住動作,四肢,骨骼,五官,必須標注上千個點才能基本實現(xiàn)百分之七十的準確度(有些標注的點需要更多),但是,要讓機器學(xué)會,標注數(shù)據(jù)必須達到百分之90以上的精確度甚至更高,這就需要一遍一遍地反復(fù)操作,也導(dǎo)致了數(shù)據(jù)標注流水線的產(chǎn)生。
流水線使得數(shù)據(jù)標注效率變快的背后,卻是員工苦不堪言的工作。”任務(wù)圖上密密麻麻的點看兩個小時以上眼睛絕對會花掉了,員工必須克服生理因素,才能避免數(shù)據(jù)錯誤。“可以想象,同在汽車工廠流水線上的工作相比,數(shù)據(jù)工廠從早到晚的敲擊鍵盤與鼠標聲成為了那個枯燥工作的唯一旋律。重復(fù)的標注,重復(fù)的勞動,讓一些從事數(shù)據(jù)標注師的高學(xué)歷青年難以忍受,離開了這個同普通產(chǎn)業(yè)流水線沒有差別的工廠,而留下的,是低學(xué)歷,快速上手的”農(nóng)民工“數(shù)據(jù)標記員。他們收入微薄,但他們的老板還嫌他們干的太少。
于是乎,數(shù)據(jù)標注產(chǎn)業(yè)又吸納了技術(shù)學(xué)院的學(xué)生,出現(xiàn)了一批批數(shù)字富士康。在大數(shù)據(jù)中心貴州,在校學(xué)生被強迫或是利誘(盡管薪水低于當(dāng)?shù)仄骄べY),開始了新型的“搬磚”,“零件工”的生活。他們打著“實習(xí)”的名目,背地里學(xué)校卻和工廠簽訂了協(xié)議,以此來剝削新的廉價勞動力。每天連續(xù)工作11小時,逼近人類極限的工作,讓學(xué)生身體飽受其害,血汗卻被資本家無情地收割。
低廉的勞動力,低水平的技術(shù)培訓(xùn),無差別的工作,使得數(shù)據(jù)標注更像是一個勞動密集型產(chǎn)業(yè)。可以說“這個技術(shù),一點也不智能,就是人工。”
而隨著人工智能在各應(yīng)用領(lǐng)域的全面深化,數(shù)據(jù)行業(yè)競爭也在加劇,標注模型會走向開源,失業(yè)就會接踵而至——年輕人會連這樣枯燥壓抑的工作都失去。
如果說古代社會,只有兩個時代:暫時坐穩(wěn)了奴隸的時代,和想要做奴隸而不得的時代。那么在當(dāng)代社會,從今天至未來,也只有兩個時代:沉悶壓抑出賣勞動力的時代,和想出賣勞動力而不得的時代。
所謂的繁榮盛世,那都是別人的,好看的容顏風(fēng)景,都存在于手機里。