每個(gè)人都有不厭其煩突然爆發(fā)的時(shí)候。受不了。監(jiān)聽聊天內(nèi)容,上傳地理信息,搜什么廣告就立刻跟著推送……Facebook你XX,Twitter我去▇▇。社交應(yīng)用統(tǒng)統(tǒng)滾蛋,再次做一個(gè)人吧。
可悲的是,根據(jù)一項(xiàng)新的研究,即便物理斷網(wǎng),也無法保護(hù)自己的隱私。
佛蒙特大學(xué)的研究人員發(fā)現(xiàn),通過您所處的社交圈子——您與之互動(dòng)的網(wǎng)絡(luò)好友——甚至可以比您自己以前發(fā)布在網(wǎng)絡(luò)上的內(nèi)容,更能揭示出您的各種信息。
他們的論文中寫道:“只需分析目標(biāo)個(gè)體的8-9個(gè)網(wǎng)絡(luò)好友,就能拼湊出足夠精確的信息——等效于直接分析目標(biāo)本身。我們的結(jié)果具有明顯的隱私寓意:個(gè)人信息如此強(qiáng)烈地嵌入到社交網(wǎng)絡(luò)中,原則上,即使個(gè)體脫離了平臺(tái),也可以將個(gè)人放到其可用的社交關(guān)系中進(jìn)行分析?!?/p>
為了分析社交回音現(xiàn)象的可預(yù)測(cè)性,該團(tuán)隊(duì)選出了13905名Twitter用戶的超過3000萬條公共推文。
龐大的數(shù)據(jù)集通過被稱為信息理論估算器的計(jì)算機(jī)系統(tǒng)——這是一種機(jī)器學(xué)習(xí)形式,通過帖子中的語言數(shù)據(jù)進(jìn)行篩選,同時(shí)參考用戶活動(dòng)的時(shí)間順序——進(jìn)行分析。
利用這些數(shù)據(jù),研究人員確定了927個(gè)“自我網(wǎng)絡(luò)”,每個(gè)網(wǎng)絡(luò)代表一個(gè)用戶(自我)和他們最常提到的15個(gè)Twitter聯(lián)系人(改變者)。
在這些自我網(wǎng)絡(luò)中,具有學(xué)習(xí)能力的算法,能夠預(yù)測(cè)出“自我”以后發(fā)布的大約60%的內(nèi)容。
這個(gè)數(shù)字可能聽起來不太可怕,但顯然比靠投硬幣做決策好多了;它反映出,我們無意中在社交網(wǎng)絡(luò)上泄露了大量的個(gè)人信息。
現(xiàn)在,該團(tuán)隊(duì)表示60%的可預(yù)測(cè)性是他們的方法所能達(dá)到的上限,但令人驚訝的是,一旦你將“自我”先前的推文從數(shù)據(jù)集中刪除——并且只給算法輸入“改變者”所說的內(nèi)容——可預(yù)測(cè)性只會(huì)下降到57%左右。
換句話說,即使你根本不在某個(gè)特定的社交媒體平臺(tái)上,機(jī)器學(xué)習(xí)系統(tǒng)也能夠借由其他人拼湊出你的“影子形象”,這種影像來自于你最近和最親愛的人所泄露出的大量只言片語。
如維也納醫(yī)科大學(xué)的計(jì)算機(jī)科學(xué)家David Garcia(他的研究方向相同,但沒有參與這項(xiàng)研究)所說,在保護(hù)隱私方面,這些令人敬畏的預(yù)測(cè)能力使現(xiàn)行的游戲規(guī)則面目全非。
“雖然我們知道從個(gè)人的公開信息中能分析出很多隱秘的內(nèi)容,同時(shí)這也使得保護(hù)隱私的法規(guī)捉襟見肘,但是大規(guī)模陰影輪廓描摹和社會(huì)形態(tài)推理的可能性指向了更嚴(yán)重的問題。考慮到信息會(huì)從他人處流出,我們不要以為個(gè)人遵從了保護(hù)隱私安全的指導(dǎo)意見就萬事大吉,而應(yīng)該建設(shè)全隱私模式的網(wǎng)絡(luò)結(jié)構(gòu)?!?/p>
該研究結(jié)果發(fā)表在Nature Human Behavior上。
本文譯自 sciencealert,由譯者 majer 基于創(chuàng)作共用協(xié)議(BY-NC)發(fā)布。