臉部辨識可能沒你想的那麼神,但造就冤獄已經綽綽有餘:《打開演算法黑箱》

 

「中國已經把用於新疆地區的臉部辨識技術,擴大到全中國其他地區,監控操作更精密,甚至可以辨識特定族群,維吾爾族人疑似成為鎖定目標,被加強監控。」──紐約時報

 

演算法收到相片、監視錄影或3D攝影機快照,就會偵測臉部、測量其特徵,並與已知臉部資料庫做比對,企圖確定相片中人的身分。

 

文|漢娜‧弗萊(Hannah Fry)

譯|林志懋

 

  臉部辨識演算法在現代治安作為當中正開始普及起來。這些演算法收到相片、監視錄影或3D攝影機快照,就會偵測臉部、測量其特徵,並與已知臉部資料庫做比對,企圖確定相片中人的身分。

 

  在柏林,能夠辨識已知恐怖主義嫌犯的臉部辨識演算法被訓練來鑑識經過火車站的群眾。在美國,二○一○年以來,這些演算法光是在紐約州,僅僅針對詐欺和身分盜用就發動了超過四千次逮捕行動。而在英國,現在把攝影機架在交通工具上面,看起來像加強版的Google街景車,自動四處開來開去,交叉比對我們和通緝犯資料庫的相似度。這些廂型車第一次成功找到目標是在二○一七年六月,一輛車從南威爾斯一名男子身旁開過去,而當地警方已對這名男子發出逮捕令。

 

  我們的安全和保安往往取決於我們的臉部鑑定與辨識能力,但這項任務交在人類手上,可能會有風險。以海關官員為例,最近有一項研究模擬機場保安設施,這些臉孔辨識專家未能發現身分證不符的比率達驚人的百分之十四──而完全合格者則有百分之六誤遭駁回。我不知道你怎麼想,但我覺得,當你考量到每天通過希斯洛機場的人數,這些數字不只是令人有點焦慮而已。

 

  我們稍後會看到,臉部辨識演算法當然可以把這項任務做得比人類好。但用於追捕罪犯時,鑑識錯誤的後果是如此嚴重,而這些演算法的運用引發一項重大問題。把兩個人的身分弄錯,到底有多容易?我們之中有多少個一副塔利臉的正潛伏在外頭某處?

 

把兩個人的身分弄錯,到底有多容易?

 

  一項從二○一五年開始進行的研究顯示,你在自己的真實生活中擁有分身的機會(無論是銀行搶匪或其他)小到幾乎為零。阿德雷德大學的泰涵.露卡絲(Teghan Lucas)千辛萬苦在四千人的照片中做了八種臉部測量,其中連一組相符的都找不到,讓她得出結論:兩個人要有完全相同臉孔的機率低於一兆分之一。根據這項計算,塔利不光是運氣有「一點」背而已。考量到他那位兆中選一的邪惡分身也住在附近,而且碰巧是名罪犯,我們應該可以預期要在幾萬年之後,才會有另一個倒楣的人落入同樣的悲慘經驗。

 

  但有些理由讓人懷疑這些數字不太兜得起來。想像遇上和你臉孔相同的某人當然難,但長得很像卻毫無關係的陌生人,這類軼聞證據看起來確實比露卡絲研究可能顯示的訊息要常見許多。

 

  以尼爾.道格拉斯(Neil Douglas)來說吧,他搭機要前往愛爾蘭時才發現,他的分身就坐在他的位子上。在他們的自拍照裡,後面有滿滿一飛機的旅客與他們同笑,這張照片很快像病毒般傳播開來。不久之後,世界各地留著絡腮鬍、紅頭髮的人寄來自己的照片,證明他們也有相似的長相。「我想,我們可以組成一支小型軍隊了,」道格拉斯告訴BBC。

 

  我甚至有自己的故事可以添上一筆。我二十二歲的時候,有個朋友給我看一張他們在當地樂團Myspace的網頁上看到的照片。那是一場我沒去過的演唱會上所拍照片的拼貼圖,顯示很多人樂在其中,而其中一人看起來眼熟得令人毛骨悚然。為了確認我沒有在某天晚上失去知覺,出門遊蕩去了如今想不起來有參加過的派對,我寄了電子郵件給樂團主唱,他確認了我的懷疑:我那愛好電子合成流行樂的分身,有著比我更精采的社交生活。

 

  因此,塔利、道格拉斯和我,就是各有至少一名分身的這種人,可能還不只一名。在七十五億人口中,我們加起來就有三人,而且我們還沒開始認真算人頭呢──這樣已經遠超過露卡絲估算的一兆分之一。

 

  有一個理由可以解釋這種落差。一切都歸因於研究人員對「等同」的定義。露卡絲的研究要求,兩個人的測量結果必須完全相合。即便道格拉斯和貌似他的人像到不可思議,如果有一個鼻孔或一片耳垂相差多達一毫米,根據她的判準,他們嚴格說來不算是分身。

 

  但就算你比較的是同一個人的兩幅影像,精確的測量並不會反映出我們每一個人是如何持續在改變,由於年老、疾病、疲憊、我們所做的表情,或我們的臉如何因攝影機角度而被扭曲。想以幾毫米之差來捕捉臉的本質,那麼你在同一個人臉上所發現的變異之多,將一如你在人與人之間察覺到的。簡單說,單憑測量無法區分兩張臉孔。

 

  雖然這兩張臉孔或許不完全等同,但一點都不難想像自己會把道格拉斯和照片中他那素昧平生的分身給弄混。塔利的情況類似,他和真正的搶匪看起來甚至沒有那麼相似,但影像還是被聯邦調查局專家錯誤解讀,以至於他被控以未曾犯過的罪名,扔進最高保安等級的牢房。

 

相像和相同不是同一回事,而且從來不是同一回事,無論演算法變得多精準。

 

  正如海關官員所顯示的,把不熟悉的臉孔弄混,即使這些臉孔只是略有相似,驚人地容易。結果證明,人類出乎意料地拙於辨識陌生人。這就是為什麼我的朋友聲稱,她是耐著性子勉強看完克里斯多福.諾蘭(Christopher Nolan)攝製優美的電影《敦克爾克大行動》(Dunkirk)──因為她要花很大的力氣來分辨這些演員。這是為什麼青少年發現,「借」年長朋友的身分證去買酒頗有成功的機會。這也是為什麼根據美國非營利法律扶助組織「清白專案」(Innocence Project)評估,在百分之七十以上的冤案中,目擊證人誤認發揮了某種作用。

 

  不過,雖然目擊者或許很容易將道格拉斯與他的同機旅伴弄混,他的母親當然可以毫無問題地從照片中認出她兒子──即使說的是真實生活中的分身:一對完全相同的雙胞胎,如果你和他們只是泛泛之交,或許容易弄混,但只要你對他們有正確認識,分辨他們同樣容易。

 

  這裡有一個關鍵點:相似性取決於觀者的角度。沒有嚴格定義相似性,你無法測量兩張臉孔有多麼不同,我們也就沒有一個標準可以說兩張臉孔完全相同。你無法定義何謂分身,或是說某一張特定臉孔有多常見;最重要的,你也說不出兩幅影像攝自同一人的機率為何。

 

  這意味著臉部辨識做為一種鑑識法,不像DNA是自豪地端坐在強大的統計學平台之上。把DNA檢測法用於刑事鑑識,罪犯特徵剖析的焦點是放在基因組的特定區塊上,這些區塊已知在人類身上會有高度變異。該變異的程度是關鍵所在:如果犯罪現場發現的身體組織樣本DNA序列與取樣自嫌犯身上的序列吻合,代表你可以計算兩者來自同一人的機率。也意味著,你可以說出某個倒楣傢伙碰巧就在那些點上有相同DNA序列的精確機率。你使用的標記越多,比對錯誤的機率越低,所以藉由選擇所要測試的標記數量,全世界每一個司法系統都完全能夠決定他們願意容忍的疑慮限度。

 

  即便我們覺得自己的臉孔與我們是何許人有如此本質性的關聯,如果不知道人類身上的變異性,以臉孔來指認重犯的做法得不到嚴謹科學的支持。說到以照片認人,借用聯邦調查局鑑識單位的說法:「缺乏統計,意味著這些結論最終都是奠基於個人看法。」

 

  不幸的是,用演算法來做臉部辨識並未幫我們解決此一難題,這是對於運用演算法來指認罪犯一事提高警覺的極佳理由。相像和相同不是同一回事,而且從來不是同一回事,無論演算法變得多精準。

 

  而且,另外還有一個要對臉部辨識演算法步步為營的好理由。這些演算法並非真如你想的那般善於辨識臉孔。

 

 

(本文為《打開演算法黑箱:反噬的AI、走鐘的運算,當演算法出了錯,人類還能控制它嗎?》部分書摘)

 

《打開演算法黑箱》中文版書封。

 

書籍資訊

書名:《打開演算法黑箱:反噬的AI、走鐘的運算,當演算法出了錯,人類還能控制它嗎?》 Hello World: How to Be Human in the Age of the Machine

作者:Hannah Fry

出版:臉譜

日期:2019

[TAAZE] [博客來]

 

你可能會喜歡

投一張空白票算是犯罪嗎?薩拉馬戈《投票記》

戰犯與詭異蝴蝶:《恨意、精神分析與羅夏克墨漬測驗》

芬蘭人的小確幸:每個人的心中都住著一個小馬帝

兇手依然逍遙法外,而你們就這麼相信了蔣氏的謊言:《美麗島事件與大鬍子家博回憶錄》