防詐仙拚仙2/全球一天40萬新網站 蔡祈岩:「抓偽冒網站不難,難在確認」訓練AI判讀圖片及關鍵字
台灣大資訊長蔡祈岩針對台灣特性,規劃了AI系統來偵測偽冒網站。(圖/趙世勳攝、翻攝自佳瑋科技官網)
「在一開始評估要切入的時候,就有看到國際上有相類似的產品,但多數不是專業的產品,僅是資安軟體中的其中一部份功能,應用在台灣市場多少會水土不服,雖然大家的方式都是利用系統爬蟲到處去偵測,但是國外產品因為設計理念等問題,會有漏洞,或是偵測速度過慢、時效不及的問題,因此公司還是決定自己來開發。」台灣大防詐專案小組主持人資訊長蔡祈岩。
電信業為何最適合進行防詐?「因為這需要大量的算力跟網路頻寬,畢竟這是要即時偵測辨識全世界的網站是不是偽冒的?尤其每天新增的網站約有40萬個,這樣的成本其實很高的。」蔡祈岩說,偽冒網站通常會用圖片還有關鍵字來降低受害者的戒心,這些其實可以用AI來做初步判斷,所以就特別針對圖片及關鍵字來訓練AI。
蔡祈岩說,圖像辨識一定要用AI,例如LOGO、照片,就要用AI去看照片、去認人,一般來說,目前的客戶以企業為主,通常的委託內容,除了偵測是否有偽冒的官網外,通常也會將該公司高層的照片是否被偽冒列入業務之一。透過訓練AI去辨識,雖然不能一定判斷就是偽冒,但是就可以讓AI去持續搜尋,至少知道某個網站有這些照片,讓AI判讀偽冒網站的可能性,如果達到一定程度,就會交給人工再去判讀。
AI怎麼判斷是偽冒網站?蔡祈岩說,一般來說,偽冒網站一定會有遭冒用的名人名字、照片、網站內容、關鍵字等不同的蛛絲馬跡,或是偽冒的網域名稱等等,會根據客戶需求,請客戶提供資料,透過不斷將資料餵給AI去學習判斷,只要給它越多的資料,AI就會越來越準。
「如果被AI系統判斷是偽冒網站,就會交由人工進行確認,另外也還有漏網之魚的偽陰性網站,不過這種只能靠客戶回報,所以台灣大也建立了回報平台,由客戶回報,工程師除了協助處理該偽冒網站下架外,也會再次去確認,為何系統沒有發現。」蔡祈岩說。
在決定成立專案小組後,蔡祈岩說,第一版做出來很快,大概花了一個月的時間就做出來了,因為詐騙的變化層出不窮,應該要快速反應,所以每1-2周就會有新的版本,持續滾動調整。
「不過抓偽冒網站不難,但是要如何確認是真的偽冒網站。」蔡祈岩說,根據統計,一天全世界會出現40萬個新網站,這樣的數量,如果有千分之一被誤判,那就有400個網站需要人工來確認,因為不可能因為系統判定,就直接發警報,所以也有複審機制,畢竟以現在的AI,還是會需要人工來輔助確認,等到AI學習的越來越準確,需要人工確認的數量也會隨之減少。
在偵測並確認是偽冒網站後,更重要的就是下架的速度。蔡祈岩說,因為不同國家有其獨特狀況,所以要根據不同的業者,建立快速的反應SOP。「常常看到新聞報導,民眾向社群軟體檢舉詐騙,最後都沒有成案。這主要是因為不同的單位有不同的審查機制,像是我們偵測到社群,就會通知社群媒體,將資料準備齊全,透過他們的審查機制,請他們來下架,專案小組早就熟知他們的規則,協助社群軟體確認是偽冒網站,再將其下架。」蔡祈岩說。「每個平台有不同的規定,才能進一步消滅這些偽冒網站。」