• 沒有找到結果。

第四章 人工智慧之健康個資保護議題與應對方案

第四節 人工智慧新興之個資法議題

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

49 267

第四節 人工智慧新興之個資法議題

然而在人工智慧之便利性、高效率下,其對於個資保護,除了仍將延續第二 章第四節所提及之一切個資保護問題外,尚將因人工智慧所具有之特性,再行引 起新的個資保護挑戰。並且,考量我國之「全民健康保險資料人工智慧應用服務 試辦」性質,其所涉及者乃健康個資,於我國個資法第 6 條規範下,屬於敏感性 個資,引發之個資保護挑戰,恐怕比起過往健保資料庫將有過之而無不及。

本文以下各項將分別論述此些新興個資保護議題:

第一項 訓練資料集與個人資料

承本章第二節所述,人工智慧的機器學習往往需要訓練資料來輔助,我 國推行的全民健康保險資料人工智慧應用服務試辦,也是預計以電腦斷層

(CT)及核磁共振(MRI)影像資料為主要訓練資料268,而在選擇訓練資 料集時,若涉及之訓練資料可連結至特定個人,則應考量個資法之適用問 題。

若是輸入的資料集並非個人資料,則此類「非個資依賴型人工智慧 (non-personal data dependent AI) 」尚無違反個資法疑慮。例如:圖像識別系 統以大量物品、動物歸納演繹特徵間的關聯性;以公開棋譜、過往非屬個人 資料之實際對弈記錄、電腦自己與自己進行對弈的結果,作為訓練資料的圍 棋人工智慧 AlphaGo;從地圖資料學習選擇行車路徑,並蒐集車輛行駛中之 外在環境資訊(交通標線、標號、號誌及其他道路上固定或移動物體)建立 自動反應模型的自駕車;從大量語句中建立不同語言文法對應關係的翻譯人 工智慧269

相反地,如果人工智慧的學習必須仰賴個資或由個資衍生之次級資料,

或者在應用上必須藉著與個資的互動及處理始能得到輸出值並運作,那麼此 類人工智慧將稱為「個資依賴型人工智慧 (personal data dependent AI) 」。例 如:需要人臉作為訓練資料的人臉識別系統;透過蒐集使用者位置資訊避免 交通壅塞的自駕車270。NIVIDA 所開發的人臉產生系統,儘管標榜「這個人 不存在」,所產生者乃虛構之人臉,惟最初之學習仍需透過輸入人臉資料,

267 個人資料保護法第 16 條第 2 款、第 5 款。

268 同註 252。

269 邱文聰(2018),〈初探人工智慧中的個資保護發展趨勢與潛在的反歧視難題〉《人工智慧相關

法律議題芻議》,頁 155-157。

270 同上註,頁 157-158。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

50

故亦屬於個資依賴型人工智慧271

而若是一套人工智慧,其屬於個資依賴型人工智慧,則其在進行機器學 習時,勢必得考量應如何遵循個資法規,透過取得當事人同意、獲得法律明 文授權等合法要件,方得合法進行,否則將使最前端之機器學習都構成違法 個資蒐集、處理、利用,更遑論進行後續之應用。

衡酌我國目前試辦的全民健康保險資料人工智慧應用服務試辦,因會運 用到屬於個資的電腦斷層(CT)及核磁共振(MRI)影像資料,故屬於個 資依賴型人工智慧,須考量個資法適用問題。在蒐集、處理、利用個資方面,

可以合理預期,將如同健保資料庫訴訟案一樣,產生個資法第 6 條、第 16 條之適用疑慮,引起我國於個資保護方面之新挑戰。

第二項 黑盒子問題與同意權行使

人工智慧能高效率處理事務的背後,可歸功於其演算法。然而對於演算 法,人類往往只能知道所輸入之資料與所產出之結果,而無法瞭解其運算決 策的過程,對於此種人類難以理解的人工智慧決策過程,即為所謂的「黑盒 子(black box)」問題272。對此,人工智慧的產業界已有預期黑盒子問題將 可能對人工智慧之發展帶來阻礙,故已有推行「可解釋之人工智慧

(explainable AI,XAI)」,企圖消除黑盒子所帶來的一切問題273

黑盒子問題涉及個資法的部分,則是有影響當事人行使同意權或事後排 除權之虞。若是非個資依賴型人工智慧,且未涉及與公共利益相關之事項,

其黑盒子問題可能尚僅是人工智慧技術面上的討論,而不直接涉及當事人權 益。惟若是黑盒子問題發生於個資依賴型人工智慧,其難以解釋之決策過程,

將衝擊當事人同意權行使,引起個資法上之爭議。

如同本文第二章第四節第三項所述,現行我國個資法實務採取之「告知 後同意」模式,已存有諸多問題,其中當事人被迫於不了解告知事項內涵下 就需給予答覆,更是當中的一大待解難題。在進入人工智慧應用後,縱算資 料蒐集者已盡力透過白話、具體方式告知當事人該人工智慧運作之目的、需 投入資料、產出之結果,仍可能因為黑盒子問題,使得當事人對自己之個資 將被如何「蒐集、處理、利用」無法明瞭,因連資料蒐集者也無法解釋人工

271 3C 新報,https://ccc.technews.tw/2019/02/26/thispersondoesnotexist-and-copycats/ (最後瀏覽日:

05/26/2020)。

272 數位時代,https://www.bnext.com.tw/article/53335/fujitsu-explainable-ai-with-knowledge-graph

(最後瀏覽日:2020/05/26)。

273 科技部網站,

https://www.most.gov.tw/folksonomy/detail/906337b9-1d19-4e06-ad71-322b12531971?l=ch (最後瀏 覽日:2020/05/26)。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

51

智慧之演算法,遑論向個資當事人解釋明白,最終使得告知後同意於人工智 慧應用下,成為無法落實的空中樓閣,當事人的事前同意權與事後排除權,

可能將成為具文。

對此,「解釋權(right to explanation)」此一概念,逐漸被學者、政府組 織、媒體等單位呼籲應創設,其基本概念即要求資料控制者,在對個資進行 處理與分析時,應使當事人可得知相關資訊,例如演算法之處理邏輯274 275。 認為既然自然人做決策須盡到告知說明義務,運用人工智慧做決策之人亦應 負有相同義務,避免決策者以人工智慧之面具,遮掩原本應盡之義務276

在歐盟之一般資料保護規範(General Data Protection Regulation,下稱 GDPR)前言第 71 段,亦可發現具有解釋權此一概念之內涵。在 GDPR 前 言第 71 段最末之部分,提及當事人有權對自動化做成之決定進行人為干預、

表達意見、獲得依評估後做成決策之解釋,以及挑戰該決策之權利277。 雖說編寫在 GDPR 前言而非正文的立法模式,使得「解釋權」目前並 非法定權利義務,而僅為建議性質,甚而遭學者批評如被拔利齒般無殺傷力

(toothless)278,但仍足以作為人工智慧處理分析個資時,應注意之事項。

督促應用人工智慧之資料蒐集者,盡力發展可解釋之人工智慧,杜絕黑盒子 問題。

參酌目前我國個資法尚無針對人工智慧所設立之條文,面對人工智慧所 引起的黑盒子疑慮,以及隨之而來的解釋權議題,將極可能是我國現行法難 以應對之議題。

第三項 增加再識別之風險

如同本文第二章第四節第二項第二款所提及之再識別風險279,以及第二 章第四節第三項所提及之累積效果280,被認定是去識別化之微小資訊,在過 往傳統個資實務,即可能透過拼湊、交相比對,產生再識別之效果,而構成 對個資保護之侵害。

人工智慧的高運算能力,固然使得處理資料的成本大幅降低,對公共利

274 黃子潔(2019),《論人工智慧演算法時代的解釋權─歐盟 GDPR 與我國個人資料保護法之比

較研究》,頁 66-67,臺灣大學科際整合法律學研究所碩士論文。

275 Sandra Wachter., Brent Mittelstadt., Luciano Floridi, Why a right to explanation of automated decision-making does not exist in the general data protection regulation, 7(2) International Data Privacy Law 76-77 (2017).

276 Finale Doshi-Velez et al, Accountability of AI Under the Law:The Role of Explanation, Berkman Klein Center for Internet & Society working paper 9 (2017).

277 GDPR Recital (71).

278 Supra note 275, at 76.

279 Supra note 62.

280 同註 65,頁 276。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

52

益具有助益效果。然而此種高運算能力,比起傳統個資實務,更有可能讓過 往被認為已經過去識別化處理的個資,增加被再識別之風險。或是使原本無 關緊要的瑣碎資訊,在高運算能力下更容易被拼湊成敏感個資。例如曾有美 國研究指出,透過 Facebook 使用者在頁面上按讚的資訊,連同少量的訪調 資料,即可成功推論 Facebook 使用者的「性傾向(同性戀或異性戀)」達 88%

的準確率、推論使用者之「種族(白人或黑人)」達 95%準確率、推論使用 者之「宗教信仰(基督或伊斯蘭教)」達 82%準確率281 282。此即美國法院 近來所採取之「鑲嵌理論(mosaictheory)」283,我國實務亦有承認此理論284, 亦有學者表示於個資法領域應使用該理論作為資料主體權利保障依據285。對 此,可知於人工智慧時代,當事人對個資的掌握,極可能逸脫最初所能預料 及掌控之範疇,因再識別風險,於人工智慧時代,比起傳統個資實務,其加 劇程度已不可同日而語。對於蒐集、處理、利用之合法要件,以及當事人事 前同意權、事後排除權的行使,於人工智慧時代,需要有額外保障措施,方 能有效處理大幅升高之風險。

將焦點轉回我國健保資料本身,在健保資料庫訴訟案,最高行政法院認 定健保資料庫屬於合法的理由,係具有足夠的安全實證效用,而足以防止特 定個人遭識別286。但在人工智慧的高運算能力輔助下,同樣時間、成本能交 相比對的資料已遠較過往為多,過往被認定須耗費大量成本方能識別的個資,

可能在人工智慧運作下,成為能夠輕易被識別之個資,過往被認定具有足夠 安全實證效用者,於人工智慧應用普及後,是否還能維持同樣安全實證效用,

不無疑問。對此,於人工智慧應用時代,該如何認定個資是否已達去識別化 標準,或是否具有足夠的安全實證效用,將需要新的辨別標準,以妥善維護 個資法之保障資訊自主、資訊隱私之目的。

第四項 小結

綜合本節第一項至第三項之內容,可以得知於人工智慧應用時代下,過 往已存在之同意權行使問題、再識別風險,將大幅加劇,且因人工智慧演算 法之特性,又再度引發「解釋權」此一課題。

衡量我國試辦中的全民健康保險資料人工智慧應用服務,所取用之訓練 資料為電腦斷層及核磁共振影像資料,其在進行機器學習時,必須先與屬於

281 Michael Kosinski., David Stillwella., Thore Graepel, Private Traits and Attributes are Predictable

281 Michael Kosinski., David Stillwella., Thore Graepel, Private Traits and Attributes are Predictable