• 沒有找到結果。

第三章 研究方法

詳述本研究的研究方法,從取樣、編碼、事實認定的原則、缺失值的處理、

研究標的的定義、統計檢定的方法、各種預測模型的優化方法,最後提出樣式化 論理模型(IBP-like Reasoning Model, i-like)的架構與演算法。

第四章 研究結果

第四章以第三章所介紹的各種方法為工具、探索第三章所建構的親權酌定九 年資料庫,取得了以下研究成果:

-以第三章介紹的優化方法,結合 5 種預測模型,進行 102-106 年五年間親 權歸屬的逐年滾動預測。發現若經客製優化的程序,預測模型的準確率都 能比原始模型增加 1%以上,且各客製預測工具的準確率差異有限,都能 勝任全新外部樣本的預測工作,沒有過度擬合的問題。

-發現 102-106 年的資料除 103 年外並無顯著變化,且對預測模型及論理模 型 i-like 的功能發揮並無影響,確認法官裁判的標準是一致的。

-結合論理模型 i-like 與統計學檢定工具,發現子女的年齡與親權歸屬有關,

「幼兒從母」的原則依舊存在。

-結合論理模型 i-like 與統計學檢定工具,針對外籍配偶的弱勢議題,進行 全方位的探討,認為外籍配偶在爭取親權時,雖未受到司法不公平的對待,

然而現行社會整體的資源分配和體系運作不利他們取得親權。

第五章 研究結論與討論

第五章除摘要說明本研究的問題意識、研究發現與結論之外,並進一步由研 究結果省思「子女之最佳利益」精神。我們在研究過程也深切感受到:各種分析 檢定預測的方法都只是工具,運用工具的是人,問題意識與法律的專業才是法律 研究的主體。

本章同時探討研究方法中編碼者的主觀偏差對於研究結果的影響,因而推測 文本探勘、特別是類似圖片辨識自動擷取特徵(feature extraction)並進而分類的

10

深度學習模型將會是未來的趨勢。機器學習模型不是沒有侷限,尤其在法律領域 的應用,與大數據的概念總有一些扞格不入的稜角,其中分際的拿捏都需要法律 人三思。

11 Reasoning, CBR)、及機器學習演算法的模型(Machine Learning Algorithm, ML)40, 本章將依上述分類個別介紹相關的預測模型。

12

43 解釋覆蓋率(explaining coverage)的定義為該論理模型正確解釋的樣本數除以整體樣本數的比 率。捨卻解釋覆蓋率,我們無從客觀評判論理模型的好壞。

13

Kevin D. Ashley 在他 Artificial Intelligence and Legal Analytics 的書裡,以英國 國籍法(British Nationality Act, BNA)為例,說明「教」電腦學習法律是如何的艱 辛(notoriously difficult)46。如果我們設身處地去模擬法官的心智運作,所謂的「心 證」、「情理之平」,似乎是交織著邏輯與直覺、理性與感性的混沌體,這涉及心理 LEGAL ARGUMENTS:REASONING WITH CASES AND HYPOTHETICALS108 (1990); Kevin D. Ashley, Reasoning with Cases and Hypotheticals in HYPO, 34 INT. J MAN-MACH. STUD753, 763 (1991).

48 顏厥安(2018),〈人之苦難,機器恩典必看顧安慰〉,劉靜怡(主編),《人工智慧相關法律議題 芻議》,頁 55,臺北:元照。該文以「墨闇碑」(monolith)作為心靈的象徵(symbol):「個別心靈

14 整(reformulation),釐清模糊空間。這就是 BNA 的故事:會讓程式停擺的條件組 合,那些邏輯不夠嚴密、甚至矛盾互斥的概念,都能在人腦「情理之平」的大海

15

--利用電腦擅長的計數(counting)領域,以層次分明、架構謹嚴的邏輯高維複 合體模擬結果,此即所謂的監督式(supervised)學習。不僅法官的理性邏輯,甚 至連「直覺之浪」和「靈感之光」也能一概被模擬,於是在這個領域取得了突破 性的發展。

既然已經知道一邊是沒有維度定義的渾沌拓樸、一邊是高維度的邏輯空間,

所以這個模擬絕對不會是全等,甚至也稱不上詮釋,而是一種映射(mapping)。

決策樹算是解釋門檻最低的預測模型,訓練好的樹形可以將它轉譯成條件判斷的 程式語言。但如果我們認真拿著這一道道的程式按圖索驥:法官是因為這個因素 然後走左邊,又因為那個因素轉右邊,這就買櫝還珠了。因為預測模型是要連法 官的直覺、靈光一閃都要一齊模擬的,如果決策樹和法官理性邏輯的部分一樣,

意謂著它將沒有顧及非理性的層面,恐怕就得在直覺之海裡翻船。

難道預測模型就不需要論理了嗎?其實只要從制高點鳥瞰,把論理模型和預 測模型分流,很多紛爭都可以在各自的定位上各安其位。決策樹上的節點因素、

對數機率迴歸裡的大係數因素,我們可以認定是重要的因素;但這是否等同於論 理的全貌,則須嚴謹審慎。其中因素的銜接若有與專業邏輯解說不通的理路,很 可能就是預測模型中「用數學模擬直覺追求準確」的部分,不能以此為病。苟不 饜足於此,就該努力去尋找那位平易近人的 93 分同學--論理模型。

我們的研究是以群體的共相為對象,有些共相在個案的身上找得到,比如一 群都是 15 歲的孩子,這個 15 歲既是整體的一個因素,同時在每個孩子的身上也 都找得到。但更多的共相,是我們在個案的身上無從求索的,例如平均值、標準 差、勝算、卡方值等,這些我們慣常使用的統計參數幾乎都屬於後者。例如有群 人的平均年齡 12 歲,對其中一個 15 歲的孩子而言,一旦他離開該群體,12 歲這 個數值對他就不具意義,這就是共相不存在於個案。

共相存不存在於個案身上常會引發問題,特別是當我們想要知道的是「單一 法官的心證」的時候。例如:當我們在研究外籍母親的親權歸屬時,決策樹分類

16

17 戰勝人類,可能還要再過一百年,甚至更長時間。」See George Johnson, To Test a Powerful Computer, Play an Ancient Game, N.Y. TIMES (July. 29, 1997), https://www.nytimes.com/1997/07/29/science/to- test-a-powerful-computer-play-an-ancient-game.html. 直到 2013 年,電腦仍要在讓子的前提下,始能 擊敗職業圍棋棋士。See Annalia S. Linnan, "Crazy Stone" Computer Go Program Defeats Ishida at Japanese UEC Cup, AGA (Mar. 27, 2013), https://www.usgo.org/news/2013/03/crazy-stone-computer- go-program-defeats-ishida-at-japanese-uec-cup/.

54 AlphaGo 的演算法是估值網路(value network)與走棋網路(policy network)這兩種深度神經網 路,結合蒙地卡羅樹搜尋(Monte Carlo tree search, MCTS)搭建而成。See David Silver et al., Mastering The Game of Go with Deep Neural Networks and Tree Search, 529 NATURE 484, 486-8 (2016).

18

最大值只有 2%。可是我們看分布圖,其準確率固然集中到不見鬚盒,但那幾顆零 星在外的離群值(outlier)告訴我們:即令是 98%相同的兩個資料庫,訓練出來決 策樹還是可以不一樣。只要預測模型和論理模型的定位清楚,不會指著不同的決 策樹說「原來法官是按著不同的標準裁判這兩個相似度 98%的族群」,就不致引發 無謂的論戰了。

圖 1 訓練組不同抽樣比率的決策樹準確率分布55

之所以堅持嚴格限縮預測模型的解釋能力,另行追尋論理模型的存在。就是 因為預測模型的「不一致性」,在法律的專業領域很容易會涉及標簽化(lable)和 歧視(discrimination)的議題,因此再審慎都不為過。

第二款 擬人化

論理模型邏輯路徑的安排,要儘量貼近人的心智活動,否則將失去說服力56

55 為改善可視性,圖 1 我們隱去不列 1%抽樣組(S1)準確率在 0.85 以下的資料點。

56 這點地圖導航就做得很成功,它們在決定路線時,一般是採啟發式演算法(A* heuristic search algorithm),而非窮盡一切力量在天文數字般的組合裡找出最短/最不耗時的路線。順著人類平常 行進的邏輯,例如朝東北方向的目標,全程的轉彎不是朝東、就是往北,大致選個較近的路線。這 樣的演算需時少,而且不會得出儘管最短或最快,但人眼看過去就覺得是在繞路的選項。See Andrew V. Goldberg et al., Reach for A*: Efficient Point-to-Point Shortest Path Algorithms, ALENEX'06, 129,

19

57 決策樹三種演算法所使用的指標:卡方分析(CHAID)、吉尼不純度(Gini diversity index, CART)、

和資訊熵(information entropy, ID3 series)的定義,都是和三叉以上的分類相容的。

58 一次只看一步是電腦的特色,也是它的強項,這樣才能專注、精確、快速。

20

腦可以投入的步驟,整體上是個人機協同的任務。

雖然在邏輯路徑的結構上論理模型終究比較接近決策樹,完成之後的模型也 不需要案件的原貌來導引邏輯路徑的行進,但再度強調:它不是決策樹,即使拿 來充當預測模型使用時,它依然不具備決策樹的特點,這些在文後的章節將會一 一說明。

第二節 第一個自動化法律預測程式:誰離你最近?

本章自本節開始,將依序介紹各種預測模型,其中 k 鄰近演算法是最早提出 的預測模型,不但饒富歷史意義,在後來的資料處理工具(例如闕失值的補值)

也常用到這種方法。對數機率迴歸是深富統計精神的預測模型,既與機率相通,

又能提供信度效度的檢驗,了解它可以得到如同自制高點俯瞰預測領域的眼界,

因此本論文在 k 鄰近演算法之後將接著介紹它。決策樹、隨機森林、梯度推進決 策樹是植基於決策樹演算法的預測模型,後兩者屬於集成式機器學習,部分設計 理念是一脈相承的,本論文列在第三介紹。至於類神經網路、包括反向傳播類神 經網路,及現在當紅的深度學習則列在第四順序。

最後本論文將介紹另一種不屬於機器學習的預測模型--以案件為基礎,包 括以爭點為基礎的預測模型、及採用基本價值的預測模型。以爭點為基礎的預測 模型在精神上其實更接近傳統法學的案件評析,本研究也將測試它的表現,但因 為它在電腦執行的程序繁瑣費時,又有人工比對的大量需求,在進行逐年滾動分 析、各種預測模型比較時便不再將其列入。

早在 1974 年 Ejan Mackaay 和 Pierre Robillard 就試著用電腦程式預測關於資本 利得稅務案件的裁判結果59,當時已經有不少文獻在探討預測裁判結果的議題。

Mackaay 等把搜集的案件轉換成 46 個他們研判與裁判結果相關的因素,以二元值

59 EJAN MACKAAY & PIERRE ROBILLARD, PREDICTING JUDICIAL DECISIONS: THE NEAREST NEIGHBOUR RULE AND VISUAL REPRESENTATIONOF CASE PATTERNS302-31 (1974), cited from ASHLEY, supra note 40, at 108-9.

21 謂的 k 鄰近演算法(k nearest neighbor algorithm, k-NN),把收集的案件彼此各因素

21 謂的 k 鄰近演算法(k nearest neighbor algorithm, k-NN),把收集的案件彼此各因素

相關文件