研究結論與討論

第三章研究方法

詳述本研究的研究方法，從取樣、編碼、事實認定的原則、缺失值的處理、

研究標的的定義、統計檢定的方法、各種預測模型的優化方法，最後提出樣式化論理模型（IBP-like Reasoning Model, i-like）的架構與演算法。

第四章研究結果

第四章以第三章所介紹的各種方法為工具、探索第三章所建構的親權酌定九年資料庫，取得了以下研究成果：

－以第三章介紹的優化方法，結合 5 種預測模型，進行 102-106 年五年間親權歸屬的逐年滾動預測。發現若經客製優化的程序，預測模型的準確率都能比原始模型增加 1%以上，且各客製預測工具的準確率差異有限，都能勝任全新外部樣本的預測工作，沒有過度擬合的問題。

－發現 102-106 年的資料除 103 年外並無顯著變化，且對預測模型及論理模型 i-like 的功能發揮並無影響，確認法官裁判的標準是一致的。

－結合論理模型 i-like 與統計學檢定工具，發現子女的年齡與親權歸屬有關，

「幼兒從母」的原則依舊存在。

－結合論理模型 i-like 與統計學檢定工具，針對外籍配偶的弱勢議題，進行全方位的探討，認為外籍配偶在爭取親權時，雖未受到司法不公平的對待，

然而現行社會整體的資源分配和體系運作不利他們取得親權。

第五章研究結論與討論

第五章除摘要說明本研究的問題意識、研究發現與結論之外，並進一步由研究結果省思「子女之最佳利益」精神。我們在研究過程也深切感受到：各種分析檢定預測的方法都只是工具，運用工具的是人，問題意識與法律的專業才是法律研究的主體。

本章同時探討研究方法中編碼者的主觀偏差對於研究結果的影響，因而推測文本探勘、特別是類似圖片辨識自動擷取特徵（feature extraction）並進而分類的

深度學習模型將會是未來的趨勢。機器學習模型不是沒有侷限，尤其在法律領域的應用，與大數據的概念總有一些扞格不入的稜角，其中分際的拿捏都需要法律人三思。

11 Reasoning, CBR）、及機器學習演算法的模型（Machine Learning Algorithm, ML）⁴⁰，本章將依上述分類個別介紹相關的預測模型。

43 解釋覆蓋率（explaining coverage）的定義為該論理模型正確解釋的樣本數除以整體樣本數的比率。捨卻解釋覆蓋率，我們無從客觀評判論理模型的好壞。

Kevin D. Ashley 在他 Artificial Intelligence and Legal Analytics 的書裡，以英國國籍法（British Nationality Act, BNA）為例，說明「教」電腦學習法律是如何的艱辛（notoriously difficult）⁴⁶。如果我們設身處地去模擬法官的心智運作，所謂的「心證」、「情理之平」，似乎是交織著邏輯與直覺、理性與感性的混沌體，這涉及心理 LEGAL ARGUMENTS:REASONING WITH CASES AND HYPOTHETICALS108 (1990); Kevin D. Ashley, Reasoning with Cases and Hypotheticals in HYPO, 34 INT. J MAN-MACH. STUD753, 763 (1991).

48 顏厥安（2018），〈人之苦難，機器恩典必看顧安慰〉，劉靜怡（主編），《人工智慧相關法律議題芻議》，頁 55，臺北：元照。該文以「墨闇碑」（monolith）作為心靈的象徵（symbol）：「個別心靈

14 整（reformulation），釐清模糊空間。這就是 BNA 的故事：會讓程式停擺的條件組合，那些邏輯不夠嚴密、甚至矛盾互斥的概念，都能在人腦「情理之平」的大海

－－利用電腦擅長的計數（counting）領域，以層次分明、架構謹嚴的邏輯高維複合體模擬結果，此即所謂的監督式（supervised）學習。不僅法官的理性邏輯，甚至連「直覺之浪」和「靈感之光」也能一概被模擬，於是在這個領域取得了突破性的發展。

既然已經知道一邊是沒有維度定義的渾沌拓樸、一邊是高維度的邏輯空間，

所以這個模擬絕對不會是全等，甚至也稱不上詮釋，而是一種映射（mapping）。

決策樹算是解釋門檻最低的預測模型，訓練好的樹形可以將它轉譯成條件判斷的程式語言。但如果我們認真拿著這一道道的程式按圖索驥：法官是因為這個因素然後走左邊，又因為那個因素轉右邊，這就買櫝還珠了。因為預測模型是要連法官的直覺、靈光一閃都要一齊模擬的，如果決策樹和法官理性邏輯的部分一樣，

意謂著它將沒有顧及非理性的層面，恐怕就得在直覺之海裡翻船。

難道預測模型就不需要論理了嗎？其實只要從制高點鳥瞰，把論理模型和預測模型分流，很多紛爭都可以在各自的定位上各安其位。決策樹上的節點因素、

對數機率迴歸裡的大係數因素，我們可以認定是重要的因素；但這是否等同於論理的全貌，則須嚴謹審慎。其中因素的銜接若有與專業邏輯解說不通的理路，很可能就是預測模型中「用數學模擬直覺追求準確」的部分，不能以此為病。苟不饜足於此，就該努力去尋找那位平易近人的 93 分同學－－論理模型。

我們的研究是以群體的共相為對象，有些共相在個案的身上找得到，比如一群都是 15 歲的孩子，這個 15 歲既是整體的一個因素，同時在每個孩子的身上也都找得到。但更多的共相，是我們在個案的身上無從求索的，例如平均值、標準差、勝算、卡方值等，這些我們慣常使用的統計參數幾乎都屬於後者。例如有群人的平均年齡 12 歲，對其中一個 15 歲的孩子而言，一旦他離開該群體，12 歲這個數值對他就不具意義，這就是共相不存在於個案。

共相存不存在於個案身上常會引發問題，特別是當我們想要知道的是「單一法官的心證」的時候。例如：當我們在研究外籍母親的親權歸屬時，決策樹分類

17 戰勝人類，可能還要再過一百年，甚至更長時間。」See George Johnson, To Test a Powerful Computer, Play an Ancient Game, N.Y. TIMES (July. 29, 1997), https://www.nytimes.com/1997/07/29/science/to- test-a-powerful-computer-play-an-ancient-game.html. 直到 2013 年，電腦仍要在讓子的前提下，始能 擊敗職業圍棋棋士。See Annalia S. Linnan, "Crazy Stone" Computer Go Program Defeats Ishida at Japanese UEC Cup, AGA (Mar. 27, 2013), https://www.usgo.org/news/2013/03/crazy-stone-computer- go-program-defeats-ishida-at-japanese-uec-cup/.

54 AlphaGo 的演算法是估值網路（value network）與走棋網路（policy network）這兩種深度神經網 路，結合蒙地卡羅樹搜尋（Monte Carlo tree search, MCTS）搭建而成。See David Silver et al., Mastering The Game of Go with Deep Neural Networks and Tree Search, 529 NATURE 484, 486-8 (2016).

最大值只有 2%。可是我們看分布圖，其準確率固然集中到不見鬚盒，但那幾顆零星在外的離群值（outlier）告訴我們：即令是 98%相同的兩個資料庫，訓練出來決策樹還是可以不一樣。只要預測模型和論理模型的定位清楚，不會指著不同的決策樹說「原來法官是按著不同的標準裁判這兩個相似度 98%的族群」，就不致引發無謂的論戰了。

圖 1 訓練組不同抽樣比率的決策樹準確率分布⁵⁵

之所以堅持嚴格限縮預測模型的解釋能力，另行追尋論理模型的存在。就是因為預測模型的「不一致性」，在法律的專業領域很容易會涉及標簽化（lable）和歧視（discrimination）的議題，因此再審慎都不為過。

第二款擬人化

論理模型邏輯路徑的安排，要儘量貼近人的心智活動，否則將失去說服力⁵⁶。

55 為改善可視性，圖 1 我們隱去不列 1%抽樣組（S1）準確率在 0.85 以下的資料點。

56 這點地圖導航就做得很成功，它們在決定路線時，一般是採啟發式演算法（A* heuristic search algorithm），而非窮盡一切力量在天文數字般的組合裡找出最短／最不耗時的路線。順著人類平常行進的邏輯，例如朝東北方向的目標，全程的轉彎不是朝東、就是往北，大致選個較近的路線。這 樣的演算需時少，而且不會得出儘管最短或最快，但人眼看過去就覺得是在繞路的選項。See Andrew V. Goldberg et al., Reach for A*: Efficient Point-to-Point Shortest Path Algorithms, ALENEX'06, 129,

57 決策樹三種演算法所使用的指標：卡方分析（CHAID）、吉尼不純度（Gini diversity index, CART）、

和資訊熵（information entropy, ID3 series）的定義，都是和三叉以上的分類相容的。

58 一次只看一步是電腦的特色，也是它的強項，這樣才能專注、精確、快速。

腦可以投入的步驟，整體上是個人機協同的任務。

雖然在邏輯路徑的結構上論理模型終究比較接近決策樹，完成之後的模型也不需要案件的原貌來導引邏輯路徑的行進，但再度強調：它不是決策樹，即使拿來充當預測模型使用時，它依然不具備決策樹的特點，這些在文後的章節將會一一說明。

第二節第一個自動化法律預測程式：誰離你最近？

本章自本節開始，將依序介紹各種預測模型，其中 k 鄰近演算法是最早提出的預測模型，不但饒富歷史意義，在後來的資料處理工具（例如闕失值的補值）

也常用到這種方法。對數機率迴歸是深富統計精神的預測模型，既與機率相通，

又能提供信度效度的檢驗，了解它可以得到如同自制高點俯瞰預測領域的眼界，

因此本論文在 k 鄰近演算法之後將接著介紹它。決策樹、隨機森林、梯度推進決策樹是植基於決策樹演算法的預測模型，後兩者屬於集成式機器學習，部分設計理念是一脈相承的，本論文列在第三介紹。至於類神經網路、包括反向傳播類神經網路，及現在當紅的深度學習則列在第四順序。

最後本論文將介紹另一種不屬於機器學習的預測模型－－以案件為基礎，包括以爭點為基礎的預測模型、及採用基本價值的預測模型。以爭點為基礎的預測模型在精神上其實更接近傳統法學的案件評析，本研究也將測試它的表現，但因為它在電腦執行的程序繁瑣費時，又有人工比對的大量需求，在進行逐年滾動分析、各種預測模型比較時便不再將其列入。

早在 1974 年 Ejan Mackaay 和 Pierre Robillard 就試著用電腦程式預測關於資本利得稅務案件的裁判結果⁵⁹，當時已經有不少文獻在探討預測裁判結果的議題。

Mackaay 等把搜集的案件轉換成 46 個他們研判與裁判結果相關的因素，以二元值

59 EJAN MACKAAY & PIERRE ROBILLARD, PREDICTING JUDICIAL DECISIONS: THE NEAREST NEIGHBOUR RULE AND VISUAL REPRESENTATIONOF CASE PATTERNS302-31 (1974), cited from ASHLEY, supra note 40, at 108-9.

21 謂的 k 鄰近演算法（k nearest neighbor algorithm, k-NN），把收集的案件彼此各因素

在文檔中法律資料分析的優化與應用：以離婚後未成年子女親權酌定的裁判為素材 (頁 30-200)

第二節 第一個自動化法律預測程式：誰離你最近？

第二節第一個自動化法律預測程式：誰離你最近？