• 沒有找到結果。

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

8 結論與未來展望

8.1 結論

進行本研究各項步驟時之觀察結果與主要貢獻整理如下。

關於語料前處理部份,我們從 HTML 格式之原始資料中擷取與裁判相關之各項文字區塊,

並且經過段落切割、註解去除、分句切割等程序後,將原始資料轉換為結構化之裁判書。並 進一步利用自動斷詞系統進行斷詞、詞性標記等處理,以利後續進行特徵擷取程序時使用。

此外,我們提出計算裁判理由與裁判要旨間分句對應關係之方法。利用此項方法可找出裁判 理由中與裁判要旨相對應之分句,用以將裁判理由中之分句標示為要旨或非要旨。

關於特徵擷取部份,我們運用法律領域以及語言學領域之知識將裁判理由中之分句轉換成各 類特徵,並進行數項實驗以觀察各類特徵對於裁判要旨擷取結果之影響。從各項實驗之結果 觀察,本研究所使用之各項特徵皆有助於提昇裁判要旨擷取之效果。

關於裁判要旨擷取模型部份,我們將裁判要旨擷取之工作轉換為二元分類問題,透過分類模 型 判 斷 裁 判 理 由 中 各 分 句 是 否 應 屬 於 裁 判 要 旨 。 我 們 分 別 使 用 深 度 學 習 以 及 gradient boosting 技術建立分類模型,並透過實驗觀察使用不同分類模型對裁判要旨擷取結果之影響。

在實驗結果中,以深度學習為基礎之分類模型,F1 score 可達到 0.9176。以 gradient boosting 為基礎之分類模型,F1 score 則可達到 0.8511。此外,我們使用多種不同模型訓練方法提昇 裁判要旨擷取之效果。在 ensemble 學習方法實驗中,利用 ensemble 學習方法結合多種模型 可將 F1 score 從 0.9136 提昇至 0.9372。證實本研究所提出之裁判要旨擷取方法具有相當之可 行性。

8.2 未來展望

本研究在數項不同之方向皆可於未來持續發展,以下分別敘述。

關於研究語料部份,因為目前僅有最高法院之裁判書具有較多由法院所製作之裁判要旨,其 他審級法院之裁判書幾乎皆不具有由法院製作之裁判要旨,因此本研究僅使用最高法院之裁 判書做為研究語料,並未使用其他審級法院之裁判書。未來若具備其他審級法院裁判書之裁 判要旨,應可將本研究所提出之裁判要旨擷取方法適用於其他審級法院之裁判書,驗證本研 究所提出之裁判要旨擷取方法適用於其他審級法院裁判書之效果。

關於裁判要旨擷取方法部份,因為法院所製作之裁判要旨大多皆係直接由裁判理由中擷取而 成,因此本研究提出之裁判要旨擷取方法亦直接從裁判理由中擷取分句做為裁判要旨。惟法

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

院所製作之裁判要旨中亦有少部份係經由改寫裁判理由而完成,本研究所提出之裁判要旨擷 取方法尚無法產生此類經由改寫而完成之裁判要旨。未來或可採用生成式之裁判要旨擷取模 型,使裁判要旨擷取模型先行閱讀、理解裁判書後,再以生成式之方式產生裁判要旨,而非 採用抽取式之方式直接從裁判理由中擷取裁判要旨。

關於裁判要旨擷取結果評估部份,在本研究中使用 precision、recall 及 F1 score 等量化指標評 估裁判要旨擷取結果。以量化指標評估實驗結果之缺點在於僅能獲知自動擷取之裁判要旨與 法院編輯之裁判要旨在統計上之差異,無法較細緻的逐一探究各篇裁判要旨擷取結果之優缺 點。若以人工逐篇評斷裁判要旨擷取結果,或可改善此一問題。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

參考文獻

[1] Jerome H. Friedman. 2002. Stochastic gradient boosting. Computational Statistics & Data Analysis. 38, 4 (February 2002), 367-378. DOI: http://dx.doi.org/10.1016/S0167-9473(01)00065-2

[2] Ethem Alpaydin. 2010. Introduction to Machine Learning (2nd ed.). The MIT Press. 489-493.

[3] 謝淳達。2005。利用詞組檢索中文訴訟文書之研究。碩士論文。國立政治大學,台北市 , 台灣。

[4] 藍家樑。2009。中文訴訟文書檢索系統雛形實作。碩士論文。國立政治大學,台北市,

台灣。

[5] 廖鼎銘。2004。觸犯多款法條之賭博與竊盜案件的法院文書的分類與分析。碩士論文。

國立政治大學,台北市,台灣。

[6] 何君豪。2006。階層式分群法在民事裁判要旨分群上之應用。碩士論文。國立政治大學 , 台北市,台灣。

[7] 鄭人豪。2006。中文詞彙集的來源與權重對中文裁判書分類成效的影響。碩士論文。國 立政治大學,台北市,台灣。

[8] 林琬真。2012。機器學習於中文法律文件之標記與分類。碩士論文。國立臺灣大學,台 北市,台灣。

[9] 黃玉婷。2012。以文字探勘技術產製求量刑因子之研究—以我國智慧財產權法律為中心 探討。碩士論文。東吳大學,台北市,台灣。

[10]Stephen Cole Kleene. 1956. Representation of events in nerve nets and finite automata.

Automata Studies. Princeton University Press, Princeton, New Jersey, 3-42.

[11]林筱瓴。2013。文字探勘在判決書上之應用—以著作權法民事賠償為中心。碩士論文。

國立臺灣大學,台北市,台灣。

[12]陳政瑜。2015。基於文字探勘技術探討司法裁判書之撰寫一致性:以刑事訴訟停止羈押 聲請裁定書為例。碩士論文。國立臺灣大學,台北市,台灣。

[13]黃詩淳及邵軒磊。2017。運用機器學習預測法院裁判─法資訊學之實踐。月旦法學雜誌,

第 270 期,86-96。DOI: http://doi.org/10.3966/102559312017110270006

[14]黃詩淳及邵軒磊。2018。酌定子女親權之重要因素:以決策樹方法分析相關裁判。臺大 法學論叢,第 47 卷,第 1 期,299-344。

[15]Dou Shen, Jian-Tao Sun, Hua Li, Qiang Yang, and Zheng Chen. 2007. Document

summarization using conditional random fields. In Proceedings of the 20th International Joint Conference on Artificial Intelligence (IJCAI'07), Rajeev Sangal, Harish Mehta, and R. K. Bagga (Eds.). Morgan Kaufmann Publishers Inc., San Francisco, CA, USA, 2862-2867.

[16]Kam-Fai Wong, Mingli Wu, and Wenjie Li. 2008. Extractive summarization using supervised and semi-supervised learning. In Proceedings of the 22nd International Conference on Computational Linguistics - Volume 1 (COLING '08), Vol. 1. Association for Computational Linguistics, Stroudsburg, PA, USA, 985-992.

[17]Jianpeng Cheng and Mirella Lapata. 2016. Neural summarization by extracting sentences and words. In Proceedings of the 54th Annual Meeting of the Association for Computational Linguistics. Association for Computational Linguistics, Berlin, Germany, 484-494.

[18]Yann LeCun, Léon Bottou, Yoshua Bengio and Patrick Haffner. 1998. Gradient-based learning applied to document recognition. Proceedings of the IEEE 86, 11 (1998), 2278–2324.

DOI:http://dx.doi.org/10.1109/5.726791

[19]John J. Hopfield. 1988. Neural networks and physical systems with emergent collective computational abilities. In Neurocomputing: foundations of research, James A. Anderson and Edward Rosenfeld (Eds.). MIT Press, Cambridge, MA, USA, 457-464.

[20]Wei-Yun Ma and Keh-Jiann Chen. 2003. Introduction to CKIP Chinese word segmentation system for the first international Chinese Word Segmentation Bakeoff. In Proceedings of the Second SIGHAN Workshop on Chinese Language Processing - Volume 17 (SIGHAN '03), Vol.

17. Association for Computational Linguistics, Stroudsburg, PA, USA, 168-171.

[21]Jeffrey D. Ullman, Alfred V Aho, and Daniel S Hirschberg. 1976. Bounds on the complexity of the longest common subsequence problem. Journal of the ACM 23, 1 (January 1976), 1-12.

DOI=http://dx.doi.org/10.1145/321921.321922

[22]Lee R. Dice. 1945. Measures of the amount of ecologic association between species. Ecology 26, 3 (1945), 297–302. DOI: http://dx.doi.org/10.2307/1932409

[23]David Harris and Sarah Harris. 2012. Digital design and computer architecture (2nd. ed.).

Morgan Kaufmann, San Francisco, CA, USA, 129.

[24]Yoshua Bengio, Réjean Ducharme, Pascal Vincent, and Christian Janvin. 2003. A neural probabilistic language model. Journal of Machine Learning Research, 3 (March 2003),

1137-‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

[25]Tomas Mikolov, Kai Chen, Greg Corrado and Jeffrey Dean. 2013. Efficient estimation of word representations in vector space. arXiv:1301.3781. Retrieved from

https://arxiv.org/abs/1301.3781

[26]Piotr Bojanowski, Edouard Grave, Armand Joulin and Tomas Mikolov. 2016. Enriching word vectors with subword information. arXiv:1607.04606. Retrieved from

https://arxiv.org/abs/1607.04606

[27]Radim Rehurek and Petr Sojka. 2010. Software framework for topic modelling with large corpora. In Proceedings of the LREC 2010 Workshop on New Challenges for NLP Frameworks, European Language Resources Association, Valletta, Malta, 45-50.

[28]Ronan Collobert, Jason Weston, Léon Bottou, Michael Karlen, Koray Kavukcuoglu, and Pavel Kuksa. 2011. Natural language processing (almost) from scratch. Journal of Machine Learning Research, 12 (November 2011), 2493-2537.

[29]Sepp Hochreiter and Jürgen Schmidhuber. 1997. Long short-term memory. Neural Computation 9, 8 (November 1997), 1735-1780. DOI: http://dx.doi.org/10.1162/neco.1997.9.8.1735

[30]Guolin Ke, Qi Meng, Thomas Finley, Taifeng Wang, Wei Chen, Weidong Ma, Qiwei Ye, and Tie-Yan Liu. 2017. LightGBM: A highly efficient gradient boosting decision tree. In Advances in Neural Information Processing Systems 30 (NIPS 2017). 3149-3157.

[31]Ethem Alpaydin. 2010. Introduction to Machine Learning (2nd ed.). The MIT Press. 220-223.

[32]Diederik P. Kingma, Jimmy Ba. 2016. Adam: A method for stochastic optimization.

arXiv:1412.6980. Retrieved from https://arxiv.org/abs/1412.6980

[33]Mike Schuster and Kuldip K. Paliwal. 1997. Bidirectional recurrent neural networks. IEEE Transactions on Signal Processing, 45(11), 2673-2681.

[34]Tin Kam Ho. 1995. Random decision forests. In Proceedings of the Third International Conference on Document Analysis and Recognition (ICDAR '95), Vol. 1. IEEE Computer Society, Washington, DC, USA, 278-282.

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">

<html lang="zh-TW">

<head>

<title>判解函釋查詢</title>

<meta http-equiv="Content-Type" content="text/html; charset=big5">

<meta name="AAAccessible_website" content="本網站通過第一、第二及第三優先等級無障礙網頁檢測">

<style type="text/css">

<script language="JavaScript" src="../include/JavaScript/fyls.js"></script>

<NOSCRIPT>您的瀏覽器不支援 JavaScript 語法,但是並不影響您獲取本網站的內容</NOSCRIPT>

<body leftmargin="0" topmargin="0">

<table summary="排版用表格" style="width:760px;" border="0" cellspacing="0" cellpadding="0">

<tr>

<td>&nbsp;</td>

</tr>

</table>

<table summary="排版用表格" style="width:760px;" border="0" align="center" cellpadding="0" cellspacing="0">

<tr>

<td style="height: 33px;" background="../Images/fint/fintqry03title.gif">

<div style="font-size:0.8em; text-align:center;">本網站收錄之裁判不以確定裁判或最高法院之統一見 解為限,收錄內容僅供參考</div>

</td>

</tr>

</table>

<table summary="排版用表格" style="width:760px;" border="0" align="center" cellpadding="0" cellspacing="0">

<tr>

<td background="../Images/fint/fintqry03table02.gif"><div align="center">

<table summary="排版用表格" style="width:750px;" border="0" align="center" cellpadding="0"

cellspacing="0" class="big">

<tr>

<td width="37%"><span style="font-size: 80%;">共 57 筆 / 現在第 57 筆</span></td>

<td width="63%"> <div align="right"> <span style="font-size: 80%;">

<a href="FINTQRY04.asp?">第一筆</a>|

<a href="FINTQRY04.asp?">上一筆</a>|

|<a href="#" onClick="javascript:window.open('PrintFInt04.asp?','opener','');">友善列印

</a></span></td>

<table width="96%" border="0" summary="排版用表格" align="center" class="big">

<tr>

<td width="5%" nowrap><div align="right"><span style="font-size: 80%;">裁判字號:

</span></div></td>

<td width="95%"><div align="left"><span style="font-size: 80%;">83 年度台上字第 1865 號

</span></div></td>

</tr>

<tr>

<td nowrap><div align="right"><span style="font-size: 80%;">案由摘要:</span></div></td>

<td><div align="left"><span style="font-size: 80%;">違反著作權法</span></div></td>

</tr>

<tr>

<td nowrap><div align="right"><span style="font-size: 80%;">裁判日期:</span></div></td>

<td><div align="left"><span style="font-size: 80%;">民國 83 年 04 月 01 日</span></div></td>

</tr>

<tr>

<td nowrap><div align="right"><span style="font-size: 80%;">資料來源:</span></div></td>

<td><div align="left"><span style="font-size: 80%;">最高法院刑事裁判書彙編 第 16 期 865-868 頁</span></div></td>

</tr>

<tr>

<td valign="top" nowrap> <div align="right"><span style="font-size: 80%;">

相關法條:

</span></div></td>

<td> <div align="left"><span style="font-size: 80%;">著作權法 第 98 條 &nbsp;

(&nbsp;82.04.24<!--<span style="color:#009900"> 非現行</span>-->&nbsp;)&nbsp; </span></div></td>

</tr>

<tr>

<td valign="top" nowrap><div align="right"><span style="font-size: 80%;">要旨:

</span></div></td>

<table summary="排版用表格" style="width:750px;" border="0" align="center" cellpadding="0"

cellspacing="0" class="big">

<tr>

<td width="43%"><span style="font-size: 80%;">共 57 筆 / 現在第 57 筆</span></td>

<td width="49%"> <div align="right"> <span style="font-size: 80%;">

<a href="FINTQRY04.asp?">第一筆</a>|

<a href="FINTQRY04.asp?">上一筆</a>|

</span></div></td>

<td width="8%" nowrap><div align="right"><span style="font-size: 80%;"><a href="#"

onClick="javascript:window.open('PrintFInt04.asp?','opener','');">友善列印</a></span></div></td>

<td style="height: 10px;"><img src="../Images/fint/fintqry03table03.gif" alt="排版圖示"></td>

</tr>

</table>

<script language="JavaScript">

<!--function MM_preloadImages() { //v3.0

var d=document; if(d.images){ if(!d.MM_p) d.MM_p=new Array();

var i,j=d.MM_p.length,a=MM_preloadImages.arguments; for(i=0; i<a.length; i++) if (a[i].indexOf("#")!=0){ d.MM_p[j]=new Image; d.MM_p[j++].src=a[i];}}

}function send_user_reaction() {

//window.showModalDialog("/UserReaction/UserReaction.aspx?rnd=11072", "",

"dialogWidth:600px;dialogHeight:450px");

window.open("/UserReaction/UserReaction.aspx?rnd=11072", "", "width=600,height=450");

}//-->

</script>

</script>

相關文件