第三章 裁判書資料集建置
第四節 建立資料集
實質內容區塊的原告主張中,本文所關注重點為:原告是否請求離婚、原告 是否請求給付、是否出現主文所示代替原告聲明。根據此三命題所構思的正則表 達式為:准…離婚、應給付….元、…如主文所示…。
實質內容區塊的被告主張中,本文所關注重點為:被告是否請求離婚、被告 是否同意離婚或是無意見、被告是否請求給付、被告是否請求駁回原告之訴、是 否出現如主文所示代替被告聲明。根據此五命題所構思的正則表達式為:准…離 婚、…同意…離婚、應給付…元、駁回…之訴或…之訴駁回、…如主文所示…。
最後實質內容區塊的所有裁判內文中,本文所關注重點為:被告是否提起反 訴、是否為一造辯論判決。根據此二命題所構思的正則表達式為:…反訴原 告…、…合法通知…未到庭。
第四節 建立資料集
本文將上述正則表達式擷取出的文句,依照一定的編碼規則,委由以 Python 語言撰寫的程式來進行實際的編碼作業,將各變項轉化為可供判別的數值(依類 型數量,僅有 2 類為 0 或 1,3 類為 0 或 1 或 2,以此類推)。產生之結果為 Microsoft Excel 試算表檔案(XLSX 格式),由數個工作表組成,具體包括資訊 擷取結果、分段結果以及編碼結果,並可用於進一步處理,例如套用統計方法分 析。編碼或是轉換的具體規則說明如下。
一、主文區塊之變項編碼規則
(一)法院是否判決離婚
法院是否判決離婚之變項,以是否有出現類似於「准原告與被告離婚」或相 類似之語句來決定,透過正則表達式來擷取不同的排列組合方式,之後將符合態
樣的語句歸入對應欄位。其次,再根據此欄位是否有「離婚」兩字來判定變項結 果。有的話編碼為 1,反之則為 0。此變項意義在於能夠得知雙方婚姻狀態是否 將因裁判而有所變化,蓋因贍養費通常情況下僅在離婚後始有可能給付,斷無可 能在婚姻關係持續中,本文觀察到唯一例外,係妾本於男女間類似婚姻之結合關 係向另方請求贍養費。
(二)法院是否命給付
法院是否命給付之變項,則以是否有出現「被告應給付贍養費」、「相對人 應給付新台幣數萬元」等語句,以正則表達式擷取不同數額、不同名目乃至幣值 的排列組合方式後,將符合態樣的語句分入對應欄位。如裁判在此欄位確有出現 相類語句,再根據是否有「應給付」三字的出現來判定變項結果。有的話編碼為 1,反之則為 0。此變項意義在於能夠了解法院是否在裁判內容中命一方給付他 方,但不限於被告向原告給付;例如有少數「反訴被告應給付反訴原告贍養 費」,也會被編碼為 1,但顯然此種情形是屬於原告應向被告給付。不過,並非 所有裁判會開宗明義在主文指出該給付之名目乃至內容,常常僅列有貨幣種類以 及具體數額。故本變項僅能觀察出有無給付,但無法判斷是贍養費或損害賠償。
(三)法院是否認為原告請求有理由
法院是否認為原告請求有理由之變項,則以是否出現「原告之訴駁回」、
「原告其餘之訴及假執行之聲請均駁回」等語句為準,以正則表達式擷取不同排 列組合方式後將語句分入對應欄位。具體言之,若在此欄位出現了「原告之訴駁 回」,代表原告主張被認為無理由,則編碼為 0。其次,再根據此欄位有無「均 駁回」或是「其餘」來編碼。有「其餘」的話,代表原告有可能部分主張被認為 有理由,編碼為 1;沒有「其餘」但有「均駁回」則編為 0,代表原告全部敗 訴。前述兩種情形之外,則認為法院並未將原告一部或全部主張駁回,則編碼為 2,代表原告全面勝訴。此變項意義在於能夠了解法院在主文中所做結論是否有 利原告,也就是原告起訴所請求內容是否至少獲得部分滿足。
二、原告主張變項編碼規則
(一)原告是否請求離婚
原告是否請求離婚之變項,主要是根據有無出現可以判斷原告曾聲明准其與 被告離婚之語句為主,輔以是否透過其他陳述表達其維持婚姻之意願為輔,將相 類語句的排列組合方式由正則表達式擷取符合態樣的語句後分入對應欄位。如裁 判確有出現相類語句在該欄位,則根據有無「准…離婚」的出現來判定該變項結 果。有則表示為 1,代表原告主張離婚;反之則為 0,代表原告並未要求離婚。
此變項的意義在於判斷原告是否在此訴訟請求准其與被告離婚,若原告並未請求 離婚,但卻是贍養費相關訴訟,這可能表示本件是雙方已離婚後,再請求贍養費 的狀況。
(二)原告是否請求給付
原告是否請求給付之變項,則是根據原告有無向被告要求給付任何形式的金 額,透過正則表達式擷取可囊括不同幣值、數額、名目的排列組合之語句後分入 對應欄位。如裁判確有出現相類語句,則依照語句中是否出現「給付」來判斷變 項結果。有則編碼為 1,反之則為 0。此變項的意義在於原告是否明確聲明向法 院請求被告給付任何金錢,因為有時候贍養費之請求未必是原告提起,而是被告
(反訴原告)所要求,此變項再加上主文,有助於判斷贍養費是誰向誰請求。惟 其限制是無法辨別請求給付之內容與名目。
(三)法院是否判原告勝訴
法院是否判原告勝訴,固然閱讀主文是最佳判斷方法(亦即上述一(三)的 方法業已能判斷原告勝訴於否),不過有時法院還會在「原告主張」段落內,記 載「如主文所示」五字,這代表法院全面支持了原告的主張,亦即原告全部勝 訴。如有出現此種語句,則編碼為 2,反之則不編碼(遺漏值)。附帶一提,本 項目的編碼與上述一(三)並非獨立不相關的概念,而是有所重複;理論上本項
目編碼為 2 的裁判,其一(三)的結果應為 2。因此本項編碼的作用只是用來輔 助檢證一(三)的編碼結果是否有遺漏而已,而不具獨自的意義。
三、被告主張變項編碼規則
(一)被告是否請求離婚
被告是否請求離婚之變項,雖可能使用與原告相同的判讀方式(即上述二
(一),以有無出現「准…離婚」之語句來判斷),但本研究發現,被告主張的 表達方式未必與與原告相同,而較多是以白話的語句為陳述。故先以有無出現可 判斷被告確實聲明准其與原告離婚或是表達其維持婚姻意願之相類語句,由正則 表達式擷取符合態樣的語句後分入對應欄位(即類似上述二(一)之作法)。如 欄位中確有出現相類語句,則依照是否出現「不」字來判斷變項結果:有則編碼 為 0,代表被告不希望離婚;沒有的情況下則看是否有「同意」或是「准」字,
有則表示為 1,代表被告希望離婚。在前述兩種情形均未出現之情形,則不編碼
(遺漏值),認為被告在此並未特別表示意見。
(二)被告是否請求給付
被告是否請求給付之變項,則與原告是否請求給付(上述二(二))大致相 似,惟其文句必須是出自「被告主張」的段落。在正則表達式擷取分入對應欄位 的語句中,同樣依照是否有「給付」字樣,來判斷變項結果。有則表示為 1,反 之則為 0。如果被告並未有所陳述,則不編碼(缺漏值)。
(三)法院是否判被告勝訴
法院是否認為被告勝訴之變項則類原告主張之同變項(上述二(三)),同 樣需要考量裁判以「如主文所示」代替被告之聲明的狀況。有的話,表示法院做 出了對被告有利之判決,即被告全面勝訴,原告全面敗訴,此際其編碼對照上述 一(三),編為 0,反之則為遺漏值。此編碼的意義如同上述二(三),只是用 來輔助檢證一(三)的編碼結果是否有遺漏而已。
(四)被告是否要求駁回原告之訴
被告是否抗辯駁回原告之訴之變項,則係做為被請求之一方才有可能提出。
本文的作法,係以正則表達式擷取被告有無具體請求「駁回原告之訴」的相類語 句,分入對應欄位。欄位中確有出現相類語句,則依照與句中是否出現「駁回」
來判斷變項結果。有則編碼為 1,代表被告要求駁回原告之訴;反之則為 0,代 表被告沒有反駁,可能是一造辯論判決之狀況(如下述四(二)),可能是被告 單純只是對原告所提主張加以答辯,也可能是被告同意被告主張,蓋依照第五節 者,推測當事人應是在裁判前已經兩願離婚,此種類型共有 217 件(49.43%),
這似乎表示有將近一半關於贍養費的請求,實非基於民法第 1057 條之規定,而 是來自於離婚雙方當事人自行約定。
表 4 的統計結果,本變項為 0 的件數高於四(二)一造辯論裁判的件數。
四、裁判特徵變項編碼規則
除了前述針對已細分區塊的資訊的擷取與處理外,為了釐清裁判當中當事人 的關係,本研究再從整體裁判中擷取特定關鍵字詞或語句,以判斷下列問題。
(一)被告是否提出反訴
被告是否提出反訴之變項,是因為反訴事件通常較複雜,不僅原告對被告有 所請求,被告也反對原告有所請求,雙方攻防激烈,故透過關鍵字詞來確認裁判 中有無本訴與反訴並陳。以正則表達式擷取裁判內文有無出現反訴原告或是反請 求來判斷變項結果。有則編碼為 1,反之則為 0。
(二)是否為一造辯論判決
這種狀況與上述(一)可謂處於兩種極端。一般而言,即使原告的主張與證 據薄弱,只要是合法提起訴訟而被告未予適當答辯甚而未具狀或到庭表示意見 時,結果會壓倒性的對原告有利,亦即原告請求有理由。因此,有必要釐清某裁
這種狀況與上述(一)可謂處於兩種極端。一般而言,即使原告的主張與證 據薄弱,只要是合法提起訴訟而被告未予適當答辯甚而未具狀或到庭表示意見 時,結果會壓倒性的對原告有利,亦即原告請求有理由。因此,有必要釐清某裁