行政院國家科學委員會專題研究計畫 成果報告
立法院立法表現之研究----第四屆與第五屆審議法案的資
訊蒐求及資訊網絡之比較(I)
計畫類別: 個別型計畫 計畫編號: NSC92-2414-H-110-005- 執行期間: 92 年 08 月 01 日至 93 年 07 月 31 日 執行單位: 國立中山大學政治學研究所 計畫主持人: 廖達琪 共同主持人: 林福仁 計畫參與人員: 王英獎、莊澤生、梁家豪、張峻豪、劉子昱、蔡雨臣、游凱詒、 林琮崴、邱建培、廖宗銘 報告類型: 精簡報告 處理方式: 本計畫可公開查詢中 華 民 國 93 年 10 月 28 日
行政院國家科學委員會專題研究計畫成果報告
國科會專題研究計畫成果報告撰寫格式說明
Preparation of NSC Project Reports
計畫編號:NSC93-2414-H-110-009
執行期限:92 年 8 月 1 日至 93 年 7 月 31 日
主持人:中山大學政治學研究所教授廖達琪
共同主持人:清華大學科管所教授林福仁
計畫參與人員:專任助理王英獎
高雄市議會資訊室高級分析師:莊澤生
政治所博士班研究生:張峻豪
政治所碩士班研究生:劉子昱
政治所碩士班研究生:林琮崴
政治所碩士班研究生:游凱詒
政治所碩士班研究生:蔡雨臣
資管系碩士班研究生:梁家豪
資管系碩士班研究生:邱建培
資管系碩士班研究生:廖宗銘
一、中文摘要 本研究旨在比較立法院第四屆 (88.2-91.1)與第五屆(91.2-94.1)在審查 法案上的資訊蒐求習慣及資訊網絡發展類 型上有沒有明顯的差異。做這樣比較的意 義,因為一方面這兩屆立法院內的政黨結 構有明顯的差異(從一黨獨大到多黨並 立),對議事表現應有一定的影響;另一 方面,無論民主政治、政黨競爭、國會決 策的相關理論都強調資訊的重要,重視資 訊及專業往往是國會效能的重要指標。而 民主政治理論也期許,政黨競爭會促進對 資訊的重視,及以資訊專業為基礎的理性 論爭。台灣的立法院是否因政黨競爭而有 這樣的情形出現,是本研究的根本關切。 本計畫分三年期,並在研究方法上除 了運用傳統的文獻分析及內容分析技術 外,也跨領域合作使用資訊管理方面的資 料探勘技術。分析的素材在資訊蒐求方 面,以立法院公報為主,並進行系統、全 面的登錄。在資訊網絡方面,則以新法案 為主,並不僅包括立法院公報的相關資 料,也包括主要報紙媒體的電子檔。 本計畫預期的貢獻,一方面是新興民 主國家政黨競爭對公共決策品質影響的實 務了解及理論檢證修訂,另一方面是資料 探勘技術的應用對資管及政治領域都是方 法上空前的突破。 關鍵詞:立法院、立法表現、資訊蒐求、 資訊網絡、資料探勘 AbstractThis project aims to do a comparison of Legislative Yuan’s legislative performance between its fourth and fifth terms. The legislative performance is defined as Legislative Yuan’s information gatherings and networks for examining bills.
The rationale for doing so is twofold. On the one hand, the party structures of Legislative Yuan between the two terms are quite different (from one-party dominance to a multiparty system). This kind of change should exercise certain impacts upon legislative performance. On the other hand, theories, either involving democracy, party competition, or congressional
importance of information in democratic processes. Furthermore, democratic theories seemingly quite optimistically expect that the party competition should be able to make parties be more attentive to gather
information from various sources than does the case of no party competition. Since Taiwan’s Legislative Yuan has been entering the era of party competition after 2002, whether the optimal expectation derived from democratic theories has also been emerging in its information gathering routines and information network patterns for reviewing bills? This is the main concern of this study.
This project involves a three-year research. Its methods not only employ some conventional techniques, such as
documentary analysis, content analysis, but also adopt a cross field technique-data mining, which is mainly developed and used by the field of information management. The materials for doing analyses in this project mainly involve two sources. One source is from the Legislative Yuan Bulletin. The other is from the electronic text files of three main press medias in Taiwan.
The major contributions of the project will be twofold. On the one hand, the project can provide both empirical evidences and theoretical suggestions about the impact of party competition upon public policies in newly democratized countries. On the other hand, using data mining technique is a methodological breakthrough for both the field of political science and that of information management.
Keywords: Legislative Yuan, Legislative performance, information gathering, information network, data mining 二、計畫緣由與目的 (一) 背景 立法院無疑目前已是台灣政治運作的 重要核心之一。尤其公元2000 年總統大選 後,行政部門已有了政黨輪替,由原來居 於反對黨地位的民進黨取得總統大位,主 導行政大權,而立法院因原來執政的國民 黨仍擁有國會過半的席次(115 席),而形 成與行政部門分立,並有所謂「朝小野大」 的現象。接著2001 年底的立法院選舉,主 導行政部門的民進黨,雖然成為國會的第 一大黨(87 席),但仍未過半(113 席), 且國民黨仍有68 席,親民黨有 46 席,台 聯有13 席,無黨籍 10 席,新黨 1 席,出 現的局面是多黨不過半。1 國會中的政治 角力,合縱連橫,幾乎是經常上演的連續 劇,相關的研究也陸續出現(黃秀端, 2002;楊婉瑩,2002)。 這種國會中的政黨運作、同盟或對 抗,原是民主國家的常態(Dodd, 1976; de Swaan, 1973; Laver & Shepsle, 1996; Lavor & Schofield, 1998)。但對台灣這樣的新興 民主國家而言,卻可能還要經過嘗試摸 索、學習的階段,即便是媒體或一般大眾, 都還不習慣多黨在國會中所形成似乎相當 紛亂的局面。但民主政治的古典理論或經 驗事實似都肯定多黨競爭,甚至衝突,對 公共政策品質的提升,及人民福祉的保 障,應有正面的效果(Dahl, 1971; Held, 1988; Klingemann, Hofferbert, Budge, 1994; Eldersveld, 1998; Przeworski et al., 2000; Przeworski et al., 1999)。所以民主建置的 首要條件,就是要允許反對力量的存在, 保障反對黨的成立(Dahl; 1967; 71),其 他相應的條件,主要就是資訊的流通公 開,2而且民主政治建構的基本預設就是社 團及政黨的競爭,提供不同的理念想法、 論述、及政策,這些資訊在自由流通的社 會中,由選民做區別及選擇,或由選民選 出的代表來服務、說明、溝通、匯整,形 成公共政策。這中間的過程,不論流向為 何,3關鍵的元素是資訊及說服的能力 ____________________________________ 1 這些席次數字,均已剛選完時為準。其後陸續有 些變動,但多黨的基本結構是不動的。 2 其他的條件當然還有,如公開、公平、公正的競 爭遊戲規則,一定程度公民集會結社自由權的保障 等等,其實這些條件要共同建構,或共同促成的還 是資訊的流通公開,才能讓公民做決定是在有較充 分的資訊及說明情況下。這是以「民」為「主」的 基本理念,雖然在現實中不全然如此。資訊對民主 過程的重要及關鍵,可參見Ferejohn &
Kuklinski(1990)所編 Information & Democratic Processes, Chicago: University of Illinois Press。 3 流向,有菁英說,有多元說,也有網路說,本計 畫陸續會做些說明。決策理論也說到有「理性模式」
(Dawns, 1956; Ferejohn & Kuklinski, eds, 1990),民主政治能走的穩健成熟,似乎 也就建置在這兩項元素的受到重視,並有 公平的遊戲規則,讓這兩項元素不受壓制 的流通、發揮。 台灣的民主政治似乎正走到這關鍵時 刻,由最初步的反對勢力存在,正式成立 反對黨,到推動各種公平的競賽規則,同 時發展市民社會,建立資訊流通的社會 等,到尋求資訊能有公平產出的機會;同 時,詮釋及運用資訊,成為論述,和不同 的論述可以公平競逐,以促進公共政策的 決議較能有深思熟慮(deliberative)的過程 等。台灣目前立法院中的多黨競逐,或某 種藍、綠結盟,對抗的現象,是不是有這 種促進民主品質提升的效果呢?或者,更 規範一點的說法,能不能逐步導入到一種 重視資訊、專業,理性辯論,說服妥協, 再做成決議的較成熟的民主運作模式呢? 再用最通俗的說法,就是台灣國會中政黨 競爭現象,能不能讓國會的立法表現,整 體上逐漸展現「重視是非,而不是只有立 場」?這是本研究的基本關懷。 (二) 研究目的 本著上述對台灣民主發展成熟度的關 懷,本研究試圖探討立法院從一黨獨大(主 要為第四屆)到多黨並行(主要為第五屆) 局面,所形成的不同競爭態勢下,其立法 表現究竟有沒有較理性化的發展傾向?也 就是立法院的立法過程中,是不是有更重 視資訊蒐求的現象?蒐求的對象有更強調 專業的傾向?而在新生立法議題的資訊網 絡發展上,政黨間是否逐漸有交叉辯論, 說服妥協,並可接受對方論點的現象? 這 些 層 面 的深入了解,在研究方法 上,也必須有所突破,所以本研究除運用 社會科學領域常運用的文獻分析、內容分 析等方法,也進行跨領域合作,與資訊管 理的林福仁教授(見個人資料表)共同提 出計畫,研議研究方法,運用他們正在發 的專家專業引導觀點;有「有限理性」模式的專業 與群眾的共同引導說;有「漸進改革」的脫離群眾 的模式;也有「垃圾箱」的流向混亂模式。可參考 Kingdom(1984), Agendas, Alternatives, and Public Policies, Boston: Little Brown。
展應用的data mining 技術,來進行立法院 相關立法資訊的分析(詳細內容在研究方 法部分會敘述)。 綜上,本研究希望達成的研究目的為: 1. 探討並建構民主國家(含新興民主國 家)中,國會審議法案的可能資訊蒐 求習慣及資訊網絡類型。 2. 系統的蒐集整理立法院第四屆、第五 屆審議法案的資訊蒐求情形。 3. 運用資訊的 data mining(資訊探勘) 技術,挖掘關於第四屆、第五屆新制 定法案的資訊網絡的廣度及深度。 4. 從立法院第四屆、第五屆的立法表現 中,歸納研討新興民主國家政黨競爭 對公共政策研議制定的影響。 5. 提出理論上及實務上,提昇民主品質 的可能路徑及方法。 三、第一年期計畫研究進度 依本計畫三年期內所設定第一年期的 目標為: 1. 完成整理相關文獻、規劃理論概念。 2. 完成第四屆立法院法案審議的資訊蒐 求資料登錄。 3. 完成立法院審議法案資訊網絡的本體 建構,含法案制定過程的資訊描述架 構確立,領域知識庫的建立,研究單 元定義與法案挑選,資料結構化等四 步驟。 現分別說明每一目標的執行情形: 1. 已大體完成相關文獻整理,請參見 五、參考文獻項。但並不排除未來相 關文獻的繼續收錄,因為研究的期程 有三年,新的文獻仍會持續出現。 2. 已完成第四屆立法院法案審議資訊蒐 求的資料登錄及鍵入,參見附錄一的 登錄格式及登錄工作人員名單。 3. 第一年因為是初步嘗試將 data mining 技術帶入到立法院法案審議的相關資 料做分析,為了謹慎起見,特挑選立 法院第四及第五屆都審議過的「兩岸 人民關係條例」為分析對象,並聚焦 於第四屆的第六修,以及第五屆的第 七修,建立相關資訊網絡的本體,完 成資料的結構化。但全面性抽樣各類
法案,以了解第四屆與第五屆整體在 資訊網絡及蒐求上的差異,目前還未 進行,實待在一個法案跨界比較後, 各方面在data mining 上可能出現的問 題,能較精確的修訂及測試穩定後, 再 推 廣 於 有代表性的樣本法案做分 析,會比較符合科學步驟小心求證的 精神。 目前立法院第四、第五屆有關「兩岸 人民關係條例」審議的立法院及媒體相關 資料的結構化處理情形,請參見附錄二。 四、第一年期計畫的初步成果 已撰寫成兩篇論文――「資料探勘在 國會立法研究之應用——以第四、第五屆 立法院審議『兩岸人民關係條例』為個案」 (見附錄三),以及「政黨競爭與民主品 質——立法院第四屆及第五屆審議『兩岸 人民關係條例』蒐求資訊網絡的比較探討」 (見附錄四),分別發表於佛光大學「第四屆 政治與資訊科技研討會」(93.4.15-16),及 中國政治學會於成功大學舉行的年會 (93.9.18-19)。後者正投稿等待刊出中。 五、參考文獻 見附錄四「政黨競爭與民主品質—— 立法院第四屆及第五屆審議『兩岸人民關 係條例』蒐求資訊網絡的比較探討」一文 所附之參考文獻。
附錄一:【立法院公報】委員會登錄格式@第四屆880201 至 910118 ★ 一條委員會開會紀錄為一則登錄單元 進行時間:92 學年度的寒假期間(2004/2-2004/3) 項目 一、ID 二、屆期 三、卷期冊 四、起頁 五、會議日期 六、參與開會的委員會數目 七、參與開會的委員會名稱 八、委員會會議性質 九、委員會中審查議案的法編號 十、受邀的出列席人員數 十一、受邀者全部發言次數 十二、受邀出列席人不同背景的人數 十三、受邀出列席不同背景的種類數 十四、受邀(中央和地方)政府官員的職級個數 十五、受邀專家學者的背景 十六、受邀利益團體代表的背景人數 十七、立委在委員會中全部發言次數 十八、立委不同政黨背景發言次數(此題總和為十七題答案) 十九、區域、不分區、原住民、僑選立委發言次數(此題總和為十七題答案) 廿、男性、女性立委發言次數(此題總和為十七題答案) 廿一、被立委特別指定發言的受邀者背景發言次數 廿二、某一職級(中央和地方)政府官員被立委指定發言的次數 工作人員名單 姓名 職稱 王英獎 研究計畫專任助理 蔡雨臣 政治所碩士生 游凱詒 政治所碩士生 林琮崴 政治所碩士生 張峻豪 政治所博士生 劉子昱 政治所碩士生
附錄二 設計者:梁家豪 新聞事件導覽系統 http://140.117.76.210/PolMine/ 此系統是匯整兩岸人民關係條例的相關報導,依報告所提之方式,將相似的報 導群聚在一起,提供針對兩岸人民關係條例所討論的議題和參與討論之參與者,並 透過系統介面的整合,讓使用者可以快速地做交互查詢,從議題到參與者或是從參 與者到議題皆可以。另外,系統也將參與者的言論做一列表,使用者可以清楚了解 該參與者在此議題中發言情況。 系統呈現的結果,先透過左邊視窗選擇時間區段後,會列出該時間區段內的議 題,點選議題後,則會顯示該議題內討論的新聞和參與者,並在右方視窗會列出此 議題中的重要詞彙、參與者及相關統計資料。當點選新聞後,則會顯示新聞的原文, 方便使用者了解事件的報導。若點選參與者,會顯示其發言與被提及的情況,若該 參與者有參與其他議題,亦可以在視窗中顯示。下方的時間軸圖,則會顯示相關新 聞出現的時間點當天的新聞數和利用顏色來區分新聞出現頻率,例如,若新聞數為 2 時,顯示藍色,大於 3 時,會顯示紅色,讓使用者可以快速了解哪天被報導情況 最高。除此之外,亦標註出法案修定重要事件時間,方便使用者了解事情發展的始 末。而右方中間的文字方塊,可以做為使用者回饋的機制,自行記錄與該事件相關 的資料,以做為日後研究所用。 內文分析工具 http://140.117.76.210/ContAnal/ 此系統是提供質性文本分析的工具,透過系統化的方式,協助使用者在文句的 標定,議向的判斷上,提供一輔助工具。亦可以讓不同的研究者,在同時針對某一 參與者在某一議題上的傾向上,做出註解,並可供後續分析研究之用。 在登入系統後,研究者可以先選擇欲分析的文本,而文本則會先依據不同的參 與者區分成數個區塊,研究者可以透過系統提供的介面,進行區塊的調整,以確定 分析的標的對象。調整完區塊後,研究者可以點取某一區塊進行分析,並選取參與 者和議題,填寫意向後儲存。若該區塊有多個參與者,研究者亦可以點選「增加參 與者」,設定多個參與者。當所有的資料都收集完成後,可做為後續研究分析使用。
附錄三
資料探勘在國會立法研究之應用——
以第四、第五屆立法院審議
「兩岸人民關係條例」為個案
* 摘要 本文試圖用資料探勘(data mining)技術,來挖掘國會立法過程中的資訊網 路,以探知在一個法案的審議及修訂過程中,who said what, when, how, why。選 定的探測標的為台灣立法院第四及第五屆都審議修訂過的「兩岸人民關係條 例」,因為第四及第五屆的立院內部政黨結構有重大變遷(原國民黨較獨大;現 多黨並立,而民進黨為第一大黨),值得了解是否牽動其立法資訊網路的變化, 進而是否有促進立法品質的效果。 本文擬輸入做探勘的資料,包括立法院公報所載有關第四及第五屆討論修 訂本法案的所有記錄,及相同時期主要媒體有關本法案的報導或評析(以聯合知 識庫及中時資料庫收錄者為主)。 本文預計除了探測因國會內政黨結構不同是否造成立法品質差異的政治學 議題外,尤其應用資料探勘技術在國會立法研究上,不僅是政治學研究方法的突 破,也是資訊技術更融入人文社會的新嘗試。廖達琪、林福仁、梁家豪
** 論文發表於佛光人文社會學院『第四屆政治與資訊科技研討會』 中華民國九十三年四月十五、十六日 宜蘭縣礁溪鄉佛光人文社會學院 ____________________________________ *本文要特別感謝國科會對〈立法院立法表現之研究—第四屆與第五屆審議法案的資訊蒐求及資 訊網絡之比較(I)〉(NSC92-2414-H-110-005)研究計畫的補助。 **廖達琪為中山大學政治所教授;林福仁為中山大學資管系教授;梁家豪為中山大學資管所碩士 研究生。壹、 前言
立法院無疑目前已是台灣政治運作的重要核心之一。尤其公元 2000 年總統大選 後,行政部門已有了政黨輪替,由原來居於反對黨地位的民進黨取得總統大位,主導行 政大權,而立法院因原來執政的國民黨仍擁有國會過半的席次(115 席),而形成與行 政部門分立,並有所謂「朝小野大」的現象。接著 2001 年底的立法院選舉,主導行政 部門的民進黨,雖然成為國會的第一大黨(87 席),但仍未過半(113 席),且國民黨 仍有68 席,親民黨有 46 席,台聯有 13 席,無黨籍 10 席,新黨 1 席,出現的局面是多 黨不過半。4 國會中的政治角力,合縱連橫,幾乎是經常上演的連續劇,相關的研究也 陸續出現(黃秀端,2002;楊婉瑩,2002)。 這種國會中的政黨運作、同盟或對抗,原是民主國家的常態(Dodd, 1976; de Swaan, 1973; Laver & Shepsle, 1996; Lavor & Schofield, 1998)。但對台灣這樣的新興民主國家而 言,卻可能還要經過嘗試摸索、學習的階段,即便是媒體或一般大眾,都還不習慣多黨 在國會中所形成似乎相當紛亂的局面。但民主政治的古典理論或經驗事實似都肯定多黨 競爭,甚至衝突,對公共政策品質的提升,及人民福祉的保障,應有正面的效果(Dahl, 1971; Held, 1988; Klingemann, Hofferbert, Budge, 1994; Eldersveld, 1998; Przeworski et al., 2000; Przeworski et al., 1999)。所以民主建置的首要條件,就是要允許反對力量的存在, 保障反對黨的成立(Dahl; 1967; 71),其他相應的條件,主要就是資訊的流通公開,5而 且民主政治建構的基本預設就是社團及政黨的競爭,提供不同的理念想法、論述、及政 策,這些資訊在自由流通的社會中,由選民做區別及選擇,或由選民選出的代表來服務、 說明、溝通、匯整,形成公共政策。這中間的過程,不論流向為何,6關鍵的元素是資 訊及說服的能力(Downs, 1956; Ferejohn & Kuklinski, eds, 1990),民主政治能走的穩健 成熟,似乎也就建置在這兩項元素的受到重視,並有公平的遊戲規則,讓這兩項元素不 受壓制的流通、發揮。 台灣的民主政治似乎正走到這關鍵時刻,由最初步的反對勢力存在,正式成立反對 黨,到推動各種公平的競賽規則,同時發展市民社會,建立資訊流通的社會等,到尋求 資訊能有公平產出的機會;同時,詮釋及運用資訊,成為論述,和不同的論述可以公平 競逐,以促進公共政策的決議較能有深思熟慮(deliberative)的過程等。台灣目前立法 院中的多黨競逐,或某種藍、綠結盟,對抗的現象,是不是有這種促進民主品質提升的 效果呢?或者,更規範一點的說法,能不能逐步導入到一種重視資訊、專業,理性辯論, 說服妥協,再做成決議的較成熟的民主運作模式呢?再用最通俗的說法,就是台灣國會 中政黨競爭現象,能不能讓國會的立法表現,整體上逐漸展現「重視是非,而不是只有 ____________________________________ 4 這些席次數字,均已剛選完時為準。其後陸續有些變動,但多黨的基本結構是不動的。 5 其他的條件當然還有,如公開、公平、公正的競爭遊戲規則,一定程度公民集會結社自由權的保障等等, 其實這些條件要共同建構,或共同促成的還是資訊的流通公開,才能讓公民做決定是在有較充分的資訊 及說明情況下。這是以「民」為「主」的基本理念,雖然在現實中不全然如此。資訊對民主過程的重要 及關鍵,可參見Ferejohn & Kuklinski(1990)所編 Information & Democratic Processes, Chicago: University of Illinois Press。6 流向,有菁英說,有多元說,也有網路說,本文陸續會做些說明。決策理論也說到有「理性模式」的專 家專業引導觀點;有「有限理性」模式的專業與群眾的共同引導說;有「漸進改革」的脫離群眾的模式; 也有「垃圾箱」的流向混亂模式。可參考Kingdom(1984), Agendas, Alternatives, and Public Policies, Boston: Little Brown。
立場」?這是本文的基本關懷。 本著上述對台灣民主發展成熟度的關懷,本文試圖探討立法院從一黨獨大(主要為 第四屆)到多黨並行(主要為第五屆)局面,所形成的不同競爭態勢下,其立法表現究 竟有沒有較理性化的發展傾向?也就是立法院的立法過程中,是不是有更重視資訊蒐求 的現象?蒐求的對象有更強調專業的傾向?而在新生立法議題的資訊網絡發展上,政黨 間是否逐漸有交叉辯論,說服妥協,並可接受對方論點的現象? 這些層面的深入了解,在研究方法上,也必須有所突破。本文即呈現運用資料探勘 (Data Mining)技術,來做國會在不同階段立法資訊網絡分析的初步成果。因仍屬嘗試 階段,先選用一個法案做分析探勘的對象,這個法案即「台灣地區與大陸地區人民關係 條例」(簡稱「兩岸人民關係條例」),選取的過程及理由會在後文中說明。同時受限 於時間,本文所呈現資料探勘的成果,較聚焦於立法資訊蒐求對象的廣度及重視專業化 的程度,尚未觸及政黨間的交叉辯論,說服妥協等較深度資訊網絡發展之部分。 本文計分伍部分。壹為此前言,貳為理論假設,主要整理國會立法決策與資訊蒐求、 資訊網絡等相關文獻,並歸納本文的理論依據,提出相關假設。參為研究方法,一方面 說明個案挑選的理由及限制,一方面呈現資料探勘技術運用的步驟及過程。肆為結果分 析,主要展示資料探勘個案的成果,並與假設做對照及檢討,伍為結論。
貳、 理論假設
立法機構審議法案的資訊蒐求及資訊網絡的直接研究在文獻上並不多見。但如果從 組織學的角度以及國會決策過程來做理論探索,則可有相當豐富的資料。下面就從組織 理論,及國會決策研究兩大方面,來整理相關的發現及理論意涵。一、 資訊蒐求
首先在組織理論的範疇中,有關資訊蒐求的探討,幾乎相當一致的看法是:不可 能完整而全面的向所有的資訊來源去求取,一定會有「偏見」(bias)存在。而這個 「偏見」,有些研究認為是受社會環境的影響(Cyert & March, 1963; Huckfeldt & Sprague, 1987; Kuhn, 1970; Pettigrew, 1979; Pfeffer, 1980; Pfeffer & Leong, 1977; Pondy, 1977; Sproull, 1981; Wilensky, 1964)。有些則認為是因為人本身認知或情緒因素所造 成的限制(Downs, 1957; Greenwald, 1980; Nisbett & Ross, 1981; Tversky & Kahneman, 1974)。有些則將這種資訊蒐求不可避免的「偏見」歸因於文化因素(Feldman & March, 1981; Geertz, 1973; Lincoln, et al., 1981; Meyer & Rowan, 1977; Sampson, 1981)。綜合而言,組織理論中,各家對組織的資訊蒐求的共識是來源的有限多元(Limited pluralism),而造成「有限」的方向及因素則視研究的途徑及架構而定。
在國會這樣的組織中,7它的資訊蒐求習慣是否也呈現組織理論所揭發的「偏見」 ____________________________________
7 應用組織學研究立法機構,最早為 D.W. Brady,在 1981 年發表”Toward a Diachronic Analysis of Congress”, in APSR(Fall): 988-1006,引起頗多反響,研究立法機構的著名學者如 Nelson W. Polsby 及 S. C. Patterson 都曾為文批評,附載於Brady 之文後,但 Patterson 日後研究取向,相當接受組織學之概念,而致力於立 法機關做為一整體組織,對外表現所受到評價的跨國比較,可參見L. Longley, op. Cit., Ch6, p.86-106,
現象呢?相關的文獻顯示似也確實如此。
大體而言,有關國會的決策研究,也受切入的角度或途徑之影響,而對其資訊蒐 求「偏見」的方向,有不同的發現及詮釋。一樣從組織的角度切入,Jacobs & Rich(1987) 基本預設任何組織就是要避免不確定性,為了要維持一個較確定的環境,組織會對環 境規劃出不同的情境,並準備應付各不同情境的標準操作程序(Standard Operating Procedure, SOP )。根據這一套預設,Jacobs & Rich 應用到美國國會次委員會 (subcommittee ) 的 決 策 情 境 的 資 訊 蒐 求 情 形 , 他 們 將 決 策 粗 分 為 有 問 題 的 (problematic)及沒有問題的(non-problematic)兩種,然後提出他們的理論預設是: 沒有問題的情境中(正常的)組織標準操作程序下的資訊蒐求是喜歡內部資訊來源超 過外部的;但在有問題的情境下,資訊蒐求的對象較不可預測(1987,頁 8)。Jacobs & Rich 也進一步定義所謂的問題情境為「新的、複雜的,或以前並未得出滿意決議而 一直有爭議的」(頁13)。而所謂內部、外部之區分,則是以組織的疆界或程序規定 為依歸。他們用國會次委員會所邀請的資訊提供者(informants)的背景為資料所做的 分析,與他們的理論預設還若合符節。
但無論如何,Jacobs & Rich 對問題情境的定義,及資訊來源的內、外部之分,還 是不免模糊,也有時空條件的問題。所以,Feldman & March(1981)這一派學者,則 主張大的文化情境其實才是型塑SOP,並影響組織資訊蒐求方式及方向的重要因素。 比如,西方文化重視「理性」,所以,一些被視為應是講求理性的機構,如國會,資 訊蒐求上應會重視相關性,講求專業性,呈現出「知識就是權力」的架勢。相對的, 在東方社會,較沒有所謂講求「理性」的傳統,即使如國會機關,依據廖達琪90 年代 的研究,在資訊蒐求上,仍是較強調「地位是知識」或「官大學問大」(1990,1991)。 但這種情況在台灣民主化的持續發展,政黨競爭的紮實出現後,是不是有可能改變, 或是至少有相當程度的變化,而植入一些西方民主競爭體制所強調的「理性」價值, 從而在國會的資訊蒐求習慣上,有「理性化」的傾向出現,則是其論文無法答覆的。 除了組織的角度,從政治的角度切入,關於立法機關決策的討論,文獻豐富,雖 不是直接從資訊蒐求或資訊網絡的觀點來分析,但因決策必然有某種資訊情報的聯結 (Downs, 1957; March & Olsen, 1976; Wildavsky, 1979; Padgett, 1980; Feldman, 1989; Simon, 1956; Nelson & Winter, 1982),所以從決策模式中,或可推想立法者個人,立 法機構的委員會,或立法機構整體可能的資訊蒐求及資訊網絡模式。下面的文獻評述, 擬綜合這三層次,而以資訊蒐求可能的對象及資訊網絡建構的可能方向為歸納標的, 來做整體的整理及評述。 首先,就資訊蒐求可能的對象而言,大體可歸納為下列七大類: 1. 政黨取向:也就是不論委員層次的投票決定,委員會層次的審議法案,院會層次 的決議,政黨的立場,或黨鞭的指揮,扮演最重要的訊息提供角色。這在一般國 會決策研究中,常被稱為「政黨中心模式」(Cox and McCubbins, 1993; Kiewiet & McCubbins, 1991; 黃秀端,2000),這一模式雖是傳統支持政黨政治者的理想
另亦可參見Barry R. Weingast & William Marshall, 1988, “The Industrial Organization of Congress; or, Why Legislatures, Like Firms, Are Not Organized as Markets, Journal of Political Economy (96):132-63。
(Sundquist, 1992; Crowe, 1986),但在國會的政治現實中,尤其是以美國國會做 研究標的的相關文獻,「政黨取向」的資訊蒐求模式並不強(Cox & McCubbins, 1991; Clausen, 1973; Herbert & Weisberg, 1978; Collie, 1984; Collie & Brady, 1985; Brady, 1979)。 針對台灣立法院的相關研究,「政黨取向」的資訊蒐求及決策模式,雖是台 灣整個政體民主化以後才成為研究焦點,但所得發現都還未到定論的時候。如盛 杏湲(2000)以第三屆立委為對象所做的探討,當時國民黨仍是立院過半、行政 執政的政黨,但已發現立委(尤其國民黨)的代表取向與行為已漸不受政黨指揮, 而傾向選區(頁56-57)。公元 2000 年,行政部門的政黨輪替後,台灣亦引進分 立政府的概念(divided government),8來探討立法院的決策過程,如黃秀端 (2002),以第四屆及第五屆第一會期立法院內所有記名表決資料分析,得到結 果顯示一致政府時期,立委投票結盟的政黨取向較弱;但在分立時期,政黨團結 度較高。不過黃文也承認,記名表決只是院會決議的一種,還有其他決策方式(頁 20),立法委員的立場,或蒐求決策資訊的依據,並不能探知。所以,楊婉瑩(2002) 同樣是分立的角度,探討立法院決策過程的轉變,但完全以第四屆立委為對象, 並不僅包括記名投票記錄,也包括黨團提案,立法產出等指標,所得結果卻是「政 黨取向」並不是那麼強,政黨間因許多因素進行交換合作的機率仍高(頁29)。 這似也表示了,立法院做決議或決策的資訊蒐求有其多元的面向。另,楊文也承 認,用分立/一致的概念來研究目前的立院決策現象,時期太短(2000-2002), 資料量不夠,很難有定論。 綜上,「政黨取向」應是立法機構決策,不論在那一層次,都有其重要性及 慣例性的資訊蒐求面向之一。 2. 選區取向:也就是立法者做決策的主要資訊蒐求對象,是他/她所隸屬選區選民的 態度。這一面向的資訊蒐求主要出現在立法者個人層次,較少出現在委員會及院 會層次,但並不代表不影響委員會或院會的決議結果(Fiorina, 1980; Jacobson, 1992)。 「選區取向」的議員資訊蒐求及立法行為,從文獻上看來特別是受到各個政 府體制(內閣或總統制)、選舉制度及相應的政黨體系的影響(盛杏湲,2000; Crowe, 1986; Carey & Shugart, 1995)。如美國的總統制形成行政、立法分立制衡, 單一選區但兩黨體系較鬆散,國會議員比較要靠自己經營選區來求得當選,就會 比較考量選區的需求,在國會中行事(Mayhew, 1974; Carey & Shugart, 1995)。 反觀,台灣的體制,依盛杏湲的分析,雙首長制對立法委員的立法或決策行為沒 什麼直接影響,但選舉制度及政黨體系扮演關鍵因素(頁43)。尤其 1980 年中 期以後,因為國民黨輔選力量的漸弱,民進黨的崛起,加以複數選區鼓勵黨內競 爭,促動立委爭取個人選票,而形成立委的行事與行為比較展現「選區取向」(頁 43-60)。這種「選區取向」會不會受到公元 2001 年以後,立院內多黨競爭,政 黨合縱連橫的強力需求,而有所改變?也就是立委在做決策時,「選區」的需求 是不是仍是重要的資訊蒐求來源,而形成對集體決議結果的影響,目前是無法得 ____________________________________ 8 參見吳重禮,2000,「美國分立性;政府研究文獻之評析:兼論台灣地區政治發展」,問題與研究,第 39 卷第 3 期,頁 75-101。
知。
3. 意識型態取向:也就是不同的意識型態成為決策資訊來源,可以主導國會議員從 個體累積到集體層次的投票決定。美國的學者曾嘗試用所謂自由/保守的面向來分 析院會中的投票結果(Schneider, 1989; Poole, 1988; Poole & Rosenthal, 1985; Poole & Daniels, 1985),並認為這一單一面向意識型態連續光譜,有相當高的解釋力 (黃秀端,2002)。但有些學者也持不同看法,認為影響的面向更複雜(Wilcox and Clausen, 1991; Kingdom, 1989)。在台灣,統獨意識型態常被認為相當主導選 民投票,並由此分割政黨立場(王甫昌,1994;吳乃德,1992;胡佛等,1994; 陳文俊,1995;盛杏湲,2002),是否也成為立法委員議事投票的資訊來源呢? 盛杏湲(2002)的研究顯示,立法委員對統獨立場策略應用的居多,即多與自己 選區特質及政黨立場結合(頁16),但不能說沒有「意識型態」取向的考量。且 盛的研究主要以第三屆立委為焦點,同樣,第四屆、第五屆不同政黨結構形成的 競爭態勢,所謂「泛藍」、「泛綠」的結盟傾向(黃秀端,2002),是不是意識 型態做決策資訊的依據,有更強化的情形呢?也有進一步再探究的必要。 4. 政務官:這是指立法者個人,及委員會,習於從行政部門的政務官,蒐求資訊。 這種情形在美國國會並不多見,反而是事務官(bureaucrats),常是資訊的來源 (Jacobs & Rich, 1987; Nash & Scott, 1999)。但針對國內情形,廖達琪以 1967 到 69,及 1986 到 88 的立法院各委員會邀請的資訊提供者(informants)背景為 分析素材,發現「政務官」確實有較受重視的現象,而不是對法案或議題較有深 入了解,或較具專業的「事務官」(1990,1991)。這種「官大學問大」的資訊 蒐求傾向,至今是不是仍存在立法院中?也很值得探究。 5. 媒體:這是指立法者及委員會,會以媒體對法案或議題重視的程度,主張的方向, 為重要的決策參考資訊。Price(1978)就提出媒體報導多(high-salience),衝 突性低的議題,國會議員會爭相表示意見,委員會也會積極處理與其相關的法 案。媒體報導少又有衝突性的,一般國會議員不會積極涉入,委員會也會拖延相 關法案的審查;而媒體報導多,而衝突性又高的,議員及相關委員會的反應就變 異比較大(頁 548-573)。在台灣,有關媒體報導與立法委員行為,或立法院議 事方向及決議結果的探討,實不多見。目前,廖達琪所進行國科會計畫「立法院 與台灣地區政治民主化(III)」,正從事這方面的資料蒐集對比;而蔡育倫(2002) 用廖達琪所蒐集資料,撰成的碩士論文「台灣民主化歷程中政治菁英、選舉機制 及媒體的角色探討----以第一屆立法委員的退職歷程為個案」,確實顯示媒體的 報導,與立法院的決策行動有推波助瀾,相互加強的效果(頁69-96)。所以「媒 體」做為立法者及立法機構的資訊來源之一,應是值得多加探測了解的。 6. 利益團體:利益團體會提供相關資訊給立法者或立法機構以形成對其有利之決 議,已是國會研究的常識。從最早的鐵三角理論(Bentley, 1908; Griffith, 1939; Freeman, 1955),將利益團體、行政官僚、議員視為主導公共決策的關鍵角色; 到中期將利益團體的影響力,定位為「偏見的動員」(mobilization of bias),試 圖供應各種資訊,來防杜有利於它的法案遭到修正(Bachrach & Baratz, 1962: 947-952);到近期,鐵三角論受到挑戰,有所謂議題網路(issue network)模式 (Heclo, 1978; Kingdom, 1984),但在這個以議題為中心的網路中,利益團體也 仍是不可或缺的一環,只是因為公共政策制定的參與者更趨複雜,資訊流通互動 的網路也不是「三角」足以模擬;但利益團體做為資訊提供的角色之一,仍是不 變。 7. 專家:立法者或立法機構向相關專家求取資訊,以為決策之依據,似乎是議會政
治或民主政治應有的模式(Ferejohn & Kuklinski, 1990; Muir, 1982; Robinson & Wellborn, 1991),經驗上雖不全然如理想,但一些研究確實顯示,專業資訊在國 會中受到重視。尤以美國國會而言,這種趨勢似更見明顯。這些專業資訊可能來 自行政官僚(專業的),相關的學者專家,在某一問題浸潤已久的國會同僚,國 會助理,甚至利益團體的代表也會提供相關領域的專業知識(Keith & Krehbiel, 1991; Kingdom, 1989; Muir, 1982; Balutis, 1977, Smith, 1990)。即是在台灣的立法 院,廖達琪(1990)的研究也顯示,常任文官經常要出席立法院委員會提供資訊, 外部的學者、專家也偶爾受邀出席某一新生法案的公聽會,或較具特殊性的座談 會(頁91-171),雖然他們的重要性似乎不如高階的主管及政務官。向專家求取 資訊以為問政、討論、決議法案的依據,既是國會政治的理念,也有民主先進國 的榜樣,實應持續探測了解我國立法院在民主化持續發展中,政黨又有實質競爭 情境下,是不是更重視「專業的意見」。 以上七項為根據現有文獻,歸納出國會議員個人或機構可能蒐集資訊的對象。從 這些歸納討論中,也可以看出來,國會議員個人,或國會委員會,甚至國會整體,並 不是針對每個法案,都一定向這七種對象蒐求資訊,而每一對象的資訊提供角色也是 或明或暗。按照慣例(routine)或國會規則(rules),一定有其經常蒐求的類型或習 慣,比如政黨及選區就被認為是較根本的,而行政官員,也是國會規則中(不論那一 類國會),必要的資訊提供者,只是其職級、官等大小,與他/她是否能提供適當資訊 的關係,恐怕就是有可變性了。整體而言,尤其以美國的經驗而論,似乎有一發展趨 勢,就是隨民主發展、科技進步(網路發達),不論慣例性的會議或特殊的情況(如 新法案召開公聽會),國會資訊蒐求的對象,會較廣,但似也會更要求專業。這一趨 勢有沒有逐漸出現在台灣的立法院呢?這也成為本文試圖探討的焦點問題。
二、 資訊網絡
以上為針對國會審議及通過法案的可能資訊蒐求對象的歸納整理,至於相對的資 訊網絡應該會是什麼樣貌,相關的研究更是稀少。畢竟,「網絡」(network)的概念, 及實際普及於生活各層面,是晚近10 幾年的事。如果要從國會決策的角度探討,最早 有「資訊網絡」概念,應是鐵三角理論,因為這裡面牽涉了參與角色、訊息、及影響 力(Bentley, 1908; Mills, 1956; Griffith, 1939; Freeman, 1955)。不過這個資訊網絡,如 前所述,顯然是過度簡化了公共決策背後參與者、資訊流通、及意見發展改變的複雜 度。所以Heclo(1978)提出議題網絡(issue network)的概念,認為影響公共決策的 意見提供者,不是只有官僚、民意代表、及利益團體,還有各種立場、目標不盡相同 的個人、組織。這些參與者,往往因議題(issue)的興起而聚集,因議題的結束而解 散,組成份子也因議題的不同而差異甚大。 這個議題網絡概念的運用,到目前為止,主要是在廣泛的公共政策型塑過程,所 以挖掘的是各式利益團體對不同議題的合縱連橫關係及資訊交流(Choe, 2001; Heaney, 2001),或是從行政部門的角度考量,如何對新生議題,以議題網路的方式,引起有 興趣的各方,參與討論,提供意見,或交流想法(Heclo, 1978)。應用到議會方面審 議議案的網絡發展情形,反而是學資訊管理的莊澤生(2002),他運用 Data Mining 技術,在指導教授林福仁(本文共同作者)的協助下,以高雄市議會有關「市港合一」 這一議題的研討經過,建構議題網路。從他的初步應用裡,Data Mining 技術主要挖掘出:1.參與者群集(那一些人常意見相同),2.關鍵參與者及關鍵子議題及其網路演進 分析。 莊文因係應用Data Mining 技術到議會方面的初步嘗試,資料採擷上因擔心高雄 市議會本身所記錄「市港合一」討論的資料不完整,所以完全以媒體的相關報導為分 析素材,增加不少網路資訊效能評估成本(45-55)。 綜上,從國會立法決策的資訊網絡角度思考,目前文獻很少直接涉及,但並不表 示這個網路不存在,尤其有資訊管理的各種技術後,更可以做某種程度的挖掘發現。 從文獻上看,國會立法決策的資訊網絡應該也是由簡而繁,特別是對新生的法案、議 題。這個複雜化的傾向,可能牽涉到廣與深兩個面向,廣的是參與者背景方面,如同 前面關於資訊蒐求對象部分,尤其台灣的立法院進入政黨強力競爭時期,廣邀不同背 景的參與者,加入討論新生法案,應是可能的趨勢。至於深的面向,則可能牽涉到四 種變化趨勢: 1. 是參與者群集的複雜化,如跨黨派、跨選區、跨利益背景者也有交集,呈現出某 些共同觀點。或者說意見常相同的一群人出現的頻率不是那麼高。 2. 觀點轉變的路徑也趨於更曲折,也就是不限於同群集間說服轉變,較常出現因觀 點轉變,而群集重組的現象。 3. 法案最後版本的依據,來自專業背景的參與者,較多於其他政治性背景者。 4. 法案審查中,關鍵觀點、意見轉變發展的時間幅度可能由較短到較長。 以上這四點預估的變化趨勢,含有較重的理想性,尤其台灣的立法院,進入結實 的政黨競爭時期,不過是這二、三年間的事,而台灣整體大環境的快速民主化歷程, 也不過是 15 年左右的經驗(1987-2003),若國會審議法案的資訊蒐求及資訊網絡, 有向廣度擴張的趨勢,並較追求專業化,已是民主的進步,也讓人肯定政黨競爭做為 民主政治的基石,有其理論及實務上的價值。這也成為本文的基本假設,也就是台灣 呈現政黨互動競爭的第五屆立法院應比第四屆更重視資訊蒐求的廣度及專業性,以強 化競爭能力。事實情況是否如此呢?
參、 研究方法
一、 個案挑選
運用資料探勘技術來挖掘國會審議法案的資訊網絡,如前所述,幾乎是中外文獻 上的空白,本文做為初步嘗試,選擇以個別法案的審議情形先做實驗性的探測,再檢 討修正擴大應用至立法院第四屆及第五屆的整體情形。所挑的個案為「台灣地區與大 陸地區人民關係條例」,挑選的理由為: 1. 本法案在第四屆、第五屆立法院均被討論修訂過:第五屆且已修訂過兩次,第一 次為2002 年 4 月 2 日三讀通過,修正三條;第二次為 2003 年 10 月 9 日三讀通 過,增修 74 條,第二次可說是大修。基於第四、第五屆能較對等平行考量,而 第四屆的修正亦僅為三條,外增訂一條(見附錄一),與第五屆第一次的修訂規 模差不多(見附錄二),乃主要選取第五屆第一次的修訂情形與第四屆進行比較。2. 本法案在第四及第五屆的修正,都不是以新法案的姿態出現:第四屆是第六修, 第五屆第一次是第七修,依照理論推演,舊的而非新的問題情境,資訊蒐求會呈 現所謂已較規制化的情形(SOP),從而比較能突顯政黨結構不同對規制化的蒐 求資訊,會有什麼影響,也就是扣緊本文的主要關切。 3. 相對的媒體報導資料較可尋得:因為資料探勘有處理大量資料的優勢,所以本文 在研究設計上,一直將媒體資訊列為法案資訊蒐求及資訊網絡發展的重要媒介之 一,也突破以前相關研究在這方面的力有未逮,所以在確認本法案的前後兩屆審 查期間,均可透過聯合知識庫、中時新聞網資料庫及立法院國會圖書館之立法院 公報查詢系統,蒐集到較完整的媒體資訊,就更確定以此法案的修訂做跨屆的比 較。 4. 考量立法院資料檔儲存立法院公報方式對資料探勘技術使用的便利性:在立法院 的資料檔中,「兩岸人民關係條例」是少數幾近完全以 word 檔來儲存的法案。 立法院第四屆第一、二、三會期的公報資料,尚以 tif 影像檔儲存,不能直接做 資料探勘,必須費時做轉換工作。而本法案小部分的公報記錄仍是影像檔,本研 究亦先完成這部分word 檔之轉換,再進行資料探勘。 依據上述理由,選擇了「兩岸人民關係條例」做資料探勘的實驗,但這個法案也 有一定的限制,現說明在后,並提出在研究上所做的一些補救措施: 1. 第一個限制是時間上的,因為第五屆對本法案的第一次修正通過時間是 2002 年 4 月2 日,其時第五屆立法委員才剛上任不到三個月(2002 年 2 月 1 日就任),這 時候探測立委們的資訊蒐求網絡,時間點早了些,尤其新任立委超過全部的二分 之 一 (114 位 ) ; 相 較 於 第 四 屆 的 修 正 , 立 委 三 年 任 期 已 過 了 將 近 兩 年 (1999.2.1-2000.12.5),前後屆在同一法案上的議事及資訊蒐求的成熟度,顯然 會有差別,平行比較,未見公允。 面對這一限制,本文採取的補救措施,是拉長資料探勘的時間序列,同時包含第 六修(第四屆)及第七修(第五屆)修正時段的前後時期,以互相對照。在時間 的切割上,「六修前」從第四屆立委就任開始算起(1999.2.1),直到六修通過 的後一天(2000.12.6)(為了新聞報導資訊的考量),「六修後」則為再後一天 (2000.12.7),直至第四屆任期結束(2002.1.31)。七修前後的時間切割,儘量 比照辦理,唯第五屆任期尚未結束(結束點為2005.1.31),只能以本文要完成的 時限為考量,切割在 2003 年的 11 月 30 日,讓第五屆立委也有較公平的近兩年 表現時間。(詳細切割時間分段見附錄三) 2. 第二個限制是法案本身具有濃厚的政治性,或意識型態框架,恐怕不具立院審查 一般法案時,蒐求資訊類型的代表性,政治立場或意識型態的影響可能會比其他 法案更深些。關於這個限制,本文的思考是:如果這麼政治性的法案,在資訊蒐 求或資訊網絡的發展上,都有求廣闊,求專業化的趨勢,台灣的政黨競爭才真是 步入鞏固民主的正軌。如果這個法案的資訊網絡沒有朝此方向發展,固然不是民 主鞏固上的一個樂觀訊息,但也不能完全悲觀,還要看看其他面向。所以針對這 個法案,本文在資料探勘上,又再區分出政治性及社會性議題兩塊。所謂社會性 議題,主要是指媒體標示為社會新聞,內容包括因違反「兩岸人民關係條例」而 報導的走私、偷渡、賣淫等事件,其他都歸類為政治議題。本文也企圖做這兩種 議題資訊網絡的比較,探勘第四屆與第五屆有何明顯不同。
二、 資料探勘的步驟與執行過程
1. 步驟 資料的收集可以區分為兩部份,第一部份是屬於正式性公告的資料,如立法院公 報、行政院議案關係文書等,第二部份則是屬於網路上的相關新聞,透過系統自動擷取 的方式,收集與該法案相關的公報及新聞資料,並將公報的Word 格式及新聞的 HTML 格式,轉換為純文字格式。之後,再經由政治領域的專案,將重覆性的新聞或與該法案 相關性過低的文章剔除,完成資料清除的動作。在第三步驟則是擷取文件屬性,將用來 描述該文件的屬性,如新聞的標題、記者、報別、版別、時間等資訊,從文章中擷取出 存放於資料庫中,建立起資料的Metadata。 在完成前三步驟後,使用學者簡立峰(1999)提出基植於 PAT-tree 的中文資訊擷取 方式,擷取出與該法案相關的資訊,並用以提供政治領域的專家,建構與本法案相關知 識本體(Ontology)的依據。透過此一流程,將可以描繪出本法案的主幹(backbone), 使後續資訊處理的過程能有所依據,並有助於提升資訊擷取的成效。 在資料轉換的過程,是要將上述擷取出未結構化的資料,轉換為系統可以處理的格 式,在本步驟可以區分為三個子步驟,分別為詞語分析、重要詞彙篩選及資料正規化的 動作。首先,純文字的資料會經由詞語分析系統 ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System)轉換為單詞,並標註詞性。ICTCLAS(Zhang, Yu, Xiong, Liu, 2003)是由中國大陸中國科學院計算技術研究所,利用隱藏式馬可夫模 型(HMM)針對中文字的詞語分析系統,其可以將一段中文字,分隔成最小的單詞, 並標註其詞性,再透過詞性組合規則,則可將單詞連接成片語。因此透過詞語分析系統, 可將一段文字轉換為個別的詞語,並捨棄其他詞性,僅留下名詞和動詞,做為代表文章 的詞語向量(term vector)。除了區分出名詞和動詞外,亦針對名詞進行 named entities parser 的動作,擷取出人名、地名及組織機構名稱三種不同的特徵值。學者 Hatzivassilogou, Gravano 和 Maganti(2000)提出,透過不同特徵值有助於後續分群的準確度。擷取出的 詞語,根據其不同詞性標註:名詞(noun)、動詞(verb)、人名(nh)、地名(ns)、 組織機構名稱(ni),再透過 XML 格式存儲存。 表一 系統流程匯總表 步驟 任務 描述 步驟一 資料收集 (Data Collection) 透過系統收集與法案相關的資料 步驟二 資料清除 (Data Cleaning) 將與法案不相關資料或重覆性資 料移除 步驟三 文件屬性擷取 (Metadata Collection) 取得描述文件之相關資料,例如日 期、標題、記者等 步驟四 建立知識本體 (Ontology) 透過政治領域的專家和系統擷取 出的資訊,建構其知識本體 步驟五 資料轉換 (Data Transformation) 將未結構化的文本轉換為系統可 以處理的格式
步驟 任務 描述
詞語分析 (Lexical Analysis) 將資料轉換成帶有詞性的單詞片 語,並轉存成XML 格式
重要詞彙 (Significant Term) 透過 TF*IDF 的方式將重要詞彙保 存下來,移除相關性不高的詞彙 資料正規化 (Normalization) 將相同意義的詞語,利用相同的詞 彙來表示 步驟六 子議題界定 (Issue Identify) 界定出該法案審查時,有哪些相關 的議題被討論 權重值學習(Weight Learning) 透過數理的方式,決定每種詞性值 所使用的權重為何 分群 (Cluster) 透過分群的技術將相關的資料群 聚在一起,用以界定出議題 步驟七 參與者行為 (Informant Behavior) 匯 整 出 一 個 議 題 中 有 什 麼 人 參 與,表達過什麼意見,其又在議題 中扮演什麼角色 步驟八 資訊呈現 (Presentation) 透過 GUI 的方式,將匯整後的資 訊呈現給使用者,並提供相關機制 協助瀏覽 第二子步驟是重要詞彙的篩選,其主要目的是精減每份文章的詞語向量,選出更能 代表該篇文章的詞語。透過TF(Term Frequency)和 IDF(Inverse Document Frequency) 的權重方式(Salton, G., Buckley C., 1988),挑選出重要詞彙。而第三子步驟則是詞語 的正規化,透過事先建立好的Ontology 架構,可以對於詞語進行正規化的動作,例如: 陳總統與陳水扁其所代表的人是相同的,因此系統會統一將陳總統轉換為陳水扁,讓相 同意義的詞語都能用相同的詞彙表達。除此之外,系統亦會將包含於Ontology 中的詞語 之詞性,轉換為重要詞彙(nx),透過此一轉換動作,可以標示出法案主幹中被提及的 重要詞性,有助於後續議題界定的成效。 在步驟六的子議題界定,則是要透過收集到的資料,分析出在該法案審查時,有哪 些相關的議題被討論。其亦可以區分為二個步驟:權重的學習及分群。前者主要的目的 在於找出分群時所需的權重值。在此,本研究透過log-linear regression model 的數理化 方式(Hatzivassilogou et al., 2000),找出最佳權重值。其透過人工的方式,將資料進行 分組後,再透過logistical 線性回歸的方式,求得每個權重,其公式如下:
∑
= ⋅ = k i i i V w 1 η j j e e Rj η η + = 1 (1) 其中,wi是代表權重值,Vi是每個文件中的詞語向量,當第 j 組的文件屬於同一群時, Rj為 1,否則為 0。當決定完權重值後,則開始進行分群的動作,在本階段所使用的是Hierarchical Clustering Method 中的 Group Average Link 的做法,對文件進行分群的動作 (Frakes, Baeza-Yates, 1992)。其相似度的算法是採用 Cosine Coefficient,文章 Di與文
章 Dj的相似值如下所示:
∑
∑
∑
= = = = L k jk L k ik L k ik jk D D weight weight weight weight S j i 1 2 1 2 1 , ) ( (2)透過文章與文章間的相似值計算、Group Average Link 方法及相似值臨界值的給予,便 可以完成議題的分群。
第七步驟則是界定出議題中的參與者行為,藉由找出某一議題中的參與者和其表達 過的意見,可以了解參與者在該議題中所扮演的角色,即who say what, when, how。最 後一步驟,資訊的呈現則是採用圖形化使用者介面(GUI)的方式,讓使用者可以透過 瀏覽器的方式,瀏覽系統處理後的資料。在資訊呈現中的議題名稱標註(labeling),則 是透過下述公式,取出權重值最高的前三個做為議題名稱。 weight tf)× log( (3) 在標註上不採用 TF×IDF 的方式,主要的原因為分群後的文件所採用詞語相似度很 高,若採用IDF 的方式,將使得在每篇文章中都出現的詞語,權重值過低,反而無法正 確的描述該群新聞議題。而採用log 的作法,將可以降低大量出現詞語的重要性,並輔 以詞性權重值,讓其他有相關性的詞語也能夠被採用。除此之外,系統亦提供回饋的機 制,使用者可以個人將相關的想法、看法,記錄在系統中,做為日後參考的依據。 2. 系統建構 系統架構如圖一所示,整個系統可以區分為三大塊,分別為資料前置處理、資料分 析與資訊呈現。資料前置處理主要將收集到的資料,經過資料的清除、屬性的擷取,再 轉換為系統可以分析的資料格式,並傳送至下一階段。第二區塊為資料的分析,其將由 上一階段獲得的資料,做子議題的界定和參與者行為的分析,並將結果存放至法案形成 過程記錄的資料庫中,以待使用者的瀏覽。而第三區塊,也是最後一階段的資訊呈現, 則是將存在資料庫中,經過匯整的法案形成過程,經由圖形化界面的形式,讓使用者進 行資料瀏覽及查詢。而整個系統基置於該法案的Ontology 上,藉由知識本體的建立,可 以讓系統的產出結果更為完善。 3. 執行過程 本研究經回溯評估立法院第四及第五屆所有已通過的法案,考量到要比較立法院兩 屆資訊蒐求及資訊網絡,因此選出【台灣地區與大陸地區人民關係條例】為系統實驗研 究對象。經透過聯合知識庫、中時新聞網資料庫及立法院國會圖書館之立法院公報查詢 系統,從聯合知識庫共蒐集到新聞2,134 則、中時新聞網 1,200 則及立法院公報 429 篇, 時間為1999 年 2 月 1 日(第四屆立法委員任期開始)至 2003 年 11 月 30 日(最後一次 修定兩岸人民關係條例後二個月)。將收集到的資料經政治領域專案審查後,移除重覆 及不相關者,留下聯合知識庫1,945 則,中時新聞網 994 則,立法院公報 45 篇。 若將在上述文集中的社會新聞移除,例如因違反兩岸人民關係條例而被報導的走 私、偷渡、賣淫等新聞,僅留下政治議題,可以獲得另一政治議題的文集(Corpus)9, ____________________________________ 9 政治議題文集以(政)表示
內有聯合知識庫1,194 則,中時新聞網 826 則。而移除的社會事件,再歸類為社會事件 議題10,內有聯合知識庫751 則,中時新聞網 168 則。在取得正確的文集後,擷取出文 件屬性,並藉此建立兩岸人民關係條例的Ontology。 在資料轉換的步驟,透過詞語分析系統ICTCLAS 共擷取 53,739 詞語,經由 TF*IDF 的方式做重要詞彙的過濾,留下權重值較高的30,000 個詞語,並將詞語做正規化表達, 達到相同意義的詞語會利用相同詞語表達。在子議題界定的階段,先透過人工的方式, 將1999 年至 2000 年 6 月的資料(364 篇),利用人工手動分群的方式,找出正確分群 結果,再將其結果,透過SPSS 的 log-linear regression model 學習出正確的權重值,其權 重值如表二所示。 資料來源 資料前置處理 資料收集 資料清除 文件屬性擷取 資料轉換 Ontology 建立知識本體 ICTCLAS 子議題界定 參與者行為 資訊呈現 法案形成 過程記錄 資料分析 圖一 系統架構圖 表二 各詞性權重表 ____________________________________ 10 社會事件議題文集以(社)表示
詞性 說明 權重 noun 名詞 16.9 verb 動詞 1.0 nh 人名 62.4 ns 地名 45.4 ni 組織機構名稱 20.1 nx 重要詞彙 79.3 分群前,我們透過兩種方式決定時間區段,一為法案修定時間,二為立委屆數。前 者以法案第六修(2000.12.05)、第四屆結束、第七修(2002.04.02)的時間點,將整個 時間區段分為四個時期,而時間切割點會向後延伸一天(Swan R., Allan J., 2000),因 為通常新聞報導會比實際日期延遲一天。後者僅比較第四屆與第五屆的差異,因此以第 四屆結束(2002.01.31)為時間切割點,詳細時間區段及各區段的議題數,見附錄三。 分群時,先建立起文件與文件間的Similarity Matrix,再透過 Group Average Link 的 方式,在臨界值為0.29 的情況下,進行分群,再把結果存入資料庫中,待使用者查詢結 果。在分析參與者行為的階段,則匯整出一個議題中有什麼人參與,其在該議題中表達 過什麼意見。除了可以從議題中找出參與者,亦可以從參與者的角度來觀察其參與過哪 些議題,做到更彈性的關連。除此,本研究依前面理論將參與者角色區分為十類,舉例 說明如表三所示。 表三 參與者角色說明 角色 說明 舉例 官 政府官員 政府機構人員,如官員、縣市長等 立 立法委員 第四屆與第五屆立法委員 政 政治人物 政黨主席、發言人及縣市議員等 產 產業人士 業界總經理、發言人等 陸 大陸人士 大陸官員及相關人士 學 學界人士 學校教職員及相關研究機構 記 報社記者 各報社記者 警 警察檢調 警察、檢查官、法官等 組 組織機構 非營利事業機構人員 其 其他人士 其他不在上述分類人員 議題的標註上,系統會選出某一議題中,最常被提及的三個關鍵詞彙來代表該議 題,例如某議題的標註為「直航 媽祖 宗教直航」,其代表該議題應該是討論宗教直航 的議題。 最後,系統呈現的結果,則如圖二所示,先透過左邊視窗選擇時間區段後,會列出 該時間區段內的議題,點選議題後,則會顯示該議題內討論的新聞和參與者,並在右方 視窗會列出此議題中的重要詞彙、參與者及相關統計資料。當點選新聞後,則會顯示新 聞的原文,方便使用者了解事件的報導,如圖三所示。若點選參與者,會顯示其發言與 被提及的情況,若該參與者有參與其他議題,亦可以在視窗中顯示,如圖四所示。下方
的時間軸圖,則會顯示相關新聞出現的時間點當天的新聞數和利用顏色來區分新聞出現 頻率,例如,若新聞數為2 時,顯示藍色,大於 3 時,會顯示紅色,讓使用者可以快速 了解哪天被報導情況最高。除此之外,亦標註出法案修定重要事件時間,方便使用者了 解事情發展的始末。而右方中間的文字方塊,可以做為使用者回饋的機制,自行記錄與 該事件相關的資料,以做為日後研究所用。 圖二 系統資訊呈現圖(1) 時間區段 相關統計 重要時間點 議題標註 相關新聞 新聞原文 其他議題 議題時間點
圖三 系統資訊呈現圖(2) 圖四 系統資訊呈現圖(3) 相關參與者 參與者言論 其他參與議題 使用者回饋 新聞數目
肆、 結果分析
經過資料探勘「兩岸人民關係條例」在立法院第四及第五屆的第六及第七修前後的 相關資料,所得的整體結果見下面表四: 表四 法案屆別與參與者角色匯整表 項目 官 立 政 業 陸 學 記 警 組 其 合計 總參與人數11 第四屆 154 98 37 66 42 32 365 80 40 968 1882 第五屆 155 128 39 141 43 46 383 58 46 588 1627 平均每議題參與人數 第四屆 2.04 1.03 0.34 0.38 0.28 0.15 4.03 0.36 0.18 4.22 13.00 第五屆 1.93 1.74 0.34 0.56 0.27 0.18 3.78 0.21 0.18 1.83 11.02 平均每人參與議題數 第四屆 3.18 2.52 2.22 1.36 1.57 1.16 2.65 1.09 1.05 1.05 1.66 第五屆 4.12 4.50 2.87 1.30 2.12 1.30 3.27 1.17 1.30 1.03 2.24 從表四看來,立法院在「兩岸人民關係條例」這個個案的審議上,第五屆似並沒有 更優於第四屆的資訊蒐求廣度及專業化傾向。因為一者第五屆對法案相關議題有參與的 人數,並沒有第四屆多(1627/1882);再者就平均每一個議題的參與人數而言,第四屆 的平均數(13),也是較第五屆(11.02)為多;但就每人參與議題數的平均值而言,第 五屆則顯得較不專注,每人平均參與2.24 議題,第四屆則才 1.66;如果再看參與人的角 色背景,第五屆顯然較第四屆集中在「官員」及「立委」兩種身分(分別為4.12 及 4.50, 相較於第四屆的3.18 及 2.52),而較具專業傾向的如學者、產業人士,及非營利事業組 織等並沒有明顯的成長,和第四屆相較,只能說稍好一點(在「學」的對比為1.30:1.16, 「業」為1.30:1.36,「組」為 1.30:1.05)。 以上表四呈現的結果是就立法院第四屆及第五屆分析時段的整體計算。如前所述, 這兩屆在審議「兩岸人民關係條例」的時間點上不太對等,所以再區分為六修前、後及 七修前、後四時段,表五即呈現分時段的分析結果。 如果「六修前」(立委已就任近兩年)與「七修前」(立委才就任不到三個月)做 對比不盡公平,「六修後」與「七修後」則較能對稱。從表五可見,「七修後」比「六 修後」是有較多的參與議題人數(分別為1487 和 1031),而平均每議題的參與人數也 相對較高(分別為10.80 和 9.99);但在專精度或專業化上卻未見更優於第四屆,因為 一方面「平均每人參與議題數」,「七修後」仍以2.18 領先「六修後」的 1.65,且「立 委」和「官員」的平均參與議題數都較前高出甚多(在「官」為 4.13:2.99;「立」為 4.23:2.05)。突顯出這兩種角色在「七修後」審議這項法案上資訊提供的權重增加。 而另一方面代表專業化傾向的「業」、「學」或「組」的參與角色,則並沒有較前明顯 增加(對比依序為1.22:1.33,1.19:1.09,1.24:1.00),倒是比較有政治意味的「政」 ____________________________________ 11 總參與人數在計算上是以時間區段為區隔,計算在該時間內出現的不重複人員個數。例如陳水扁在第 四屆中的某二個議題中都有發言,但僅計算為一次的出現(見表三說明),及「陸」(大陸人士),較前有明顯的增加(對比依序為3.00:1.95, 2.15:1.37)。 表五 法案修正時期與參與者角色匯整表 項目 官 立 政 業 陸 學 記 警 組 其 合計 總參與人數 六修前 90 48 21 20 17 13 230 55 6 588 1088 六修後 104 78 22 49 30 22 260 28 36 402 1031 七修前 42 31 10 15 5 12 100 5 4 76 300 七修後 138 124 35 137 40 36 360 55 45 517 1487 平均每議題參與人數 六修前 1.92 0.80 0.38 0.22 0.24 0.12 3.93 0.52 0.06 5.73 13.93 六修後 1.83 0.94 0.25 0.38 0.24 0.14 3.38 0.18 0.21 2.43 9.99 七修前 1.45 0.89 0.26 0.32 0.09 0.26 3.04 0.09 0.08 1.45 7.94 七修後 1.90 1.75 0.35 0.56 0.29 0.14 3.66 0.20 0.19 1.77 10.80 平均每人參與議題數 六修前 2.28 1.79 1.95 1.20 1.53 1.00 1.83 1.02 1.00 1.04 1.37 六修後 2.99 2.05 1.95 1.33 1.37 1.09 2.21 1.11 1.00 1.03 1.65 七修前 1.83 1.52 1.40 1.13 1.00 1.17 1.61 1.00 1.00 1.01 1.40 七修後 4.13 4.23 3.00 1.22 2.15 1.19 3.05 1.11 1.24 1.03 2.18 就分時段的比較看起來,第五屆的「七修後」比第四屆的「六修後」,雖然參與的 廣度增加了些,但「專精度」則未必深化,而政治性的角色意見反而有加權的現象。這 與理論預期並不太相合,但前面亦已提及,此法案本身具有相當的政治性,某種程度也 會影響它的資訊網絡,尤其第五屆立法院,政黨競爭的局面是沿著所謂藍、綠的界線, 而這種界線,又主要以政治性的意識型態做區隔,所以面對此「政治性」法案,會以「政 治性」資訊掛帥,勢所難免。本文在對個案的限制做檢討時,也提及此一問題,並提出 一個補救措施,也就是將與法案相關的議題,區分出「政治性」及「社會性」兩塊,試 著探看離開較敏感的政治議題區後,「社會性」議題的資訊網絡會不會呈現第五屆較優 於第四屆的情況。下面表六到表九就分別呈現區分議題後的結果分析:
表六 法案屆別與參與者角色匯整表(僅政治議題) 項目 官 立 政 業 陸 學 記 警 組 其 合計 總參與人數 第四屆 137 83 26 52 34 22 224 9 29 112 728 第五屆 137 125 28 118 39 42 288 17 37 193 1024 平均每議題參與人數 第四屆 2.18 0.96 0.35 0.32 0.25 0.12 2.86 0.05 0.13 0.55 7.76 第五屆 1.81 1.64 0.30 0.46 0.24 0.14 2.93 0.06 0.14 0.56 8.28 平均每人參與議題數 第四屆 3.53 2.57 2.96 1.38 1.62 1.18 2.83 1.11 1.00 1.09 2.37 第五屆 4.74 4.70 3.82 1.39 2.21 1.19 3.65 1.18 1.35 1.03 2.89 表七 法案修正時期與參與者角色匯整表(僅政治議題) 項目 官 立 政 業 陸 學 記 警 組 其 合計 總參與人數 六修前 84 46 20 18 14 7 124 4 4 54 375 六修後 92 61 11 36 25 17 171 5 25 62 505 七修前 39 30 9 14 3 12 78 3 4 36 228 七修後 122 121 25 115 38 32 268 14 35 160 930 平均每議題參與人數 六修前 2.48 1.00 0.54 0.28 0.27 0.09 2.82 0.06 0.05 0.70 8.27 六修後 1.87 0.84 0.21 0.32 0.21 0.12 2.61 0.03 0.16 0.42 6.78 七修前 1.63 0.90 0.25 0.31 0.08 0.25 2.62 0.06 0.08 0.71 6.88 七修後 1.73 1.65 0.30 0.46 0.24 0.12 2.82 0.05 0.14 0.50 8.01 平均每人參與議題數 六修前 2.42 1.78 2.20 1.28 1.57 1.00 1.86 1.25 1.00 1.06 1.81 六修後 3.22 2.16 3.00 1.39 1.32 1.12 2.42 1.00 1.00 1.06 2.12 七修前 2.18 1.57 1.44 1.14 1.33 1.08 1.74 1.00 1.00 1.03 1.57 七修後 4.65 4.45 3.92 1.30 2.11 1.22 3.44 1.21 1.29 1.03 2.82