• 沒有找到結果。

文字探勘技術輔助主題分析—以「中國大陸研究」期刊為例 - 政大學術集成

N/A
N/A
Protected

Academic year: 2021

Share "文字探勘技術輔助主題分析—以「中國大陸研究」期刊為例 - 政大學術集成"

Copied!
34
0
0

加載中.... (立即查看全文)

全文

(1)

文字探勘技術輔助主題分析

—以「中國大陸研究」期刊為例

邵 軒 磊

(國立臺灣師範大學東亞學系助理教授)

曾 元 顯

(國立臺灣師範大學圖書資訊學研究所教授)

摘 要

中國大陸(Mainland China)做為社會科學學術研究對象,隨學科變遷 以及兩岸情勢發展,在各時期有不同主題。承此,本文使用主題分析工具 (CATAR),對「中國大陸研究」期刊於 1998~2015 年刊載之論文,透過論 文的篇名與摘要文字,從事主題群聚(clustering)分析,藉以辨識顯著的研 究主題,及其關鍵字,並以此觀察各主題發展趨勢。結果呈現出「中國大陸 研究」之 473 篇文章,可歸類為七大主題,每一主題各有關鍵字。從每個主 題的發表量(包括「發表數量」、「發表數量百分率」)之變化,可看出歷年 期刊(或研究者)偏好主題之演進。從趨勢可以看出,存在兩個主流議題, 其他主題的年度篇數則變化較大。本研究貢獻為:1.對「各篇獨立」的研究 找到共通主題之可能性,從少量樣本的分群實驗,結果與常識相符,驗證了 自動化主題分析的可行性。2.呈現了臺灣學術界在「中國大陸研究」方面的 研究關鍵字發展趨勢。3.擷取出各個主題的關鍵字,提供未來研究者方便查 閱過去的研究趨向。4.根據逐年的趨勢演變,呈現後續研究的主題方向。 關鍵詞:中國大陸、主題分析、自動歸類、知識探勘、學術系譜 * * * * 本論文由「中國大陸之日本研究知識社群:系譜學、社會網絡、數位人文」NSC:104-2410-H-003-021-MY3 提供研究資源。通訊作者:曾元顯。 DOI:10.30390/ISC.201803_57(1).0002

(2)

壹、研究背景

一、研究緣起

「中國大陸」做為社會科學學術研究對象,因其特殊之歷史、政治、經濟關係, 在臺灣知識界無疑佔有相當重要的地位,較諸其他研究對象,其在學科上變遷經歷十 分特殊。中國大陸於 70 年代末改革開放至今,政治社會轉型變遷劇烈,成了全球性之 熱門研究議題。臺灣之中國研究學者,一方面有西方社會科學訓練的基礎,二方面有 語言優勢,因此在知識生產與創作上,臺灣之「中國研究」學者擁有十分特殊的學術 地位。加上兩岸關係近年之變化,就現實需要而言,了解「中國大陸」乃至了解「中 國大陸研究」,在學術層次與實務層次,皆有相當之必要性。 自 1990 年代起,社會科學開始注意學界中各種方法論與研究途徑之統整。至本世 紀初期,逐漸開展「對中國研究之再研究」,有學者稱此為「學科典範變遷」或是「知 識社群研究」。此種發展可分為三種途徑,如表 1 所示:歷史(學術史)研究法、典範 研究法、社群研究法。第一種歷史研究法,多以年代分別再標註出各年代特色:如研 究者指出臺灣此一議題研究應分為三個時期:匪情研究(1949 年到 1981 年);中共研 究(1971 年到 1991 年);中國大陸研究(1988 至現在)。三期的不同在於:研究對 象,由中共逐漸變為全方位中國;研究方法則由歷史敘事、社會科學進展到田野調 查;學群也由政府獨佔,轉變到民間更為活躍的情形等等。泝另有學者沿用此一方式, 試圖以研究型態(國家或社會主導)、研究內涵(政策或學術取向)做為縱橫座標,提 出四種象限,並以「制度變遷與社會現實需要」兩種層次來解釋為何中國研究會改 變,並以新制度主義如何進入臺灣的中國研究學術社群為例,介紹了「典範轉移」的 歷史過程。沴 第二種是典範研究法,以爭辯中的兩岸關係理論、沊中國大陸研究方法與成果沝兩 書為例,網羅了臺灣主要的國際關係學者,以各種方法呈現出自身之中國研究成果。 其中包含整合理論、分裂國家模式、談判模式、經貿政策、心理分析、戰略三角理 論、國際體系論、安全典則論等。沀這些書籍主要替後進研究者,呈現各家中國研究者 各種研究方法,對於個別單一研究方法之選擇與討論上較無揚抑之舉。 註 泝 楊開煌,「臺灣中國大陸研究之回顧與前瞻」,東吳政治學報,第 11 期(2000 年 9 月),頁 76~87。 註 沴 張弘遠、李宗義,「中國研究在臺灣:研究體制的發展與變遷」,石之瑜主編,從臨摹到反思-我國 社會科學博士對歐美知識與體制的回應(臺北:漢蘆,2005 年),頁 252~282。 註 沊 包宗和、吳玉山主編,爭辯中的兩岸關係理論(臺北:五南,1999 年)。 註 沝 何思因、陳德昇、耿曙主編,中國大陸研究方法與成果(臺北:國立政治大學國際關係研究中心, 2003年)。 註 沀 包宗和、吳玉山主編,爭辯中的兩岸關係理論,頁 1。

(3)

第三種為知識社群研究法。本研究法強調每一個研究者因為其自身特殊之學術地 位,如「遷台學者、國安體系、歸國留學學者、全球化時代」等等,解釋臺灣研究中 國大陸之變遷。途徑近似於歷史(學科史)研究法,但更多強調口述歷史、訪談、系 譜學等,加入了對研究者個體成長歷史之關懷,強調研究者自身偶然與選擇之作用。泞 表 1 臺灣的中國研究變遷一覽表 主要研究途徑 主要分類 研究對象 主要關注 解釋變遷原因 歷史研究法 依照年代差別:匪情研究(1949-81)中共研究(1971-91)中國 大陸研究(1988-)等等 以中共中央研究為 主,之後擴大為全 部中國大陸 在不同年代下所 產生的不同變化 。 外在環境不同,而研 究者研究取向自然不 同。 典範研究法 依照學科、模式或研究途徑(如 整合理論、分裂國家模式、談判 模式、經貿政策、心理分析等) 主要是各層次議題 的「中國案例」 各學科視角下的「案例中國」 由於學科與研究方法論,其不同訓練研究 者,在「中國」案例 中的應用。 知識社群 各研究者之社群狀態(大學學 者、國安系統、大陸相關工作人 員等等) 各知識分子因職業 或自身際遇 個體之偶然與選 擇。 知識分子亦為社會人 ,因其社會角色而做 不同研究。 資料來源:作者自製。 上述研究法統整「中國大陸研究」或「知識社群」,卓有見地。然而,上述方法 皆奠基於大量實務累積與論文閱讀,並以資深學者之經驗,形塑此一學科之框架。本 文試圖使用文字知識探勘技術工具,整理此一領域具代表性期刊之一的「中國大陸研 究」之研究論文,將其自動化分類,以另一種方式呈現對「中國大陸研究」之討論。

二、問題意識與研究回顧

文字探勘在其他學科有一定成果,數位人文學科(digital humanity)也有相關的研 究。泀在美國已有相關的論文討論其演變、哲學上之意義與實用研究上之可能範圍,當 前諸多研究者之首要問題意識,多為其科技能力是否能應用在本身領域,正在一步步 擴充其認識論疆界。洰

在英文之政治學研究中,美國的 Grimmer 與 Stewart 提出「Text as Data」的觀 念,將政治相關文本(text)視為某種可被解析之資料(data),進而利用各種文字處 理與統計分析方法進行分類或歸類的運算(可統稱為文字探勘技術),以進行大量文 註 泞 石之瑜、包淳亮,「在臺灣研究中國/大陸:知識政治與政治知識」,展望與探索,第 10 卷第 10 期 (2012 年 10 月),頁 34~55。 註 泀 關於自然語言與論述脈絡的研究,請參考徐振國,「政治學改造運動的爭議和啟發:從『通則』到 『脈絡』的轉向」,政治與社會哲學評論,第 45 期(2013 年 6 月),頁 1~61;金觀濤、劉青峰, 「隱藏在關鍵詞中的歷史世界」,鄭文惠主編,東亞觀念史集刊,第 1 期(臺北:國立政治大學, 2011 年),頁 57~75。

註 洰 Susan Schreibman, Ray Siemens, John Unsworth eds., A Companion to Digital Humanities( Oxford: Blackwell, 2004).

(4)

件的自動化資訊組織與主題分析,從而提供潛在有用、先前未被關注的訊息。泍其提到 曾 被 探 勘 、 分 析 過 的 政 治 文 本 類 型 有 : 新 聞 語 料 、 國 會 議 員 的 正 式 發 言 ( floor speeches)、總統與立委或政黨的聲明、被提出的法案、公聽會內容、條約、以及政治 論文等。對自動內容分析的方法與成果,Grimmer 與 Stewart 根據其經驗與觀察,提出 了四項原則(principles):1.所有文字語言相關的量化模型都是錯的,但有些是有用 的(這是因為語言文字有其模糊性,沒有數學方法可以精確的反應此現象,但近似的 運算,對多數分析文字的任務就有幫助);2.這些量化的方法可增強專家的分析能 力,而非取代專家;3.沒有最佳、最好的方法可用來分析所有種類的文本,不同的方 法適用於不同類型與內容的文本;4.自動化方法可大量降低人工時間與成本,但對其 結 果 需 要 驗 證 、 驗 證 、 再 驗 證 , 以 確 保 其 有 效 性 。 這 些 原 則 , 是 相 當 好 的 洞 察 (insights),可做為數位人文領域應用自動化技術時的參考指引(guide)。 在國際衝突不斷,價值體系各異的現代環境下,歐洲的 Christen 與 Alfano 等人則 運用文字探勘技術,分析大量訃文、墓誌銘等對死者生前事蹟的描述語料。其方法主 要是將語料中的關鍵詞抽取出來,並分析這些關鍵詞是否常出現於同一文本中,依此 計算關鍵詞的相似度,再利用視覺化技術,將此關鍵詞相似網路繪製出來,以利專家 快速辨識語料中最常提到的概念與其之間的關係,從而解讀各國不同文化中,對於價 值、道德、幸福的認知。泇其文字探勘方法,為目前已成熟之技術,沰惟其使用的語 料,則相當創新,但也有可爭議之處(如:墓誌銘大多不會提及死者的負面事蹟與評 價)。 為了了解中國大陸 50 年的轉變,日本的中國研究學者 Murata Tadayoshi(村田忠 禧)以 1949 年到 2002 年人民日報每年的元旦社論為語料,先自訂待觀測的關鍵詞 彙,然後統計這些詞彙出現的篇數與年代。依此資料分析每年焦點詞彙的變化,並觀 看某年焦點詞彙在其他年份出現的狀況,以了解該年份與其他年份的連動關係。泹此項 2002 年發表的文字語料分析方法,在當時的人文社會科學領域算相當創新,但其自訂 「待觀測的關鍵詞彙」,則因人為介入,除較耗時間、難以重複驗證或跨語料應用 外,在研究的意義上,也會受研究者自身學識之限制。

註 泍 Justin Grimmer, Brandon M. Stewart, “Text as Data: The Promise and Pitfalls of Automatic Content Analysis Methods for Political Texts,” Political Analysis, Vol. 21, No.3(January 2017), pp. 1~31.

註 泇 Mark M. Alfano, “Identifying and Defending the Hard Core of Virtue Ethics,” Journal of Philosophical Research, Vol. 38(July 2013), pp. 233~260; Markus Christen, Mark Alfano, Endre Bangerter, Daniel Lapsley, “Ethical Issues of ‘Morality Mining’: When the Moral Identity of Individuals Becomes a Focus of Data-mining,” in H. Rahman & I. Ramos eds., Ethical Data Mining Applications for Socio-Economic Development(Pennsylvania: IGI Global, 2013), pp.1~21.

註 沰 Yuen-Hsien Tseng, Zih-Ping Ho, Kai-Sheng Yang, and Chun-Cheng Chen, “Mining Term Networks from Text Collections for Crime Investigation”, Expert Systems With Applications, Vol. 39, No. 11(September 2012), pp.10082~10090.

註 泹 村田忠禧,「人民日報元旦社説から見た中華人民共和国の歴史」,現代中国,總第 76 期(2002 年 10月),頁 99~110。

(5)

上述簡要的回顧,說明在大量文獻的時代,各方嘗試運用資訊技術分析文本語料 的企圖、作法、與經驗分享。主要的成果多是對文獻進行自動化的資訊組織與主題分 析,並以某種形式摘要呈現,降低專家整理待分析文件的時間與成本,使其可專注於 解讀、探索文獻內涵,以了解過去、展望趨勢、辨識隱而未顯且潛在有用之樣態、或 是進行新、舊假說的推論等任務。 在上述的脈絡下,本文試圖應用數位探勘工具來組織與分析大量研究論文,以協 助了解其主題大意,及其所記載之研究議題。本文特別著力於「中文文本」,以及 「中國大陸研究」領域,以探索相關科技進展能否輔助研究者發現各種研究主題與脈 絡 的 可 能 性 。 具 體 之 研 究 方 向 有 二 : 其 一 、 能 否 使 用 「 共 現 字 分 析 」 ( Co-word Analysis),並以程式自動化大量歸納社會科學形式之論文主題與共同關鍵字?其二、 若前述問題有合理的結果,那麼近年來中國大陸研究的主要關鍵字與主題是哪些,能 有哪些解讀,對研究者有何啟發? 本文期望可能達到學術成果如下:一、討論近年「中國大陸研究學科發展」的主 體變遷。二、能在短時間內處理大量文獻,整理出關鍵研究趨勢。三、將「知識主題 研究」作業程序化,以供反覆驗證與應用。四、透過對特定語料的文字探勘,自動化 的知識組織與分析,以另一種面向呈現對「中國大陸研究」之探討。五、做為初探研 究,提供後續研究比較與改進的參考。

貳、研究方法

文本牽涉到的主題分析技術,在近 20 年來有相當多方法被發展過。在李龍豪等人 (2016)的研究中,比較了三種主題辨識技術應用於中文短文的主題歸類上,其案例 顯示影響歸類成效的因素眾多,理論上較好的歸類方法,不見得會有較佳的結果。泏這 證實了前述 Grimmer 與 Stewart 提及的原則:沒有最佳的方法可運用於所有的文件類 型。本研究主要使用「共現字分析」(Co-word Analysis)技術,其概念相當簡易直 覺,主要重點在運用不同文件中的相同詞彙,來計算任意兩文件的相似度,從而將相 似的文件歸類(cluster)起來。此方法在科學計量學(Scientometrics)、內容分析 (Content Analysis)或文字探勘(Text Mining)中皆有相關應用。泩其可便於了解待分

析文件中包含的各種主題概念,從而對各個主題與各篇文章的欄位屬性(如:作者、 機構、國家、出處、年代等)進行交叉分析,用以透露文獻內含的研究主題、各主題 的影響主力(個人、機構、國家)、研究社群之聚落分布、主題趨勢的變化。泑以往類 註 泏 李龍豪、簡佑達、張俊彥、李宗諺、曾元顯,「短文回應的主題自動歸類在行動教育活動上之應用初 探」,圖書資訊學研究,第 11 卷第 1 期(2016 年 12 月),頁 47~84。

註 泩 Loet Leydesdroff, “Words and Co-words as Indicators of Intellectual Organization,” Research Policy, Vol. 18, No. 4(August 1989), pp. 209~223.

註 泑 曾元顯,「文獻內容探勘工具-CATAR 之發展和應用」,圖書館學與資訊科學,第 37 卷第 1 期 (2011 年 4 月),頁 31~49。

(6)

似的任務,是以人力方式使用數量比率的方法進行研究。炔

較諸傳統以人工建構領域知識或分類架構的方法,本文使用之概念,在於提供由 下而上(bottom-up)、資料驅動(data driven)、證據為主(evidence-based)的研究 線索,能補充甚至對照專家之主觀體驗,從而得到啟示。本研究使用的工具,為網路 上可自由下載的「學術研究內容分析工具」,簡稱 CATAR(Content Analysis Toolkit for Academic Research)。炘對應於本次蒐集到網路上的公開資料,本研究主要使用文

章的「篇名與摘要」讓 CATAR 進行「共現字分群」(Co-word clustering),以自動歸 納出待分析文章的主題類別。 Tseng等人(2007)的研究顯示,僅使用「摘要」對比於使用「全文」,在進行主 題歸類(主題地圖繪製)的任務上,使用「摘要」的效果不會比全文差,甚至多數情 況下會更好。炅在考量全文資料的取得與格式轉換的困難度,以及分群效果沒有顯著差 異的情況下,本研究以「篇名與摘要」來代表一篇文章的主旨大意,以做為主題分析 的依據。

上述所謂共現字(co-occurrence word 或簡稱 Co-word),是指兩篇文章若使用到 相同的詞彙,即有共現字的關係存在;若共現字越多,則兩篇文章的共現字關係越 強,其談論相同主題的機會越高。後續,再依此主題相似度進行文章的主題歸類。 共現字方法將單篇文件簡化成一群詞彙來代表該文件,以進行主題歸類處理。如 同 Grimmer 與 Stewart 的文章中提到,將文意以個別的詞彙表示,可能會失去其原意。 但多數的情況下,此種詞袋(bag of words)表示法,就有足夠的效用。這是因為單獨 的詞彙,即使語意上有歧異性,但其前後文的伴隨詞彙,可以輔助確認此詞彙所屬文 件的主題意義。例如「開放」一詞,若伴隨著「媒體」一詞,則跟言論自由的主題較 為相關;但若伴隨著「政策」一詞,則較偏向於管轄治理上的主題。 在進行共現字分群時,CATAR 使用文字探勘的技巧,包含刪除停用詞(如代名 詞、連接詞等無主題意義之詞彙)、正規化詞彙(如英文大小寫一致化,再取英文詞 幹)、擷取關鍵詞(如 multi-character term)等技術與流程,進而建立詞彙到文章的反 向索引資訊檔案,以方便任意兩文章之間的共現字的快速運算。炓而進行共現字分群 註 炔 邵軒磊,「中國研究議程之系譜-以日本國際政治學會誌為例」,問題與研究,第 51 卷第 1 期(2012 年 9 月),頁 23~54。

註 炘 Yuen-Hsien Tseng and Ming-Yueh Tsay, “Journal Clustering of Library and Information Science for Subfield Delineation Using the Bibliometric Analysis Toolkit: CATAR,” Scientometrics, Vol. 95, No. 2(May 2013), pp. 503~528.

註 炅 Yuen-Hsien Tseng, Yeong-Ming Wang, Yu-I Lin, Chi-Jen Lin and Dai-Wei Juang, “Patent Surrogate Extraction and Evaluation in the Context of Patent Mapping,” Journal of Information Science, Vol. 33, No. 6 (December 2007), pp. 718~736.

註 炓 本文使用之分詞技術,包括:中文自動分詞(12 萬字之詞庫,長詞優先分詞法)、關鍵詞自動擷取 (以程式擷取文中的新生詞彙、領域術語、詞庫中沒有涵蓋的詞彙等),並用停用詞表(包括:代名 詞、連接詞等無主題意義之詞彙表)過濾。這些技術細節,詳見下面所列專利與參考書目:曾元顯, 數字文件關鍵特徵的自動擷取方法,中華人民共和國發明專利,專利號:ZL 00 1 22602.9。Yuen-Hsien Tseng, “Automatic Thesaurus Generation for Chinese Documents,” Journal of the American Society for Information Science and Technology, Vol. 53, No. 13(November 2002), pp. 1130~1138.

(7)

時,是指將待分析文章的任意兩篇文章都拿來計算其共現字關係的強度,從而建構出 任意兩篇文章的相似度矩陣;依此矩陣,再以「文件歸類」技術中的「層次凝聚歸類 法」(Hierarchical Agglomerative Clustering,HAC),炆將相似的文件聚集成一個個類

別。如下圖所示,在 D1到 D17的 17 篇文件中 HAC 會將最相似的文章先歸成一類,再 將新的類別與既有文章根據相似度再合併成一類,如此可以視覺化的看出文章分群歸 類的情況。透過電腦計算最適當的相似度門檻,即可將這 17 篇文章合併區分成數個類 別,如圖 1 所示分成 6 個類別。 圖 1 HAC 的文件自動歸類示意圖 資料來源:作者自製。 當待分析文件很多時,HAC 分出的類別還是很多。為降低人工分析的複雜度, CATAR 使用多階段主題歸類(Multi-Stage Clustering,MSC),將上述方式合併的小 類別,視為一個個不同的「議題」或「概念」(Concepts),把這些小類別的文章合併 成一份巨大之虛擬文件,再根據 HAC 重複上述的歸類動作,則可將「概念」歸類成 「主題」(Topics)。如有需要,此 MSC 方式可再將「主題」歸類成「次領域」 (Domains),「次領域」再歸類為「大領域」(Fields),依此類推。如圖 2 所示, 每個圓圈代表一篇文章或一個類別,其顯示為兩個階段的 MSC 主題歸類,其中每一階 段皆為獨立的 HAC 歸類過程。在 MSC 歸類過程中,有些文件或類別可能會因為與其 他文件或類別的相似度太低,而無法被聚集合併到任何類別中,此種文件或類別可稱 為離群文章或離群類別(outlier,簡寫成 O.L.),如圖中白色圈圈示意之處。

註 炆 Gerard Salton, Automatic Text Processing: The Transformation, Analysis, and Retrieval of Information by Computer(MA: Addison-Wesley, 1989).

(8)

圖 2 多階段主題歸類示意圖 資料來源:作者自製。 上述 MSC 的多階段歸類,將相似的文章合併成概念,再將類似的概念合併成主 題,只是一種理想的情形。實際執行 MSC 時,有可能兩個類似的概念合併後,並無法 形成一個被認可的合理主題。例如中國大陸的「改革」與「開放」兩個概念,常被一 起提及,合併成一個主題似無不可,但也許有學者會認為這兩個概念還是有所區別。 有關本研究之本體論與後設理論部分,已有相當知名學者屢有創見,如:關於 「脈絡」之啟發,炄對於實證方法之討論,炑皆已有相當積累。本文主要嘗試使用新方 法,將研究文本做為研究對象,而藉用補助工具,讓使用者可以更專注於分析文本間 的主題脈絡。關於研究對象方面,由於本文並不只在研究某位領導之言論或如 Murata 研究中國媒體社論,而是使用研究論文,原因是:「研究論文」相較於「社論或領導 講話」,其「文本特性」是用語較有規範、主題較為集中,是檢視研究方向的一種良 好指標文本。 本研究藉由 CATAR 軟體將 473 篇「中國大陸研究」期刊歷年論文,依上述說明 自動化的逐步匯聚成 7 個「類別」,此 7 類代表著主題較為一致的論文群組。CATAR 工具在每個歸類階段,亦會自動擷取各類別的特徵詞彙做為類別描述詞,以便利主題 判讀。炖CATAR 產出的類別結果,亦會加入作者、年份的要素,讓讀者可以快速了解 「哪些作者主要在研究哪些主題」、「在某些年份中每個主題論文數量的變化」。由 於採用開放的工具與公開的語料,本研究主題歸類分析的過程與結果,具有可重複性 與可檢証性,符合 Grimmer 與 Stewart 提到的第 4 項原則:對自動化的結果需要驗證、 驗 證、 再驗 證, 以確 認其 有效 性。在下 一節 中,本研究將 先就 少量的文件,驗證 CATAR在中國大陸研究的共現字歸類效能。 註 炄 徐振國,「政治學改造運動的爭議和啟發:從『通則』到『脈絡』的轉向」,頁 1~61。 註 炑 黃紀,「政治學方法論芻議」,何思因、吳玉山主編,邁入 21 世紀的政治學(臺北:中國政治學會, 2000年),頁 107~139。

註 炖 Yuen-Hsien Tseng, “Generic Title Labeling for Clustered Documents,” Expert Systems With Applications, Vol. 37, No. 3(March 2010), pp. 2247~2254.

文章 議題

(9)

參、方法驗證

「中國大陸研究」期刊為政治大學國際關係研究中心所出版,長期關注中國大陸 發展,現為 TSSCI 資料庫蒐錄的期刊。本文選擇「中國大陸研究」期刊的論文為待分 析文章的原因,是因其為社會科學類中研究中國大陸的綜合性期刊,因為探討的面向 廣泛,個別獨立學者不易瞭解其全貌,因此是自動化主題分析良好的研究素材。本文 在初探階段,使用小範圍同質性高(同一期刊)之樣本,未來期望能進行跨期刊大量 樣本之討論。 由於資料形式之限制,本文選取網路上公開資料(1998 年 1 月至 2015 年 6 月) 共 473 篇文章,擷取主要欄位:作者、篇名、關鍵字、摘要、發表年份等,將其製作 成為適當格式,提供上述軟體 CATAR 做為分析的基礎。 為了解 CATAR 的成效,本研究先以「立意抽樣方式」,先取三位在該期刊發表較 多論文之單一作者,且研究取向有明顯差異者,做為少量的樣本測試組,如表 2 所 示,以觀察其文章歸類的結果,驗證自動歸類、自動辨識議題的能力。 表 2 測試組文章一覽表 編號 出刊年 作者 篇名 1 2004 徐斯儉 中國大陸政治改革的爭議:一個文獻的回顧 2 2003 徐斯儉 中共十六大與政治改革 3 2001 徐斯儉 大陸農村經濟發展與基層民主發展的關係-鄉鎮企業產權改革與農村基層民主 4 2001 徐斯儉 中國大陸九○年代之政治改革與制度變遷 5 2000 徐斯儉 全球化;中國大陸學者的觀點 6 2007 徐斯儉 「軟紀律約束」-中共強化監督之政改的內在限制 7 1999 徐斯儉 大陸農村的基層民主與經濟發展的關係 8 2004 張裕亮 從黨的喉舌到黨營傳媒企業一廣州日報制度變革分析 9 2003 張裕亮 大陸黨報從業員依附行為的轉變-以人民日報為例 10 2002 張裕亮 大陸報業經營制度改革-制度變遷理論的觀點 11 2010 張裕亮 流變中的大陸流行音樂黨國意識 12 2009 張裕亮 民意乎?黨意乎?-大陸新京報讀者投書的近用權實踐 13 2007 張裕亮 從紅色經典到愛國主義商品:大陸主旋律電視劇文本意義的變遷 14 2006 張裕亮 中共對台報導的政策主導表述-開放來台駐點前後人民日報對台報導的異同 15 2005 張裕亮 黨政會議新聞的市民消費表述-人民日報與京華時報對「兩會」新聞的報導異同 16 2007 鍾延麟 鄧小平在1957年中共整風、「反右派」中之角色 17 2006 鍾延麟 1958年鄧小平在解放軍「反教條主義」運動中之角色與活動 18 2006 鍾延麟 鄧小平在文革前中共與東南亞共黨之關係:角色和活動 19 2005 鍾延麟 鄧小平在中蘇關係中之角色與作為(1956~1976)-兼論對「鄧小平研究」之意義 20 2014 鍾延麟 「文革」前彭真對中共首都的管理:政治方針、領導方式和幹部政策 21 2015 鍾延麟 故紙堆中作新文章:檔案研究與中國研究 22 2015 鍾延麟 彭真在1959年中共「反右傾」運動中的角色和作為 資料來源:作者根據「中國大陸研究」期刊自製。

(10)

若此 CATAR 工具可將主題相近的論文(在此樣本中大多為同一作者在相近時期所 寫的論文)匯聚在同一類別中,則表示根據篇名與摘要的文字,由此工具所做的歸 類,具有一定的可信度,而可以應用到較大範圍的待分析文章上,以便自動歸類(辨 識、擷取)其隱含的主題。根據表 2 的 22 篇測試文件,CATAR 的歸類結果如表 3 所 示,此結果跟圖 1 對照比較,可知哪兩篇文章相似度較高而先被歸類起來,之後再跟 其他文章歸類在一起。 表 3 測試結果層次表 1: 4 Docs. : 0.7113(鄧小平:28.0000,毛澤東:4.1000,活動:3.9853,運動中:1.9379,角色:1.3887) ■ 2007:鄧小平在1957年中共整風、「反右派」中之角色(鍾) ■ 2006:1958年鄧小平在解放軍「反教條主義」運動中之角色與活動(鍾) ■ 2005:鄧小平在中蘇關係中之角色與作為(1956~1976)-兼論對「鄧小平研究」之意義(鍾) 。2006:鄧小平在文革前中共與東南亞共黨之關係:角色和活動(鍾) 2: 3 Docs. : 0.6286(農村:15.0502,民主:12.6739,基層:11.8818,經濟:10.1440,關係:9.5607) ■ 2001:大陸農村經濟發展與基層民主發展的關係-鄉鎮企業產權改革與農村基層民主(徐) ■ 2000:全球化;中國大陸學者的觀點(徐) 。2001:大陸農村的基層民主與經濟發展的關係(徐) 3: 3 Docs. : 0.7531(政治改革:16.0000,政權:9.5054,中國:5.5448,合法性:4.7527,社會:3.6250) ■ 2004:中國大陸政治改革的爭議:一個文獻的回顧(徐) ■ 2001:中國大陸90年代之政治改革與制度變遷(徐) 。2003:中共十六大與政治改革(徐) 4: 3 Docs. : 0.8518(人民日報:10.0000,新聞:8.7133,表述:3.9606,政策:3.6250,異同:3.1685) ■ 2006:中共對台報導的政策主導表述-開放來台駐點前後人民日報對台報導的異同(張) ■ 2003:大陸黨報從業員依附行為的轉變-以人民日報為例(張) 。2005:黨政會議新聞的市民消費表述-人民日報與京華時報對「兩會」新聞的報導異同(張) 5: 2 Docs. : 0.5533(制度:7.4613,經營:7.0000,報業:7.0000,變革:3.4359,日報:3.4359) 。2004:從黨的喉舌到黨營傳媒企業一廣州日報制度變革分析(張) 。2002:大陸報業經營制度改革-制度變遷理論的觀點(張) 6: 2 Docs. : 0.7837(黨國:6.3369,音樂:4.1231,電視劇:3.4359,主旋律:3.4359,黨國意識:2.7487) 。2007:從紅色經典到愛國主義商品:大陸主旋律電視劇文本意義的變遷(張) 。2010:流變中的大陸流行音樂黨國意識(張) 7: 2 Docs. : 0.1429(彭真:9.0000,反右傾:4.1231,首都:4.1231,中央:3.4359,北京市:3.4359) 。2015:「文革」前彭真對中共首都的管理:政治方針、領導方式和幹部政策(鍾) 。2014:彭真在1959年中共「反右傾」運動中的角色和作為(鍾) 資料來源:作者自製。 測試組結果評析如下:在第一階段的主題歸類中,共有 7 個小類,其歸類結果有 很高的合理性。如:鍾延麟在 2005~2007 發表的 4 篇文章,被歸在第 1 小類,而其在 2014~2015 發表的兩篇文章,則被歸到第 7 類,從表 2 的篇名觀察,這些文章的主題 或議題有所差異,自應被歸在不同類別,而自動化工具也真的能辨別出來。張裕亮發 表的文章,也有類似的情形(第 4、5、6 小類)。由「(篇名前)提示之關鍵字」可以 看出,幾乎機器與人類常識閱讀有很高的一致性。從各個類別的關鍵字,也可以看出 各作者研究取向與研究重心的變化。 但全部 22 篇文章,電腦只歸類出 19 篇,其中有 3 篇,被視為離群值,而個別單 篇自成一類,在此就沒有顯示出來。而這 3 篇分別為表 2 中編號 6、12、21 之 3 篇文 章。其中編號 6 為徐斯儉於 2007 年發表的文章,跟表 3 的第 2、3 類發表有時間差

(11)

距,其用詞可能較為不同,因而沒有被歸在第 2 或第 3 類。而 12 與 21 是因為其研究 主題以及用詞、關鍵字等都跟其他文章不同,而成為離群值。 從以上的結果看出,電腦完全自動化的主題辨識只有少許不足之處,多數結果大 致合理可信。因此,本文在以下的結果呈現中,將運用自動化主題分群,配合人工檢 視主題分群之結果,決定最後的主題類別。

肆、個別主題分群分析

本節就「中國大陸研究」473 篇文章的篇名與摘要,進行前述的多階段共現字自 動分群,並自動選取各分群的類別關鍵字,其最後一階(第四階)的結果如下圖所 示: 圖 3 「期刊:中國大陸研究」(1998~2015)主題分群總表 資料來源:作者自製。 由上述樹狀圖可以看出各分群的關鍵字遠近關係。其中「色塊與樹狀圖」部分, 為機器自動產生,而編碼部分則是因為敘述需要,給予一個「群」名稱,再由此一 「群」名稱說明其中的主題。此間,「群」名稱可能因為使用者介入(或主觀認定) 而不同,在本文中僅為敘述便利給予名稱,使讀者能較為直觀的進入敘述情境,如果 讀者有自行之理解脈絡,也可嘗試以自身的經驗賦予意義。本工具之核心要旨為提供 使用者便利理解主題分布與變遷。因此,可以視各人研究需要而選取不同層次之主題 關鍵字以供理解。 意 識 形 態

(12)

表 4 各分群與重要關鍵字 分群/數量 關鍵字 可能分群名稱 C1/158 兩岸、經貿、海歸、交流、經濟、政府、臺灣等 經濟與貿易 C2/71 安全、國際、軍事、全球化、戰略等 外交與軍事 C3/44 結構、華裔、土地、人民幣、財政、農民等 社會問題 C4/15 類型、組織、政治、主義、極權等 制度與改革 C5/90 政黨、民主、社會、態度、制度、決策、政治、黨國等 中共黨政 C6/10 斷裂、文化、民族、血緣、近代等 意識形態 C7/29 人口、城市、香港、環境保護、辦學等 區域治理 資料來源:作者自製。 本節依上述結果,加入人工檢閱以及具體分類描述,提供讀者了解 1998~2015 年 來「中國大陸研究」期刊所刊登的論文主題樣貌。本節亦將分析各個群組之逐年發表 數量,以了解各關鍵字趨勢演變。在本研究中,使用之樣本母體期刊(中國大陸研 究),每年稿件發表量有巨大變化:原為月刊,且每期論文篇數較多(每年約 50 筆),近年則改為季刊(每年約 20 筆),因此若只計算各類別的論文發表數量意義不 大。為此,本文再輔以「主題發表量」,以逐年分群中的文件數量除以該年總篇數, 計算出平均「群發表率」,以呈現各主題的年代趨勢演變。各分群的意義,解讀如 下。

一、「經濟與貿易」群

分群 1 主題關鍵字為「兩岸、國際、交流、經濟、政府」共有 158 篇文章被編入 此類,在各分群中數量最多,由多個主題合併而成,主要為為經貿海歸關係、國際貿 易關係、兩岸經濟關係、企業制度。如下圖所示: 圖 4 「經濟與貿易」群主題樹狀圖 資料來源:作者自製。 一、「經貿海歸」以及二、「國際貿易」方面,是以華人(Chinese)的經濟活動為 研究對象,再反映於選題的空間單位「中國」、「港澳臺」以及海外華人地區。相關文 章主要研究「改革開放(reform and openness)」政策下,所引發之橫跨國境、社會各

(13)

部門的制度變化與利益變動,也牽涉到少量與經濟部門有關的中共法制、炂中共權力體 制炚研究。此外,本分群之作者常用理論是經濟學與制度研究。在海外關係、海外華人 關係的部分,其關鍵字分別為「經貿、海歸、海歸派、大陸地區」與「澳門、談判、 身分、工資政策」。 三、兩岸經濟方面,多數選題與「臺陸來往」相關,結論則有「政策(投資)建 議」、「中國發展預測」兩種傾向。比如政策建議中將兩岸「三通」視為國際貿易,經 由與 GATT、WTO 規範的比較研究後,提出臺灣應有的配套、因應作為與談判策略; 投資建議比如建議兩岸合資企業依據「權力控制理論」設計董事會,以免台資失去經 營權。炃發展預測比如針對中國的不動產業、銀行業、債擔保的狀況展開分析,並陳述 有關交往風險、信用不足的種種觀察。牪此外,少數與海外華人相關的研究,選題綜 合,較為傾向歷史回顧性質。狖在關鍵字為「兩岸、整合、合作、經濟、臺灣」的兩岸 經濟關係的部分,第一個重點是台商投資環境,選題單位空間較大,在中國各區域的 發展特色不一、需求不同的觀察下,相關研究發現外商投資、外貿發展模式各不相 同,中央政策與地方現實也有落差,建議台商必須因地制宜。狋第二個重點較不偏重經 濟,而是兩岸社會各部門的交流議題,其包括 NGO、廉政、智慧財產、出版界、藝文 界、教育界、科技業的交流、借鑒與合作。狘 最後第四是「企業制度」,關鍵字為「企業、制度、改革、地方、政府」的經濟與 社會方面,就是研究由「改革開放」所引起的新型社會經濟問題。不同的研究者分別 就欠薪、就業、退休養老、網路管制問題,從中國政府、銀行、意識形態的結構中尋 註 炂 許光泰,「中國大陸合資企業董事會之法制分析」,中國大陸研究,第 41 卷第 11 期(2001 年 10 月),頁 19~36。 註 炚 寇健文,「既重用又防範的菁英甄補:中共海歸派高官的仕途發展與局限」,中國大陸研究,第 50 卷 第 3 期(2007 年 9 月),頁 1~28。 註 炃 許光泰,前引文,頁 19。 註 牪 陳奉瑤,「兩岸不動產估價規範之比較研究」,中國大陸研究,第 43 卷第 7 期(2000 年 7 月),頁 59~74;陳月端,「大陸地區保證制度之研究」,中國大陸研究,第 41 卷第 11 期(1998 年 11 月), 頁 57~67;呂青樺、沈中華,「影響大陸地區銀行獲利能力與風險的因素」,中國大陸研究,第 49 卷 第 3 期(2006 年 9 月),頁 119~142;黃啟瑞、董澤平、李文瑞,「中國銀行業國際化之區位選擇因 素」,中國大陸研究,第 52 卷第 1 期(2009 年 3 月),頁 1~28。 註 狖 「張虎」發表於中國大陸研究,第 41 卷第 1 期至第 43 卷第 6 期之間的 6 篇文章。以及談判相關事 務,邱坤玄、黃鴻博,「中國的負責任大國身分建構與外交實踐:以參與國際裁軍與軍備管制建制為 例」,中國大陸研究,第 53 卷第 2 期(2010 年 6 月),頁 73~110;張廖年仲,「論中共談判『原 則』之策略運用:從簽訂『全面禁止核試條約』為例」,中國大陸研究,第 47 卷第 3 期(2004 年 9 月),頁 169~188;王宗安,「達賴喇嘛與中共談判之癥結分析」,中國大陸研究,第 51 卷第 1 期 (2008 年 3 月),頁 103~117。 註 狋 朱景鵬,「區域主義、區域整合與兩岸整合問題之探討」,中國大陸研究,第 42 卷第 8 期(1999 年 8 月),頁 71~94;趙甦成,「中國大陸外貿與外資發展模式:省區與區域層面之比較」,中國大陸研 究,第 43 卷第 8 期(2000 年 8 月),頁 69~100。 註 狘 散見於劉勝驥、蕭真美為主的,發表於中國大陸研究,第 41 卷第 3 期至第 48 卷第 4 期之間的 8 篇論 文。

(14)

找原因,並提出公部門可改進之處。狉總體上,本主題分群為「中國大陸研究」所刊登 論文之類別主流主題,已為成熟發展之學科。

二、「外交與軍事」群

分群 2 共有 71 篇文章被編入此類。本分群的特色是以外交、軍事議題為主,在 1990 年代為臺灣社會對中國(大陸)的主要認知視角。本分群發表量占各分群第三 多,作者主要為國際關係學者。具體內容涵蓋外交行為、外交(戰略)思想、以及因 現實發展變化的軍事議題。依據分群主題關鍵字為:「安全、國際、軍事、全球化、戰 略」等等。 圖 5 「外交與軍事」群主題樹狀 資料來源:作者自製。 本分群具體內容有四個主題。主題一國際政治相關研究,主要為中共崛起如何改 變國際秩序,其中又以「新秩序」為重要關鍵字,如對外影響的視角上,「中國威脅 論」亦為重要主題。狜主題二為中國大陸周邊安全環境與安全政策的研究,內容牽涉到 軍備或軍事相關思想,其中大多與「中外關係」掛勾,著重中國對外來刺激的反應, 或者中國對外(國際環境)的影響。在外來刺激方面,美國與中國的擁核鄰國(印 度、巴基斯坦)是主要的議題來源,不同的研究者就核武裝、空中防禦、鄰國核試爆 的因應,發現中國在不同區域皆傾向奉行「和平共處」之外交原則,可依照中國放棄 核試爆的核武政策事例看出。狒 主題三是「安全相關研究」,內容以「新安全觀」為主,包括:1990 年代的安全 註 狉 江振昌,「欠薪問題與近期大陸工潮-集體行為觀點」,中國大陸研究,第 43 卷第 9 期(2000 年 9 月),頁 81~102;葉章美,「改革開放後大陸勞動力市場情勢與就業政策」,中國大陸研究,第 43 卷第 7 期(2000 年 7 月),頁 21~46;黃德北,「新自由主義與中國大陸退休養老制度改革」,中國 大陸研究,第 47 卷第 4 期(2004 年 12 月),頁 53~74;歐陽新,「中共網際網路的發展及其管制的 困境」,中國大陸研究,第 41 卷第 8 期(1998 年 8 月),頁 41~57。 註 狜 陳永康、翟文中,「中共海軍現代化對亞太安全之影響」,中國大陸研究,第 42 卷第 7 期(1999 年 7 月),頁 1~25;邵軒磊,「中國威脅論之解析-以日本相關研究文獻為例」,中國大陸研究,第 55 卷第 3 期(2012 年 9 月),頁 85~105。 註 狒 丁樹範,「中美關於太空、導彈防衛與核武政策爭議之研究」,中國大陸研究,第 53 卷第 1 期(2010 年 3 月),頁 99~133;張雅君,「印巴核武試爆後中共的南亞安全政策」,中國大陸研究,第 43 卷 第 2 期(2000 年 2 月),頁 15~35。

(15)

規範建構、狔防禦性軍事政策狚,結論多傾向於中共外交、軍事政策屬於被動性質,旨 在追求避免衝突的「安全」。此外,解釋了中共領導人的世界認知的形成過程亦為主要 主題,此一認知再形成新安全觀,導致諸如「中俄不結盟」的結果。狌總體來看,研究 對象仍以「鄧、江、胡」三代領導人時期為主。 主題四為中國面臨「全球化」之應對,由於中共的「獨立自主外交政策」具有深 遠傳統,相關研究主攻歷史回顧,結論也大致吻合現實中的後續發展。狑此外隨著 2000 年代國際恐怖主義抬頭,國際關係多元化,以及臺灣國際參與的過程,各種議題 也受到矚目,也反映於本分群的選題之中,其包括有石油外交、旅遊外交、反恐外 交 、 經 濟 援 助 , 研 究 者 透 過 環 境 理 論 ( contextual approach)、 援 外 分 布 理 論 ( aid distribution approach)、對元理論(dyadic approach)等等途徑解釋中國外交行為。玤

三、「社會問題」群

分群 3 包括 44 篇文章,在各分群中數量第四多,由 2 個分類合併而成,分別涉及 金融與企管、農村問題與地方經濟。本分群的特色在於處理微觀的議題,部份研究雖 然接近「國際經貿」分群的範圍,但本分群聚焦於稅制、貨幣使用、農業生產這些國 內日常民生議題。相較於「外交軍事」,本類別相關主題研究的基本較小,最多跨至 省、市,不討論全國、跨國的規模,但部份選題也與海外(美國、臺灣)有一定關 係,這是現代金融的本身特性及「改革開放」創造的金流環境所致,吻合現實。此 外,極具中國當地特色之農業問題,也是本分群的特色之一。依據機器分類,本分群 總關鍵字為:「結構、華裔、土地、人民幣、支出」,各分類另有關鍵字。 註 狔 朱蓓蕾,「全球化與中共安全觀:轉變與挑戰」,中國大陸研究,第 46 卷第 1 期(2003 年 11 月), 頁 75~108;于有慧,「後冷戰時代中共新安全觀的實踐與挑戰」,中國大陸研究,第 44 卷第 2 期 (2001 年 2 月),頁 57~76;袁易,「重新思考外空安全:一個中國建構安全規範之解析」,中國大 陸研究,第 52 卷第 2 期(2009 年 6 月),頁 1~41。 註 狚 張雅君,「世紀之交中共的軍事政策與亞太安全:防禦取向模糊性的探討」,中國大陸研究,第 42 卷 第 3 期(1999 年 3 月),頁 25~44。 註 狌 張雅君,「中俄睦鄰友好合作條約的性質、意涵與影響」,中國大陸研究,第 45 卷第 2 期(2002 年 3 月),頁 35~59;于有慧,「中共獨立自主外交政策的持續與轉變」,中國大陸研究,第 43 卷第 6 期 (2000 年 6 月),頁 1~19。 註 狑 于有慧,「中共獨立自主外交政策的持續與轉變」,頁 1~19;于有慧,「中共的大國外交」,中國大 陸研究,第 42 卷第 3 期(1999 年 3 月),頁 45~62。 註 玤 于有慧,「胡溫體制下的石油外交與挑戰」,中國大陸研究,第 48 卷第 3 期(2005 年 9 月),頁 25~50;范世平,「中國大陸旅遊外交政策之研究:以出境旅遊發展為例」,中國大陸研究,第 48 卷 第 2 期(2005 年 6 月),頁 61~97;張雅君,「中共反恐外交的實踐與成效之分析」,中國大陸研 究,第 48 卷第 1 期(2005 年 3 月),頁 53~83;林德昌,「海峽兩岸在非洲地區的經援政策」,中國 大陸研究,第 42 卷第 3 期(1999 年 3 月),頁 63~83。

(16)

圖 6 「社會問題」群主題樹狀圖

資料來源:作者自製。

金融與企管部分以「企業、華裔企業、匯率、人民幣、東亞」為主題關鍵字,相 關研究主題有二。主題一,是人民幣、稅賦等金融問題,如透過複迴歸分析研究「兩 稅合一」、玡結合「權重推估法」(weight-inference approach)與「匯率浮動程度推估

法」(flexibility-inference approach)之「綜合推估法」(the synthesized approach)研究 東亞匯率中的人民幣角色,再加上時事性質的中美政府介入匯率、玭匯率走勢玦等議 題。由於存在人民幣「緊盯美元」、中央推行「新稅法」這些背景事實,此類研究較依 賴實證資料。研究者大多根據現實的波動,描述現狀後再預測其短期趨勢。主題二, 是企業經營與政治經濟環境,案例研究包括中國國營企業、民間企業、台資企業等玢, 研究者運用包絡研究(DEA)、玠比較方法,玬主攻經營績效、需求不足玝的議題。比較 特殊的發現如:政治決定(如國企改革)對於中國地方經濟的絕對主導力、瓝國營傳媒

的變遷能證明季登斯結構化理論(Giddens’ Structuration Theory)中的「二重性」。 農村問題與地方經濟部分以「財政、農民、經濟、農村、中央」為關鍵字,相關 研究著重於農村經濟問題、社會現象的解決方法,其包括了「非農化」引起的現象、瓨 水資源短缺、甿粳稻與秈稻生產、畀土地所有制、村黨委書記的魅力型權威、甾義務教 註 玡 張敏蕾、黃智聰,「大陸『兩稅合一』稅制改革之意涵與其影響」,中國大陸研究,第 56 卷第 2 期 (2013 年 6 月),頁 70~113。 註 玭 趙文志,「美、中政府與市場在人民幣匯率改革中的角色:2003~2005」,中國大陸研究,第 51 卷第 4期(2008 年 12 月),頁 51~88。 註 玦 洪淑芬,「人民幣匯率走勢的探討」,中國大陸研究,第 42 卷第 1 期(1999 年 1 月),頁 19~35。 註 玢 傅豐誠,「中國大陸國有企業經營績效的變化」,中國大陸研究,第 48 卷第 4 期(2005 年 12 月), 頁 1~30;陳永生,「華裔與非華裔企業大陸投資績效之比較研究」,中國大陸研究,第 44 卷第 8 期 (2001 年 8 月),頁 23~42;林祖嘉、陳湘菱,「中國大陸本土企業、台資企業與外資企業生產效率 之比較研究」,中國大陸研究,第 52 卷第 4 期(2009 年 12 月),頁 1~20;邱正仁、吳志正、林怡 盈,「台商大陸投資兩岸三地財務績效之實證研究」,中國大陸研究,第 44 卷第 9 期(2001 年 9 月),頁 41~55。 註 玠 傅豐誠,前引文,頁 1。 註 玬 陳永生,「華裔與非華裔企業大陸投資績效之比較研究」,頁 23。 註 玝 洪淑芬,「大陸有效需求不足之分析」,中國大陸研究,第 46 卷第 1 期(2003 年 1 月),頁 1~22。 註 瓝 賴祥蔚,「湖南廣電集團的政治經濟分析」,中國大陸研究,第 46 卷第 4 期(2003 年 7 月),頁 103~124。 註 瓨 宋國誠,「『非農化』與農民意識之變遷」,中國大陸研究,第 42 卷第 4 期(1999 年 4 月),頁 45~64。 註 甿 熊自健,「評析中國大陸水資源短缺問題及中共的對策」,中國大陸研究,第 46 卷第 3 期(2003 年 5 月),頁 63~78。

(17)

育經費保障機制疌以及括及外省市的「外來現象」。疘這些研究普遍依賴歷史文獻,比 較重要成果包括:細緻探討農民的意識變遷、皯預測農村土地私有化的可能性、盳內陸 長距離跨省移民的性別問題。盱 前述已經提及本主題為逐漸發展之主題領域有逐漸攀升現象,其原因,隨著中國 大陸持續開放,各種社會問題浮現之外,國際(及兩岸)交流持續擴大臺灣得以開始 田野調查對中國社會問題已有更深認識,業已反映在發表趨勢上。

四、「制度改革」群

分群 4 包括 15 篇文章,本分群的特色在於對制度(法律、規範)因素的強調,選 題的著眼點多在於政治體制的「輸入」與「輸出」,不強調領導人或特殊事件的作用。 不過,中國政治關聯的研究,在機器分群中,已各別散至 6 大分群,本分群僅專注於 「政治體制」的範圍而已。原因之二,可從分群統計發現,其發表的高峰在 1999 年及 2001 年,時逢港澳回歸與中共領導人換屆,疊合外界對「中共政治體制改革」期待的 時間點。具體上,研究內容大多牽涉短期內不易產生劇變的議題,如所得分配、基層 民主以及社會網路。 圖 7 「制度改革」群主題樹狀圖 資料來源:作者自製。 從研究對象著眼,本分群的研究具有「高層」與「基層」兩種特徵。首先在高層 註 畀 施正屏,「中國大陸粳稻生產之經濟分析」,中國大陸研究,第 42 卷第 8 期(1999 年 8 月),頁 17~33;施正屏,「中國大陸秈稻生產之經濟分析」,中國大陸研究,第 42 卷第 1 期(1999 年 1 月),頁 77~93。 註 甾 江振昌,「魅力型權威與大陸農村社區發展之研究-以村黨委書記權威為例」,中國大陸研究,第 45 卷第 1 期(1999 年 1 月),頁 19~38。 註 疌 陳永生,「大陸優先設立『農村義務教育經費保障機制』之分析」,中國大陸研究,第 52 卷第 3 期 (2009 年 9 月),頁 39~70。 註 疘 江振昌,「『外來妹現象』與大陸的跨省區聯姻熱」,中國大陸研究,第 43 卷第 7 期(2000 年 7 月),頁 75~90。 註 皯 宋國誠,前引文,頁 45。 註 盳 許光泰,「中國大陸集體土地所有制變革趨勢之研究」,中國大陸研究,第 42 卷第 8 期(1999 年 8 月),頁 1~16。 註 盱 江振昌,「『外來妹現象』與大陸的跨省區聯姻熱」,頁 75。 類型; 組織; 政治; 主義; 極權

(18)

的範疇,相關研究多使用「極權主義」、「派系政治」、「世代政治」、「技術專家政治」 這四種典型研究途徑,研究者考察中共黨內的派系政治、菁英晉升以及監督機制後, 證實中共高層運作中並存著制度化、非制度性質,並肯定其中具有規律性。盰另在基層 的範疇,研究者著重關心基層民主、農村組織以及自發的社會運動,並發現在中國當 前極權體制下,民間力量仍有一定能動性,惟不能超出高層給定的「活動空間」,僅能 作事務性訴求,黨國體制不容動搖。盵高層、基層彼此相比,前者反而較具變遷潛力。 值得注意的是,本分群的部分研究主題(高層相關部分)雖與下一分群主題之一「中 共領導階層」相當類似,惟本分群以「國家體制」為中心,後一分群則以「黨」為著 眼點,須加區別。本主題在 1990 年代之前較少,如今隨中國大陸逐漸崛起,在「中國 大陸研究」刊物上是逐漸成長的主題。

五、「中共黨政」群

本主題為「中共黨政」,包括 90 篇文章,在各分群中數量第二多,由 3 個分類合 併而成,分別涉及中共領導階層、中共敏感議題(改革、領土、宗教)、中共黨史。由 於兩岸對峙的歷史背景,本分群在臺灣具有悠久研究傳統。本分群的具體內容,幾乎 牽涉了中國共產黨的各個方面,由裡到外的著眼點有:領導人決策、菁英晉升、共青 團、技術官僚、人民大會、黨國體制、中國宗教,以及中共黨組織之外的兩岸宗教、 在中臺灣人、臺灣統獨民意、外蒙古、梵蒂岡。依據機器分類,本主題總關鍵字為: 「政治、領導、決策、運動、人大」,各分類另有關鍵字。 圖 8 「中共黨政」群主題樹狀圖 資料來源:作者自製。 主題一:中共領導階層部分以「菁英、領導、中央、政治、層面」為關鍵字,相 關研究從「黨人」與「黨組織」兩處著眼,前者以正部級以上為分界,研究其菁英的 註 盰 蔡文軒,「中共派系政治途徑的分析:以大躍進起源為例」,中國大陸研究,第 48 卷第 1 期(2005 年 3 月),頁 85~104;寇健文,「中共菁英政治的研究途徑與發展」,中國大陸研究,第 47 卷第 3 期(2004 年 9 月),頁 1~28;馬祥祐,「論中國共產黨黨內監督條例(試行):從機制設計理論角度 分析」,中國大陸研究,第 51 卷第 2 期(2008 年 6 月),頁 1~2;徐斯儉,「軟紀律約束-中共強化 監督之政改的內在限制」,中國大陸研究,第 50 卷第 2 期(2007 年 6 月),頁 35~60。 註 盵 徐斯儉,「大陸農村經濟發展與基層民主發展的關係-鄉鎮企業產權改革與農村基層民主」,中國大 陸研究,第 44 卷第 5 期(2001 年 5 月),頁 19~40;張弘遠、李宗義,「中國大陸農村經濟發展中的 組織演變:四川省瀘江市 K 鎮勞保製品專業技術協會的個案研究」,中國大陸研究,第 44 卷第 10 期 (2001 年 10 月),頁 71~96;汪莉絹,「鑲嵌與自主:反壩運動中的大陸環保組織」,中國大陸研 究,第 56 卷第 1 期(2013 年 3 月),頁 1~32。

(19)

組成與甄補、矸幹部的政治繼承。矼在「改革開放」的時代變遷下,研究者發現了若干 不變之處,如:中共雖傾向以「專業技能」選拔菁英,但在日後升遷中仍以「黨職經 歷」為首要考量。綜合其他成文、不成文規則的研究,可發現期選拔機制根植深厚歷 史。矹此外,在此分類中,針對共青團、人民日報的研究有一共同發現,就是黨的次級 組織除了「幹部輸送」與「儀式化」的功能外,數十年來並未衍生更多自主性。矻 主題二:黨政議題一向是中共敏感之處(改革、領土、宗教)如「政黨、民主、 社會、態度、制度」等關鍵字。其下細分對內有社會不平等結構問題、黨的貪腐問 題、城鄉戶口問題,矺對外有臺灣統獨民意、西藏獨立問題、天主教管制、梵蒂岡「聖 統制」問題以及蒙古相關消息。矷這些研究有助理解中共黨組織之行為準則。 主題三:中共黨史部份以「決策、政治、黨國、事件、民主」為關鍵字,研究重 點是決策機制。首先,有關制度的主要發現是:中共具有自訂規則解決問題、自我強 化的傳統,其「黨管幹部」管理體制與西方的「行政中立」有若干不同之「黨政協 調」機制。祂其次,有關領導人研究的主要發現是:鄧小平與毛澤東在「反右運動」、 註 矸 黃信豪,「有限活化的中共菁英循環:黨政領導菁英組成的跨時考察」,中國大陸研究,第 53 卷第 4 期(2010 年 12 月),頁 1~33;陳德昇、陳陸輝,「中共『十七大』政治菁英甄補與地方治理策 略」,中國大陸研究,第 50 卷第 4 期(2007 年 12 月),頁 57~85;趙建民、張鈞智,「菁英循環或 再生?十二大以來中共技術官僚的發展趨勢」,中國大陸研究,第 49 卷第 2 期(2006 年 6 月),頁 69~97。 註 矼 寇健文,「中共『幹部年輕化』與政治繼承」,中國大陸研究,第 44 卷第 5 期(2001 年 5 月),頁 1~17;黃信豪,「制度化下的中共菁英晉升:接班人栽培的觀點」,中國大陸研究,第 56 卷第 1 期 (2013 年 3 月),頁 33~60。 註 矹 黃信豪,「制度化下的中共菁英晉升:接班人栽培的觀點」,頁 54~55。 註 矻 寇健文,「共青團與中共政治精英的甄補:團中央常委仕途發展調查」,中國大陸研究,第 44 卷第 9 期(2001 年 9 月),頁 1~26;張裕亮,「大陸黨報從業員依附行為的轉變-以人民日報為例」,中國 大陸研究,第 46 卷第 6 期(2003 年 11 月),頁 109~135。 註 矺 陳志柔,「中國大陸的不平等結構與制度變遷」,中國大陸研究,第 42 卷第 10 期(1999 年 10 月),頁 1~15;于有慧,「列寧式黨國體制與中國貪腐問題的發展」,中國大陸研究,第 56 卷第 1 期(2013 年 3 月),頁 127~147;林宗弘、曾惠君,「戶口的政治:中國大陸與臺灣戶籍制度之歷史 比較」,中國大陸研究,第 57 卷第 1 期(2014 年 3 月),頁 63~96。 註 矷 沈赫周,「中國對西藏獨立態度之研究」,中國大陸研究,第 46 卷第 6 期(2003 年 11 月),頁 163~183;陳義彥、陳陸輝,「模稜兩可的態度還是不確定的未來:臺灣民眾統獨觀的解析」,中國大 陸研究,第 46 卷第 5 期(2003 年 9 月),頁 1~20;劉勝驥,「臺灣民眾統獨態度之變化」,中國大 陸研究,第 41 卷第 3 期(1998 年 3 月),頁 7~30;喬一名,「2001 年的梵中(共)關係之研析」, 中國大陸研究,第 44 卷第 6 期(2001 年 6 月),頁 25~40;喬一名,「展望公元 2000 年梵蒂岡與中 共的關係」,中國大陸研究,第 43 卷第 4 期(2000 年 4 月),頁 43~58;喬一名,「梵蒂岡與中共關 係之探討」,中國大陸研究,第 41 卷第 7 期(1998 年 7 月),頁 59~69;熊自健,「『中國天主教愛 國會』與『中國天主教主教團』的組織與活動」,中國大陸研究,第 41 卷第 1 期(1998 年 1 月), 頁 30~41。 註 祂 黃意植,「領導格局轉換下的成文規則演變:以 1978 年至 2006 年中共黨內幹部管理法規為例」,中 國大陸研究,第 56 卷第 2 期(2013 年 6 月),頁 31~44;桂宏誠,「中國大陸黨管幹部原則下的公務 員體制」,中國大陸研究,第 56 卷第 1 期(2013 年 3 月),頁 61~89;邵宗海,「中共中央工作領導 小組的組織定位」,中國大陸研究,第 48 卷第 3 期(2005 年 9 月),頁 1~23。

(20)

「反教條主義運動」、中蘇關係、二線分工以及文藝政策當中的作用。礿中共黨政是傳 統研究主題,其主題亦為穩定發展,從趨勢來看是第二主流。

六、「意識形態」群

分群 6 包括 10 篇文章,是數量最少的分群。由於關鍵字較為分散,因此省略圖 示。本分群特色是傾向從歷史、文明「概念」中尋找現狀的解釋、問題的解決方法。 在這些研究中,主要研究文化「現象」,秅如文化研究、文化人類學、知識史的學問分 野。穸 本分群的主題可區分為二。其一是「中國知識的形成」等社會科學知識論問題, 主要發現是質疑中國學(China study)知識的非科學性,其作為西方二元知識論的產 物,可能形成封閉傾向的知識霸權。穻在此知識基礎上上,討論有關「中國」、「中國知 識」以及「中國民主化」的概念,竻其他以日本、印度為例的研究,就說明了這種知識 形成的過程。籵此外,古中國的戰略文化、朝貢體系的復甦跡象、少數民族的想像社群 與漢化,他們的未來走向,都被認為取決於中國本土思想或文化的方向。糽研究中共意 識形態主題歷史悠久,伴隨馬克思主義、社會主義、後現代、毛思想等等主題。 註 礿 鍾延麟,「鄧小平在 1957 年中共整風、『反右派』中之角色」,中國大陸研究,第 50 卷第 4 期 (2007 年 12 月),頁 87~116;鍾延麟,「1958 年鄧小平在解放軍『反教條主義』運動中之角色與活 動」,中國大陸研究,第 49 卷第 4 期(2006 年 12 月),頁 77~103;鍾延麟,「鄧小平在中蘇關係中 之角色與作為(1956~1976)-兼論對『鄧小平研究』之意義」,中國大陸研究,第 48 卷第 4 期 (2005 年 12 月),頁 85~110;趙建民、蔡文軒,「毛澤東時期『二線分工』的運作及其對決策過程 的意涵」,中國大陸研究,第 48 卷第 2 期(2005 年 6 月),頁 1~30;周玉山,「中共文藝政策溯 源」,中國大陸研究,第 41 卷第 7 期(1998 年 7 月),頁 21~31。 註 秅 石之瑜,「找回親屬血緣:貴州惠水布依族作為想像的社群」,中國大陸研究,第 46 第 3 期(2003 年 5 月),頁 115~129。 註 穸 文化研究關注工業社會中,特定現象與特定議題(意識形態、社會階級、種族、性別)的關聯。文化 人類學以田野調查為方法,以民族誌(Ethnography)為描述文本。知識史尚無嚴格定義,亦不屬於歷 史學的分支。 註 穻 石之瑜,「鑿開霸權:普世主義與相對主義之外關於『民主』的知識」,中國大陸研究,第 44 卷第 3 期(2001 年 3 月),頁 1~15。 註 竻 郭佳佳、石之瑜,「鄭永年的中國新民族主義敘事-華裔作家的一種身分策略」,中國大陸研究,第 51卷第 3 期(2008 年 9 月),頁 63~84。 註 籵 石之瑜、黃威霖、余帛燦,「在帝國之外看見精神聯盟-從泰戈爾的文明視野談印度知識界的一種中 國認識」,中國大陸研究,第 51 卷第 3 期(2008 年 9 月),頁 85~102;石之瑜、李靜旻,「斷代與 斷裂-日本近代中國認識的基礎脈絡」,中國大陸研究,第 50 卷第 1 期(2007 年 3 月),頁 9~28。 註 糽 楊仕樂,「物質基礎、理念慣性:中國『王道』戰略文化的實證檢驗 1838~1842」,中國大陸研究, 第 54 卷第 1 期(2011 年 12 月),頁 1~27;張登及、陳瑩羲,「朝貢體系再現與『天下體系』的興 起?中國外交的案例研究與理論反思」,中國大陸研究,第 55 卷第 4 期(2012 年 12 月),頁 89~123;石之瑜,「雲滇民族山區漢化問題初探」,中國大陸研究,第 41 卷第 9 期(1998 年 9 月),頁 25~43;王明珂,「當代中國民族政策下的羌族及其歷史─兼評中國少數民族研究中的『近 代建構論』」,中國大陸研究,第 43 卷第 7 期(2000 年 7 月),頁 1~19。

(21)

七、「區域與治理」群

本分群為「區域與治理」,包括 29 篇文章,由 2 個分類合併而成,分別是開發與 治理、人口與都市管理。本分群的特色是與「人口的時空流動」息息相關,而研究對 象的行政層級是各分群中最低的,雖部分選題與「社會問題」分群接近,但本分群的 歷史跨度較大。選題較多的西部大開發、人口問題問題都具有較深的歷史背景。依據 機器分類,本分群總關鍵字為:人口、城市、香港、環境保護、辦學。 圖 9 「區域與治理」群主題樹狀圖 資料來源:作者自製。 各分類另有關鍵字。如開發與治理的類別以「城市、開發、建設、西部、安置」 為關鍵字,相關研究以「改革開放」後的人口空間流動為特徵,具體涉及了:西部大 開發的人力資本投資策略、西部大開發的歷史前身(三線建設)、中共與解放軍的關 係、隊伍軍人的安置、貧困農民工的安置耵等問題,這些研究所欲解決的問題,其根源 大多可追溯到毛澤東時代,公部門的作為(如何治理),則是解決問題的關鍵所在。 人口與都市管理的類別以「人口、香港、辦學、環境保護、房屋」為關鍵字,相 關研究主攻在時間流動中的人口,所帶來的人口老化問題、都市治理暨都市化問題。 研究者發現,毛時代的生育政策致使中國人口從 1970 年代開始快速轉型,隨之而來的 人口老化現象,對中國經濟、財政、社會產生各種衝擊。肏中國人口轉型的特殊性,在 於它是非自然、誘導式的轉變。肮故即使強制節育解決了人口過多問題,但又會衍生更 多問題,並與失業、民工潮、學童中輟匯流,共同構成複合性的中國人口問題。肣不同 的研究者分別以實證經濟研究方法與政治經濟學,從中國城鄉的人口就業趨勢、就業 差距的研究中,證明了這些問題,肸「城鄉一體化」則是解決方案之一。肵中國各大城 註 耵 王瑞琦,「從市場機制的發展看西部大開發中人力資本投資的策略」,中國大陸研究,第 45 卷第 3 期 (2002 年 5 月)頁 1~25;耿曙,「『三線』建設始末:大陸西部大開發的前驅」,中國大陸研究,第 44卷第 12 期(2001 年 12 月),頁 1~20;丁樹範,「1990 年代以來的中國黨軍關係」,中國大陸研 究,第 46 卷第 2 期(2003 年 3 月),頁 57~80;楊瑞宗,「中共退伍軍人轉業安置制度述評」,中國 大陸研究,第 42 卷第 6 期(1999 年 6 月),頁 45~58;方山,「大陸城市農民工貧困問題」,中國大 陸研究,第 42 卷第 11 期(1999 年 11 月),頁 33~42。 註 肏 方山,「大陸生育政策與人口老化」,中國大陸研究,第 43 卷第 7 期(2000 年 7 月),頁 47~57。 註 肮 方山,「析述大陸人口轉型與人口老化現象-從生育政策面探究」,中國大陸研究,第 41 卷第 4 期 (1998 年 4 月),頁 49~60。 註 肣 方山,「生育轉型與改革形勢下的大陸人口新問題」,中國大陸研究,第 41 卷第 12 期(1998 年 12 月),頁 23~33。 註 肸 耿慶武,「中國大陸人口就業城市化趨勢與展望」,中國大陸研究,第 44 卷第 11 期(2001 年 11 月),頁 37~65;吳德美,「中國大陸都市非正式部門就業中的城鄉差異」,中國大陸研究,第 46 卷 第 5 期(2003 年 9 月),頁 127~150。

(22)

市的地位格局亦已固定。肭 從趨勢來看,本研究主題曾在 90 年代末較為流行,而在 2006~2011 年較為沈寂, 近日有逐漸復甦的傾向。

伍、綜合主題分群結果討論

針對 473 篇文章的自動化分群,共 7 個主題群組,做為本次分析的對象。此篩選 結果顯示 1998~2015 這 18 年來「中國大陸研究」期刊 473 篇文章的研究主題。上述分 類符合此領域學術知識的認知,顯示了本刊確實是本領域中重要的綜合性期刊。從各 主題的發表量(包括「發表數量」、「發表百分率」)之變化,可看出歷年期刊(或研究 者)偏好主題之演進。本研究顯示 C1 與 C3 是兩個主要的主流主題,其他主題則變化 較大,有的主題近年較為沈默、有的主題看得出有逐漸興起的趨勢。 茲將各類別在各年度的論文數量呈現如下: 表 5 各年主題變遷數量圖 分群 C1 C2 C3 C4 C5 C6 C7 Total 1998 22 5 7 0 7 1 7 49 1999 13 14 8 1 10 0 5 51 2000 27 8 1 0 8 1 5 50 2001 14 11 2 2 12 0 2 43 2002 8 6 2 0 5 1 2 24 2003 10 5 5 0 4 1 2 27 2004 10 1 1 2 5 0 1 20 2005 4 6 2 1 5 0 0 18 2006 4 3 1 0 5 0 0 13 2007 6 2 1 1 4 1 1 16 2008 7 1 1 1 2 1 1 14 2009 7 3 3 1 1 1 0 16 2010 4 2 2 0 5 0 0 13 2011 2 0 2 0 3 1 0 8 2012 5 4 1 1 2 1 0 14 2013 3 0 4 2 6 0 1 16 2014 7 0 1 2 2 0 1 13 2015 5 0 0 1 4 1 1 12 Total 158 71 44 15 90 10 29 417舠 資料來源:作者自製。 註 肵 洪朝輝、梁紅,「城市因素與大陸農村剩餘勞力的轉移」,中國大陸研究,第 42 卷第 6 期(1999 年 6 月),頁 31~43。 註 肭 楊勝群,「區域的整合與衝突:京津冀城市區域的治理與矛盾」,中國大陸研究,第 57 卷第 1 期 (2014 年 3 月),頁 1~31。 註 舠 註:最終數量不同於輸入資料是因為離群值,請參考表 3 後續之說明。

(23)

依照歷年總體數據分布圖,可以看出總體發表之絕對數量而言,全體數據是在減 少。原因是因為「中國大陸研究」原為雙月刊,每期皆有 10 篇左右學術文章,每年約 有 50 篇論文。現為季刊,每期約有 4~6 篇文獻。若以絕對數量來看,則發現在 2002 年後,其數量均顯著下降,較不容易看出各主題趨勢的變遷,因此本文進一步使用 「各個類別文章數量除以該年文章發表總數量」,來計算「中國大陸研究」的各年各分 類之所占比例,如表 6 所示。 表 6 各年各主題發表比率表 主題 C1 C2 C3 C4 C5 C6 C7 Total 1998 44.90% 10.20% 14.29% 0.00% 14.29% 2.04% 14.29% 100.00% 1999 25.49% 27.45% 15.69% 1.96% 19.61% 0.00% 9.80% 100.00% 2000 54.00% 16.00% 2.00% 0.00% 16.00% 2.00% 10.00% 100.00% 2001 32.56% 25.58% 4.65% 4.65% 27.91% 0.00% 4.65% 100.00% 2002 33.33% 25.00% 8.33% 0.00% 20.83% 4.17% 8.33% 100.00% 2003 37.04% 18.52% 18.52% 0.00% 14.81% 3.70% 7.41% 100.00% 2004 50.00% 5.00% 5.00% 10.00% 25.00% 0.00% 5.00% 100.00% 2005 22.22% 33.33% 11.11% 5.56% 27.78% 0.00% 0.00% 100.00% 2006 30.77% 23.08% 7.69% 0.00% 38.46% 0.00% 0.00% 100.00% 2007 37.50% 12.50% 6.25% 6.25% 25.00% 6.25% 6.25% 100.00% 2008 50.00% 7.14% 7.14% 7.14% 14.29% 7.14% 7.14% 100.00% 2009 43.75% 18.75% 18.75% 6.25% 6.25% 6.25% 0.00% 100.00% 2010 30.77% 15.38% 15.38% 0.00% 38.46% 0.00% 0.00% 100.00% 2011 25.00% 0.00% 25.00% 0.00% 37.50% 12.50% 0.00% 100.00% 2012 35.71% 28.57% 7.14% 7.14% 14.29% 7.14% 0.00% 100.00% 2013 18.75% 0.00% 25.00% 12.50% 37.50% 0.00% 6.25% 100.00% 2014 53.85% 0.00% 7.69% 15.38% 15.38% 0.00% 7.69% 100.00% 2015 41.67% 0.00% 0.00% 8.33% 33.33% 8.33% 8.33% 100.00% 資料來源:作者自製。 就百分比堆疊圖來看,可以看出各年比率較明顯的波動。

(24)

圖 10 各年各主題發表比率表 資料來源:作者自製。 總上述圖表看來,C1 為「中國大陸期刊」之主流,比例始終排名第一,為穩定發 展之研究主題,特別是近年隨中國在世界經濟角色之增強,發表比率也有微幅增加的 趨勢。而次一穩定發展之研究主題為 C3,每年也均有穩定成長。C5 之研究,雖然較 少,但每年也有固定的發表數量。上述三個分類較為穩定,且總體而言持續發展。 相對稀缺之主題為 C6,除 2011 年外,比率均為個位數,是比較少人研究的主 題。在 2006~2012 年較為風行,但近年較少研究。C2 在前半期一直是「中國大陸研 究」期刊之研究主力,但近幾年逐漸減少,由一些關鍵字觀察,可發現其研究多與 C1 主題相近,可能是主題轉移之原因。C7 主題之變化較大,大略呈現週期性變化。初 期、中期、末期均有發表量,但過程中有萎縮,特別是在 2008~2012 期間,幾乎沒 有。因此是否該主題在 2008 年前後有變化?或是期刊之性質改變?則是可以深入思考 之議題。C4 這一主題一直有少量發表,近年亦有漸漸變多傾向。

陸、結 論

本研究蒐集 473 篇「中國大陸研究」期刊的文獻,年份介於 1998~2015 年間,使 用自動化分類計算工具(CATAR),並配合人工檢閱篩選結果,實現以中文單一期刊

(25)

之「篇名、摘要」之非結構化文字資料對主題進行分群的實作。配合近年來對「中國 大陸研究」的反思,本研究提供一個可快速獲得結果,並可反覆檢驗的基礎。讀者可 由本文第三節的試做中窺諸一二,從測試樣本中,可以看出本方法雖未及完美,但已 經可以做到便利使用者能輕易觀測大量文獻之方法。因此,在後續的節次中,本研究 繼續分析較大量的目標文獻。 本文並不宣稱在此方法、語料能夠全面性的找到臺灣之中國研究之關鍵主題,而 是就單一期刊(國際關係研究中心發行之「中國大陸研究」)中,找到歷年之主題變 化,並檢選出關鍵字,以供人檢閱。如表 4 所示,本研究從上述文獻基礎,區分了 「中國大陸研究」之七大主題及其關鍵字,分別是:「1 兩岸、經貿、海歸、交流、 經濟、政府、臺灣」、「2 安全、國際、軍事、全球化、戰略」、「3 結構、華裔、土 地、人民幣、財政、農民」、「4 類型、組織、政治、主義、極權」、「5 政黨、民 主、社會、態度、制度、決策、政治、黨國」、「6 斷裂、文化、民族、血緣、近 代」」、「7 人口、城市、香港、環境保護、辦學」,並從發表量(包括「發表數 量」、「發表百分率」)之變化,看出歷年期刊(或研究者)偏好主題之演進。 本研究旨在:1.呈現了臺灣「中國研究」逐年文章主題與關鍵詞彙的演變趨勢。2. 將所有「個別」的研究找到共通議題或主題之可能性,並且試做了少量樣本的分群, 其分群結果與常識相符,顯示此自動化工具應用到較大樣本也有一定的成效。3.此主 題分類自動化技術可篩選出各個分群關鍵字,提供研究者方便查閱過去的研究趨向。4. 根據各主題逐年的趨勢演變,提供後續研究的方向指引。 本研究所使用之自動化軟體,僅是讓後進學習者更方便能歸納前人知識,並不否 定專家歸納、整理、判斷之重要性。文本數據有其用處與限制,合理的應用依然要靠 讀者活學活用,以自身專業找尋「脈絡」。本研究驗證了自動方法的可行性,後續可 擴大分析範圍(如更多期刊、更長時間),以利用自動化主題分析帶來的效率以及更 多可能的意外發現。 * * * (收件:105 年 7 月 1 日,接受:106 年 11 月 27 日)

數據

圖 2  多階段主題歸類示意圖  資料來源:作者自製。  上述 MSC 的多階段歸類,將相似的文章合併成概念,再將類似的概念合併成主 題,只是一種理想的情形。實際執行 MSC 時,有可能兩個類似的概念合併後,並無法 形成一個被認可的合理主題。例如中國大陸的「改革」與「開放」兩個概念,常被一 起提及,合併成一個主題似無不可,但也許有學者會認為這兩個概念還是有所區別。  有關本研究之本體論與後設理論部分,已有相當知名學者屢有創見,如:關於 「脈絡」之啟發, 炄 對於實證方法之討論, 炑 皆已有相當積累。本文主要
表 4  各分群與重要關鍵字  分群/數量  關鍵字  可能分群名稱  C1/158  兩岸、經貿、海歸、交流、經濟、政府、臺灣等  經濟與貿易  C2/71  安全、國際、軍事、全球化、戰略等  外交與軍事  C3/44  結構、華裔、土地、人民幣、財政、農民等  社會問題  C4/15  類型、組織、政治、主義、極權等  制度與改革  C5/90  政黨、民主、社會、態度、制度、決策、政治、黨國等  中共黨政  C6/10  斷裂、文化、民族、血緣、近代等  意識形態  C7/29  人口、城市、香港、
圖 10  各年各主題發表比率表  資料來源:作者自製。  總上述圖表看來,C1 為「中國大陸期刊」之主流,比例始終排名第一,為穩定發 展之研究主題,特別是近年隨中國在世界經濟角色之增強,發表比率也有微幅增加的 趨勢。而次一穩定發展之研究主題為 C3,每年也均有穩定成長。C5 之研究,雖然較 少,但每年也有固定的發表數量。上述三個分類較為穩定,且總體而言持續發展。  相對稀缺之主題為 C6,除 2011 年外,比率均為個位數,是比較少人研究的主 題。在 2006~2012 年較為風行,但近年較少研究。C2

參考文獻

相關文件

As for Deqing's structural analysis of the text of the Lotus Sūtra, inspired by a paragraph in the text, Deqing divided the main body of the text into four parts: teaching (kai 開)

Teachers may encourage students to approach the poem as an unseen text to practise the steps of analysis and annotation, instead of relying on secondary

How would this task help students see how to adjust their learning practices in order to improve?..

The difference resulted from the co- existence of two kinds of words in Buddhist scriptures a foreign words in which di- syllabic words are dominant, and most of them are the

Performance metrics, such as memory access time and communication latency, provide the basis for modeling the machine and thence for quantitative analysis of application performance..

Relevant topics include, but are not limited to: Document Representation and Content Analysis (e.g., text representation, document structure, linguistic analysis, non-English

important to not just have intuition (building), but know definition (building block).. More on

Additional Key Words and Phrases: Topic Hierarchy Generation, Text Segment, Hierarchical Clustering, Partitioning, Search-Result Snippet, Text Data