文字探勘技術輔助主題分析
—以「中國大陸研究」期刊為例
∗
邵 軒 磊
(國立臺灣師範大學東亞學系助理教授)曾 元 顯
(國立臺灣師範大學圖書資訊學研究所教授)摘 要
中國大陸(Mainland China)做為社會科學學術研究對象,隨學科變遷 以及兩岸情勢發展,在各時期有不同主題。承此,本文使用主題分析工具 (CATAR),對「中國大陸研究」期刊於 1998~2015 年刊載之論文,透過論 文的篇名與摘要文字,從事主題群聚(clustering)分析,藉以辨識顯著的研 究主題,及其關鍵字,並以此觀察各主題發展趨勢。結果呈現出「中國大陸 研究」之 473 篇文章,可歸類為七大主題,每一主題各有關鍵字。從每個主 題的發表量(包括「發表數量」、「發表數量百分率」)之變化,可看出歷年 期刊(或研究者)偏好主題之演進。從趨勢可以看出,存在兩個主流議題, 其他主題的年度篇數則變化較大。本研究貢獻為:1.對「各篇獨立」的研究 找到共通主題之可能性,從少量樣本的分群實驗,結果與常識相符,驗證了 自動化主題分析的可行性。2.呈現了臺灣學術界在「中國大陸研究」方面的 研究關鍵字發展趨勢。3.擷取出各個主題的關鍵字,提供未來研究者方便查 閱過去的研究趨向。4.根據逐年的趨勢演變,呈現後續研究的主題方向。 關鍵詞:中國大陸、主題分析、自動歸類、知識探勘、學術系譜 * * * * 本論文由「中國大陸之日本研究知識社群:系譜學、社會網絡、數位人文」NSC:104-2410-H-003-021-MY3 提供研究資源。通訊作者:曾元顯。 DOI:10.30390/ISC.201803_57(1).0002壹、研究背景
一、研究緣起
「中國大陸」做為社會科學學術研究對象,因其特殊之歷史、政治、經濟關係, 在臺灣知識界無疑佔有相當重要的地位,較諸其他研究對象,其在學科上變遷經歷十 分特殊。中國大陸於 70 年代末改革開放至今,政治社會轉型變遷劇烈,成了全球性之 熱門研究議題。臺灣之中國研究學者,一方面有西方社會科學訓練的基礎,二方面有 語言優勢,因此在知識生產與創作上,臺灣之「中國研究」學者擁有十分特殊的學術 地位。加上兩岸關係近年之變化,就現實需要而言,了解「中國大陸」乃至了解「中 國大陸研究」,在學術層次與實務層次,皆有相當之必要性。 自 1990 年代起,社會科學開始注意學界中各種方法論與研究途徑之統整。至本世 紀初期,逐漸開展「對中國研究之再研究」,有學者稱此為「學科典範變遷」或是「知 識社群研究」。此種發展可分為三種途徑,如表 1 所示:歷史(學術史)研究法、典範 研究法、社群研究法。第一種歷史研究法,多以年代分別再標註出各年代特色:如研 究者指出臺灣此一議題研究應分為三個時期:匪情研究(1949 年到 1981 年);中共研 究(1971 年到 1991 年);中國大陸研究(1988 至現在)。三期的不同在於:研究對 象,由中共逐漸變為全方位中國;研究方法則由歷史敘事、社會科學進展到田野調 查;學群也由政府獨佔,轉變到民間更為活躍的情形等等。泝另有學者沿用此一方式, 試圖以研究型態(國家或社會主導)、研究內涵(政策或學術取向)做為縱橫座標,提 出四種象限,並以「制度變遷與社會現實需要」兩種層次來解釋為何中國研究會改 變,並以新制度主義如何進入臺灣的中國研究學術社群為例,介紹了「典範轉移」的 歷史過程。沴 第二種是典範研究法,以爭辯中的兩岸關係理論、沊中國大陸研究方法與成果沝兩 書為例,網羅了臺灣主要的國際關係學者,以各種方法呈現出自身之中國研究成果。 其中包含整合理論、分裂國家模式、談判模式、經貿政策、心理分析、戰略三角理 論、國際體系論、安全典則論等。沀這些書籍主要替後進研究者,呈現各家中國研究者 各種研究方法,對於個別單一研究方法之選擇與討論上較無揚抑之舉。 註 泝 楊開煌,「臺灣中國大陸研究之回顧與前瞻」,東吳政治學報,第 11 期(2000 年 9 月),頁 76~87。 註 沴 張弘遠、李宗義,「中國研究在臺灣:研究體制的發展與變遷」,石之瑜主編,從臨摹到反思-我國 社會科學博士對歐美知識與體制的回應(臺北:漢蘆,2005 年),頁 252~282。 註 沊 包宗和、吳玉山主編,爭辯中的兩岸關係理論(臺北:五南,1999 年)。 註 沝 何思因、陳德昇、耿曙主編,中國大陸研究方法與成果(臺北:國立政治大學國際關係研究中心, 2003年)。 註 沀 包宗和、吳玉山主編,爭辯中的兩岸關係理論,頁 1。第三種為知識社群研究法。本研究法強調每一個研究者因為其自身特殊之學術地 位,如「遷台學者、國安體系、歸國留學學者、全球化時代」等等,解釋臺灣研究中 國大陸之變遷。途徑近似於歷史(學科史)研究法,但更多強調口述歷史、訪談、系 譜學等,加入了對研究者個體成長歷史之關懷,強調研究者自身偶然與選擇之作用。泞 表 1 臺灣的中國研究變遷一覽表 主要研究途徑 主要分類 研究對象 主要關注 解釋變遷原因 歷史研究法 依照年代差別:匪情研究(1949-81)中共研究(1971-91)中國 大陸研究(1988-)等等 以中共中央研究為 主,之後擴大為全 部中國大陸 在不同年代下所 產生的不同變化 。 外在環境不同,而研 究者研究取向自然不 同。 典範研究法 依照學科、模式或研究途徑(如 整合理論、分裂國家模式、談判 模式、經貿政策、心理分析等) 主要是各層次議題 的「中國案例」 各學科視角下的「案例中國」 由於學科與研究方法論,其不同訓練研究 者,在「中國」案例 中的應用。 知識社群 各研究者之社群狀態(大學學 者、國安系統、大陸相關工作人 員等等) 各知識分子因職業 或自身際遇 個體之偶然與選 擇。 知識分子亦為社會人 ,因其社會角色而做 不同研究。 資料來源:作者自製。 上述研究法統整「中國大陸研究」或「知識社群」,卓有見地。然而,上述方法 皆奠基於大量實務累積與論文閱讀,並以資深學者之經驗,形塑此一學科之框架。本 文試圖使用文字知識探勘技術工具,整理此一領域具代表性期刊之一的「中國大陸研 究」之研究論文,將其自動化分類,以另一種方式呈現對「中國大陸研究」之討論。
二、問題意識與研究回顧
文字探勘在其他學科有一定成果,數位人文學科(digital humanity)也有相關的研 究。泀在美國已有相關的論文討論其演變、哲學上之意義與實用研究上之可能範圍,當 前諸多研究者之首要問題意識,多為其科技能力是否能應用在本身領域,正在一步步 擴充其認識論疆界。洰在英文之政治學研究中,美國的 Grimmer 與 Stewart 提出「Text as Data」的觀 念,將政治相關文本(text)視為某種可被解析之資料(data),進而利用各種文字處 理與統計分析方法進行分類或歸類的運算(可統稱為文字探勘技術),以進行大量文 註 泞 石之瑜、包淳亮,「在臺灣研究中國/大陸:知識政治與政治知識」,展望與探索,第 10 卷第 10 期 (2012 年 10 月),頁 34~55。 註 泀 關於自然語言與論述脈絡的研究,請參考徐振國,「政治學改造運動的爭議和啟發:從『通則』到 『脈絡』的轉向」,政治與社會哲學評論,第 45 期(2013 年 6 月),頁 1~61;金觀濤、劉青峰, 「隱藏在關鍵詞中的歷史世界」,鄭文惠主編,東亞觀念史集刊,第 1 期(臺北:國立政治大學, 2011 年),頁 57~75。
註 洰 Susan Schreibman, Ray Siemens, John Unsworth eds., A Companion to Digital Humanities( Oxford: Blackwell, 2004).
件的自動化資訊組織與主題分析,從而提供潛在有用、先前未被關注的訊息。泍其提到 曾 被 探 勘 、 分 析 過 的 政 治 文 本 類 型 有 : 新 聞 語 料 、 國 會 議 員 的 正 式 發 言 ( floor speeches)、總統與立委或政黨的聲明、被提出的法案、公聽會內容、條約、以及政治 論文等。對自動內容分析的方法與成果,Grimmer 與 Stewart 根據其經驗與觀察,提出 了四項原則(principles):1.所有文字語言相關的量化模型都是錯的,但有些是有用 的(這是因為語言文字有其模糊性,沒有數學方法可以精確的反應此現象,但近似的 運算,對多數分析文字的任務就有幫助);2.這些量化的方法可增強專家的分析能 力,而非取代專家;3.沒有最佳、最好的方法可用來分析所有種類的文本,不同的方 法適用於不同類型與內容的文本;4.自動化方法可大量降低人工時間與成本,但對其 結 果 需 要 驗 證 、 驗 證 、 再 驗 證 , 以 確 保 其 有 效 性 。 這 些 原 則 , 是 相 當 好 的 洞 察 (insights),可做為數位人文領域應用自動化技術時的參考指引(guide)。 在國際衝突不斷,價值體系各異的現代環境下,歐洲的 Christen 與 Alfano 等人則 運用文字探勘技術,分析大量訃文、墓誌銘等對死者生前事蹟的描述語料。其方法主 要是將語料中的關鍵詞抽取出來,並分析這些關鍵詞是否常出現於同一文本中,依此 計算關鍵詞的相似度,再利用視覺化技術,將此關鍵詞相似網路繪製出來,以利專家 快速辨識語料中最常提到的概念與其之間的關係,從而解讀各國不同文化中,對於價 值、道德、幸福的認知。泇其文字探勘方法,為目前已成熟之技術,沰惟其使用的語 料,則相當創新,但也有可爭議之處(如:墓誌銘大多不會提及死者的負面事蹟與評 價)。 為了了解中國大陸 50 年的轉變,日本的中國研究學者 Murata Tadayoshi(村田忠 禧)以 1949 年到 2002 年人民日報每年的元旦社論為語料,先自訂待觀測的關鍵詞 彙,然後統計這些詞彙出現的篇數與年代。依此資料分析每年焦點詞彙的變化,並觀 看某年焦點詞彙在其他年份出現的狀況,以了解該年份與其他年份的連動關係。泹此項 2002 年發表的文字語料分析方法,在當時的人文社會科學領域算相當創新,但其自訂 「待觀測的關鍵詞彙」,則因人為介入,除較耗時間、難以重複驗證或跨語料應用 外,在研究的意義上,也會受研究者自身學識之限制。
註 泍 Justin Grimmer, Brandon M. Stewart, “Text as Data: The Promise and Pitfalls of Automatic Content Analysis Methods for Political Texts,” Political Analysis, Vol. 21, No.3(January 2017), pp. 1~31.
註 泇 Mark M. Alfano, “Identifying and Defending the Hard Core of Virtue Ethics,” Journal of Philosophical Research, Vol. 38(July 2013), pp. 233~260; Markus Christen, Mark Alfano, Endre Bangerter, Daniel Lapsley, “Ethical Issues of ‘Morality Mining’: When the Moral Identity of Individuals Becomes a Focus of Data-mining,” in H. Rahman & I. Ramos eds., Ethical Data Mining Applications for Socio-Economic Development(Pennsylvania: IGI Global, 2013), pp.1~21.
註 沰 Yuen-Hsien Tseng, Zih-Ping Ho, Kai-Sheng Yang, and Chun-Cheng Chen, “Mining Term Networks from Text Collections for Crime Investigation”, Expert Systems With Applications, Vol. 39, No. 11(September 2012), pp.10082~10090.
註 泹 村田忠禧,「人民日報元旦社説から見た中華人民共和国の歴史」,現代中国,總第 76 期(2002 年 10月),頁 99~110。
上述簡要的回顧,說明在大量文獻的時代,各方嘗試運用資訊技術分析文本語料 的企圖、作法、與經驗分享。主要的成果多是對文獻進行自動化的資訊組織與主題分 析,並以某種形式摘要呈現,降低專家整理待分析文件的時間與成本,使其可專注於 解讀、探索文獻內涵,以了解過去、展望趨勢、辨識隱而未顯且潛在有用之樣態、或 是進行新、舊假說的推論等任務。 在上述的脈絡下,本文試圖應用數位探勘工具來組織與分析大量研究論文,以協 助了解其主題大意,及其所記載之研究議題。本文特別著力於「中文文本」,以及 「中國大陸研究」領域,以探索相關科技進展能否輔助研究者發現各種研究主題與脈 絡 的 可 能 性 。 具 體 之 研 究 方 向 有 二 : 其 一 、 能 否 使 用 「 共 現 字 分 析 」 ( Co-word Analysis),並以程式自動化大量歸納社會科學形式之論文主題與共同關鍵字?其二、 若前述問題有合理的結果,那麼近年來中國大陸研究的主要關鍵字與主題是哪些,能 有哪些解讀,對研究者有何啟發? 本文期望可能達到學術成果如下:一、討論近年「中國大陸研究學科發展」的主 體變遷。二、能在短時間內處理大量文獻,整理出關鍵研究趨勢。三、將「知識主題 研究」作業程序化,以供反覆驗證與應用。四、透過對特定語料的文字探勘,自動化 的知識組織與分析,以另一種面向呈現對「中國大陸研究」之探討。五、做為初探研 究,提供後續研究比較與改進的參考。
貳、研究方法
文本牽涉到的主題分析技術,在近 20 年來有相當多方法被發展過。在李龍豪等人 (2016)的研究中,比較了三種主題辨識技術應用於中文短文的主題歸類上,其案例 顯示影響歸類成效的因素眾多,理論上較好的歸類方法,不見得會有較佳的結果。泏這 證實了前述 Grimmer 與 Stewart 提及的原則:沒有最佳的方法可運用於所有的文件類 型。本研究主要使用「共現字分析」(Co-word Analysis)技術,其概念相當簡易直 覺,主要重點在運用不同文件中的相同詞彙,來計算任意兩文件的相似度,從而將相 似的文件歸類(cluster)起來。此方法在科學計量學(Scientometrics)、內容分析 (Content Analysis)或文字探勘(Text Mining)中皆有相關應用。泩其可便於了解待分析文件中包含的各種主題概念,從而對各個主題與各篇文章的欄位屬性(如:作者、 機構、國家、出處、年代等)進行交叉分析,用以透露文獻內含的研究主題、各主題 的影響主力(個人、機構、國家)、研究社群之聚落分布、主題趨勢的變化。泑以往類 註 泏 李龍豪、簡佑達、張俊彥、李宗諺、曾元顯,「短文回應的主題自動歸類在行動教育活動上之應用初 探」,圖書資訊學研究,第 11 卷第 1 期(2016 年 12 月),頁 47~84。
註 泩 Loet Leydesdroff, “Words and Co-words as Indicators of Intellectual Organization,” Research Policy, Vol. 18, No. 4(August 1989), pp. 209~223.
註 泑 曾元顯,「文獻內容探勘工具-CATAR 之發展和應用」,圖書館學與資訊科學,第 37 卷第 1 期 (2011 年 4 月),頁 31~49。
似的任務,是以人力方式使用數量比率的方法進行研究。炔
較諸傳統以人工建構領域知識或分類架構的方法,本文使用之概念,在於提供由 下而上(bottom-up)、資料驅動(data driven)、證據為主(evidence-based)的研究 線索,能補充甚至對照專家之主觀體驗,從而得到啟示。本研究使用的工具,為網路 上可自由下載的「學術研究內容分析工具」,簡稱 CATAR(Content Analysis Toolkit for Academic Research)。炘對應於本次蒐集到網路上的公開資料,本研究主要使用文
章的「篇名與摘要」讓 CATAR 進行「共現字分群」(Co-word clustering),以自動歸 納出待分析文章的主題類別。 Tseng等人(2007)的研究顯示,僅使用「摘要」對比於使用「全文」,在進行主 題歸類(主題地圖繪製)的任務上,使用「摘要」的效果不會比全文差,甚至多數情 況下會更好。炅在考量全文資料的取得與格式轉換的困難度,以及分群效果沒有顯著差 異的情況下,本研究以「篇名與摘要」來代表一篇文章的主旨大意,以做為主題分析 的依據。
上述所謂共現字(co-occurrence word 或簡稱 Co-word),是指兩篇文章若使用到 相同的詞彙,即有共現字的關係存在;若共現字越多,則兩篇文章的共現字關係越 強,其談論相同主題的機會越高。後續,再依此主題相似度進行文章的主題歸類。 共現字方法將單篇文件簡化成一群詞彙來代表該文件,以進行主題歸類處理。如 同 Grimmer 與 Stewart 的文章中提到,將文意以個別的詞彙表示,可能會失去其原意。 但多數的情況下,此種詞袋(bag of words)表示法,就有足夠的效用。這是因為單獨 的詞彙,即使語意上有歧異性,但其前後文的伴隨詞彙,可以輔助確認此詞彙所屬文 件的主題意義。例如「開放」一詞,若伴隨著「媒體」一詞,則跟言論自由的主題較 為相關;但若伴隨著「政策」一詞,則較偏向於管轄治理上的主題。 在進行共現字分群時,CATAR 使用文字探勘的技巧,包含刪除停用詞(如代名 詞、連接詞等無主題意義之詞彙)、正規化詞彙(如英文大小寫一致化,再取英文詞 幹)、擷取關鍵詞(如 multi-character term)等技術與流程,進而建立詞彙到文章的反 向索引資訊檔案,以方便任意兩文章之間的共現字的快速運算。炓而進行共現字分群 註 炔 邵軒磊,「中國研究議程之系譜-以日本國際政治學會誌為例」,問題與研究,第 51 卷第 1 期(2012 年 9 月),頁 23~54。
註 炘 Yuen-Hsien Tseng and Ming-Yueh Tsay, “Journal Clustering of Library and Information Science for Subfield Delineation Using the Bibliometric Analysis Toolkit: CATAR,” Scientometrics, Vol. 95, No. 2(May 2013), pp. 503~528.
註 炅 Yuen-Hsien Tseng, Yeong-Ming Wang, Yu-I Lin, Chi-Jen Lin and Dai-Wei Juang, “Patent Surrogate Extraction and Evaluation in the Context of Patent Mapping,” Journal of Information Science, Vol. 33, No. 6 (December 2007), pp. 718~736.
註 炓 本文使用之分詞技術,包括:中文自動分詞(12 萬字之詞庫,長詞優先分詞法)、關鍵詞自動擷取 (以程式擷取文中的新生詞彙、領域術語、詞庫中沒有涵蓋的詞彙等),並用停用詞表(包括:代名 詞、連接詞等無主題意義之詞彙表)過濾。這些技術細節,詳見下面所列專利與參考書目:曾元顯, 數字文件關鍵特徵的自動擷取方法,中華人民共和國發明專利,專利號:ZL 00 1 22602.9。Yuen-Hsien Tseng, “Automatic Thesaurus Generation for Chinese Documents,” Journal of the American Society for Information Science and Technology, Vol. 53, No. 13(November 2002), pp. 1130~1138.
時,是指將待分析文章的任意兩篇文章都拿來計算其共現字關係的強度,從而建構出 任意兩篇文章的相似度矩陣;依此矩陣,再以「文件歸類」技術中的「層次凝聚歸類 法」(Hierarchical Agglomerative Clustering,HAC),炆將相似的文件聚集成一個個類
別。如下圖所示,在 D1到 D17的 17 篇文件中 HAC 會將最相似的文章先歸成一類,再 將新的類別與既有文章根據相似度再合併成一類,如此可以視覺化的看出文章分群歸 類的情況。透過電腦計算最適當的相似度門檻,即可將這 17 篇文章合併區分成數個類 別,如圖 1 所示分成 6 個類別。 圖 1 HAC 的文件自動歸類示意圖 資料來源:作者自製。 當待分析文件很多時,HAC 分出的類別還是很多。為降低人工分析的複雜度, CATAR 使用多階段主題歸類(Multi-Stage Clustering,MSC),將上述方式合併的小 類別,視為一個個不同的「議題」或「概念」(Concepts),把這些小類別的文章合併 成一份巨大之虛擬文件,再根據 HAC 重複上述的歸類動作,則可將「概念」歸類成 「主題」(Topics)。如有需要,此 MSC 方式可再將「主題」歸類成「次領域」 (Domains),「次領域」再歸類為「大領域」(Fields),依此類推。如圖 2 所示, 每個圓圈代表一篇文章或一個類別,其顯示為兩個階段的 MSC 主題歸類,其中每一階 段皆為獨立的 HAC 歸類過程。在 MSC 歸類過程中,有些文件或類別可能會因為與其 他文件或類別的相似度太低,而無法被聚集合併到任何類別中,此種文件或類別可稱 為離群文章或離群類別(outlier,簡寫成 O.L.),如圖中白色圈圈示意之處。
註 炆 Gerard Salton, Automatic Text Processing: The Transformation, Analysis, and Retrieval of Information by Computer(MA: Addison-Wesley, 1989).
圖 2 多階段主題歸類示意圖 資料來源:作者自製。 上述 MSC 的多階段歸類,將相似的文章合併成概念,再將類似的概念合併成主 題,只是一種理想的情形。實際執行 MSC 時,有可能兩個類似的概念合併後,並無法 形成一個被認可的合理主題。例如中國大陸的「改革」與「開放」兩個概念,常被一 起提及,合併成一個主題似無不可,但也許有學者會認為這兩個概念還是有所區別。 有關本研究之本體論與後設理論部分,已有相當知名學者屢有創見,如:關於 「脈絡」之啟發,炄對於實證方法之討論,炑皆已有相當積累。本文主要嘗試使用新方 法,將研究文本做為研究對象,而藉用補助工具,讓使用者可以更專注於分析文本間 的主題脈絡。關於研究對象方面,由於本文並不只在研究某位領導之言論或如 Murata 研究中國媒體社論,而是使用研究論文,原因是:「研究論文」相較於「社論或領導 講話」,其「文本特性」是用語較有規範、主題較為集中,是檢視研究方向的一種良 好指標文本。 本研究藉由 CATAR 軟體將 473 篇「中國大陸研究」期刊歷年論文,依上述說明 自動化的逐步匯聚成 7 個「類別」,此 7 類代表著主題較為一致的論文群組。CATAR 工具在每個歸類階段,亦會自動擷取各類別的特徵詞彙做為類別描述詞,以便利主題 判讀。炖CATAR 產出的類別結果,亦會加入作者、年份的要素,讓讀者可以快速了解 「哪些作者主要在研究哪些主題」、「在某些年份中每個主題論文數量的變化」。由 於採用開放的工具與公開的語料,本研究主題歸類分析的過程與結果,具有可重複性 與可檢証性,符合 Grimmer 與 Stewart 提到的第 4 項原則:對自動化的結果需要驗證、 驗 證、 再驗 證, 以確 認其 有效 性。在下 一節 中,本研究將 先就 少量的文件,驗證 CATAR在中國大陸研究的共現字歸類效能。 註 炄 徐振國,「政治學改造運動的爭議和啟發:從『通則』到『脈絡』的轉向」,頁 1~61。 註 炑 黃紀,「政治學方法論芻議」,何思因、吳玉山主編,邁入 21 世紀的政治學(臺北:中國政治學會, 2000年),頁 107~139。
註 炖 Yuen-Hsien Tseng, “Generic Title Labeling for Clustered Documents,” Expert Systems With Applications, Vol. 37, No. 3(March 2010), pp. 2247~2254.
文章 議題
參、方法驗證
「中國大陸研究」期刊為政治大學國際關係研究中心所出版,長期關注中國大陸 發展,現為 TSSCI 資料庫蒐錄的期刊。本文選擇「中國大陸研究」期刊的論文為待分 析文章的原因,是因其為社會科學類中研究中國大陸的綜合性期刊,因為探討的面向 廣泛,個別獨立學者不易瞭解其全貌,因此是自動化主題分析良好的研究素材。本文 在初探階段,使用小範圍同質性高(同一期刊)之樣本,未來期望能進行跨期刊大量 樣本之討論。 由於資料形式之限制,本文選取網路上公開資料(1998 年 1 月至 2015 年 6 月) 共 473 篇文章,擷取主要欄位:作者、篇名、關鍵字、摘要、發表年份等,將其製作 成為適當格式,提供上述軟體 CATAR 做為分析的基礎。 為了解 CATAR 的成效,本研究先以「立意抽樣方式」,先取三位在該期刊發表較 多論文之單一作者,且研究取向有明顯差異者,做為少量的樣本測試組,如表 2 所 示,以觀察其文章歸類的結果,驗證自動歸類、自動辨識議題的能力。 表 2 測試組文章一覽表 編號 出刊年 作者 篇名 1 2004 徐斯儉 中國大陸政治改革的爭議:一個文獻的回顧 2 2003 徐斯儉 中共十六大與政治改革 3 2001 徐斯儉 大陸農村經濟發展與基層民主發展的關係-鄉鎮企業產權改革與農村基層民主 4 2001 徐斯儉 中國大陸九○年代之政治改革與制度變遷 5 2000 徐斯儉 全球化;中國大陸學者的觀點 6 2007 徐斯儉 「軟紀律約束」-中共強化監督之政改的內在限制 7 1999 徐斯儉 大陸農村的基層民主與經濟發展的關係 8 2004 張裕亮 從黨的喉舌到黨營傳媒企業一廣州日報制度變革分析 9 2003 張裕亮 大陸黨報從業員依附行為的轉變-以人民日報為例 10 2002 張裕亮 大陸報業經營制度改革-制度變遷理論的觀點 11 2010 張裕亮 流變中的大陸流行音樂黨國意識 12 2009 張裕亮 民意乎?黨意乎?-大陸新京報讀者投書的近用權實踐 13 2007 張裕亮 從紅色經典到愛國主義商品:大陸主旋律電視劇文本意義的變遷 14 2006 張裕亮 中共對台報導的政策主導表述-開放來台駐點前後人民日報對台報導的異同 15 2005 張裕亮 黨政會議新聞的市民消費表述-人民日報與京華時報對「兩會」新聞的報導異同 16 2007 鍾延麟 鄧小平在1957年中共整風、「反右派」中之角色 17 2006 鍾延麟 1958年鄧小平在解放軍「反教條主義」運動中之角色與活動 18 2006 鍾延麟 鄧小平在文革前中共與東南亞共黨之關係:角色和活動 19 2005 鍾延麟 鄧小平在中蘇關係中之角色與作為(1956~1976)-兼論對「鄧小平研究」之意義 20 2014 鍾延麟 「文革」前彭真對中共首都的管理:政治方針、領導方式和幹部政策 21 2015 鍾延麟 故紙堆中作新文章:檔案研究與中國研究 22 2015 鍾延麟 彭真在1959年中共「反右傾」運動中的角色和作為 資料來源:作者根據「中國大陸研究」期刊自製。若此 CATAR 工具可將主題相近的論文(在此樣本中大多為同一作者在相近時期所 寫的論文)匯聚在同一類別中,則表示根據篇名與摘要的文字,由此工具所做的歸 類,具有一定的可信度,而可以應用到較大範圍的待分析文章上,以便自動歸類(辨 識、擷取)其隱含的主題。根據表 2 的 22 篇測試文件,CATAR 的歸類結果如表 3 所 示,此結果跟圖 1 對照比較,可知哪兩篇文章相似度較高而先被歸類起來,之後再跟 其他文章歸類在一起。 表 3 測試結果層次表 1: 4 Docs. : 0.7113(鄧小平:28.0000,毛澤東:4.1000,活動:3.9853,運動中:1.9379,角色:1.3887) ■ 2007:鄧小平在1957年中共整風、「反右派」中之角色(鍾) ■ 2006:1958年鄧小平在解放軍「反教條主義」運動中之角色與活動(鍾) ■ 2005:鄧小平在中蘇關係中之角色與作為(1956~1976)-兼論對「鄧小平研究」之意義(鍾) 。2006:鄧小平在文革前中共與東南亞共黨之關係:角色和活動(鍾) 2: 3 Docs. : 0.6286(農村:15.0502,民主:12.6739,基層:11.8818,經濟:10.1440,關係:9.5607) ■ 2001:大陸農村經濟發展與基層民主發展的關係-鄉鎮企業產權改革與農村基層民主(徐) ■ 2000:全球化;中國大陸學者的觀點(徐) 。2001:大陸農村的基層民主與經濟發展的關係(徐) 3: 3 Docs. : 0.7531(政治改革:16.0000,政權:9.5054,中國:5.5448,合法性:4.7527,社會:3.6250) ■ 2004:中國大陸政治改革的爭議:一個文獻的回顧(徐) ■ 2001:中國大陸90年代之政治改革與制度變遷(徐) 。2003:中共十六大與政治改革(徐) 4: 3 Docs. : 0.8518(人民日報:10.0000,新聞:8.7133,表述:3.9606,政策:3.6250,異同:3.1685) ■ 2006:中共對台報導的政策主導表述-開放來台駐點前後人民日報對台報導的異同(張) ■ 2003:大陸黨報從業員依附行為的轉變-以人民日報為例(張) 。2005:黨政會議新聞的市民消費表述-人民日報與京華時報對「兩會」新聞的報導異同(張) 5: 2 Docs. : 0.5533(制度:7.4613,經營:7.0000,報業:7.0000,變革:3.4359,日報:3.4359) 。2004:從黨的喉舌到黨營傳媒企業一廣州日報制度變革分析(張) 。2002:大陸報業經營制度改革-制度變遷理論的觀點(張) 6: 2 Docs. : 0.7837(黨國:6.3369,音樂:4.1231,電視劇:3.4359,主旋律:3.4359,黨國意識:2.7487) 。2007:從紅色經典到愛國主義商品:大陸主旋律電視劇文本意義的變遷(張) 。2010:流變中的大陸流行音樂黨國意識(張) 7: 2 Docs. : 0.1429(彭真:9.0000,反右傾:4.1231,首都:4.1231,中央:3.4359,北京市:3.4359) 。2015:「文革」前彭真對中共首都的管理:政治方針、領導方式和幹部政策(鍾) 。2014:彭真在1959年中共「反右傾」運動中的角色和作為(鍾) 資料來源:作者自製。 測試組結果評析如下:在第一階段的主題歸類中,共有 7 個小類,其歸類結果有 很高的合理性。如:鍾延麟在 2005~2007 發表的 4 篇文章,被歸在第 1 小類,而其在 2014~2015 發表的兩篇文章,則被歸到第 7 類,從表 2 的篇名觀察,這些文章的主題 或議題有所差異,自應被歸在不同類別,而自動化工具也真的能辨別出來。張裕亮發 表的文章,也有類似的情形(第 4、5、6 小類)。由「(篇名前)提示之關鍵字」可以 看出,幾乎機器與人類常識閱讀有很高的一致性。從各個類別的關鍵字,也可以看出 各作者研究取向與研究重心的變化。 但全部 22 篇文章,電腦只歸類出 19 篇,其中有 3 篇,被視為離群值,而個別單 篇自成一類,在此就沒有顯示出來。而這 3 篇分別為表 2 中編號 6、12、21 之 3 篇文 章。其中編號 6 為徐斯儉於 2007 年發表的文章,跟表 3 的第 2、3 類發表有時間差
距,其用詞可能較為不同,因而沒有被歸在第 2 或第 3 類。而 12 與 21 是因為其研究 主題以及用詞、關鍵字等都跟其他文章不同,而成為離群值。 從以上的結果看出,電腦完全自動化的主題辨識只有少許不足之處,多數結果大 致合理可信。因此,本文在以下的結果呈現中,將運用自動化主題分群,配合人工檢 視主題分群之結果,決定最後的主題類別。
肆、個別主題分群分析
本節就「中國大陸研究」473 篇文章的篇名與摘要,進行前述的多階段共現字自 動分群,並自動選取各分群的類別關鍵字,其最後一階(第四階)的結果如下圖所 示: 圖 3 「期刊:中國大陸研究」(1998~2015)主題分群總表 資料來源:作者自製。 由上述樹狀圖可以看出各分群的關鍵字遠近關係。其中「色塊與樹狀圖」部分, 為機器自動產生,而編碼部分則是因為敘述需要,給予一個「群」名稱,再由此一 「群」名稱說明其中的主題。此間,「群」名稱可能因為使用者介入(或主觀認定) 而不同,在本文中僅為敘述便利給予名稱,使讀者能較為直觀的進入敘述情境,如果 讀者有自行之理解脈絡,也可嘗試以自身的經驗賦予意義。本工具之核心要旨為提供 使用者便利理解主題分布與變遷。因此,可以視各人研究需要而選取不同層次之主題 關鍵字以供理解。 意 識 形 態表 4 各分群與重要關鍵字 分群/數量 關鍵字 可能分群名稱 C1/158 兩岸、經貿、海歸、交流、經濟、政府、臺灣等 經濟與貿易 C2/71 安全、國際、軍事、全球化、戰略等 外交與軍事 C3/44 結構、華裔、土地、人民幣、財政、農民等 社會問題 C4/15 類型、組織、政治、主義、極權等 制度與改革 C5/90 政黨、民主、社會、態度、制度、決策、政治、黨國等 中共黨政 C6/10 斷裂、文化、民族、血緣、近代等 意識形態 C7/29 人口、城市、香港、環境保護、辦學等 區域治理 資料來源:作者自製。 本節依上述結果,加入人工檢閱以及具體分類描述,提供讀者了解 1998~2015 年 來「中國大陸研究」期刊所刊登的論文主題樣貌。本節亦將分析各個群組之逐年發表 數量,以了解各關鍵字趨勢演變。在本研究中,使用之樣本母體期刊(中國大陸研 究),每年稿件發表量有巨大變化:原為月刊,且每期論文篇數較多(每年約 50 筆),近年則改為季刊(每年約 20 筆),因此若只計算各類別的論文發表數量意義不 大。為此,本文再輔以「主題發表量」,以逐年分群中的文件數量除以該年總篇數, 計算出平均「群發表率」,以呈現各主題的年代趨勢演變。各分群的意義,解讀如 下。
一、「經濟與貿易」群
分群 1 主題關鍵字為「兩岸、國際、交流、經濟、政府」共有 158 篇文章被編入 此類,在各分群中數量最多,由多個主題合併而成,主要為為經貿海歸關係、國際貿 易關係、兩岸經濟關係、企業制度。如下圖所示: 圖 4 「經濟與貿易」群主題樹狀圖 資料來源:作者自製。 一、「經貿海歸」以及二、「國際貿易」方面,是以華人(Chinese)的經濟活動為 研究對象,再反映於選題的空間單位「中國」、「港澳臺」以及海外華人地區。相關文 章主要研究「改革開放(reform and openness)」政策下,所引發之橫跨國境、社會各部門的制度變化與利益變動,也牽涉到少量與經濟部門有關的中共法制、炂中共權力體 制炚研究。此外,本分群之作者常用理論是經濟學與制度研究。在海外關係、海外華人 關係的部分,其關鍵字分別為「經貿、海歸、海歸派、大陸地區」與「澳門、談判、 身分、工資政策」。 三、兩岸經濟方面,多數選題與「臺陸來往」相關,結論則有「政策(投資)建 議」、「中國發展預測」兩種傾向。比如政策建議中將兩岸「三通」視為國際貿易,經 由與 GATT、WTO 規範的比較研究後,提出臺灣應有的配套、因應作為與談判策略; 投資建議比如建議兩岸合資企業依據「權力控制理論」設計董事會,以免台資失去經 營權。炃發展預測比如針對中國的不動產業、銀行業、債擔保的狀況展開分析,並陳述 有關交往風險、信用不足的種種觀察。牪此外,少數與海外華人相關的研究,選題綜 合,較為傾向歷史回顧性質。狖在關鍵字為「兩岸、整合、合作、經濟、臺灣」的兩岸 經濟關係的部分,第一個重點是台商投資環境,選題單位空間較大,在中國各區域的 發展特色不一、需求不同的觀察下,相關研究發現外商投資、外貿發展模式各不相 同,中央政策與地方現實也有落差,建議台商必須因地制宜。狋第二個重點較不偏重經 濟,而是兩岸社會各部門的交流議題,其包括 NGO、廉政、智慧財產、出版界、藝文 界、教育界、科技業的交流、借鑒與合作。狘 最後第四是「企業制度」,關鍵字為「企業、制度、改革、地方、政府」的經濟與 社會方面,就是研究由「改革開放」所引起的新型社會經濟問題。不同的研究者分別 就欠薪、就業、退休養老、網路管制問題,從中國政府、銀行、意識形態的結構中尋 註 炂 許光泰,「中國大陸合資企業董事會之法制分析」,中國大陸研究,第 41 卷第 11 期(2001 年 10 月),頁 19~36。 註 炚 寇健文,「既重用又防範的菁英甄補:中共海歸派高官的仕途發展與局限」,中國大陸研究,第 50 卷 第 3 期(2007 年 9 月),頁 1~28。 註 炃 許光泰,前引文,頁 19。 註 牪 陳奉瑤,「兩岸不動產估價規範之比較研究」,中國大陸研究,第 43 卷第 7 期(2000 年 7 月),頁 59~74;陳月端,「大陸地區保證制度之研究」,中國大陸研究,第 41 卷第 11 期(1998 年 11 月), 頁 57~67;呂青樺、沈中華,「影響大陸地區銀行獲利能力與風險的因素」,中國大陸研究,第 49 卷 第 3 期(2006 年 9 月),頁 119~142;黃啟瑞、董澤平、李文瑞,「中國銀行業國際化之區位選擇因 素」,中國大陸研究,第 52 卷第 1 期(2009 年 3 月),頁 1~28。 註 狖 「張虎」發表於中國大陸研究,第 41 卷第 1 期至第 43 卷第 6 期之間的 6 篇文章。以及談判相關事 務,邱坤玄、黃鴻博,「中國的負責任大國身分建構與外交實踐:以參與國際裁軍與軍備管制建制為 例」,中國大陸研究,第 53 卷第 2 期(2010 年 6 月),頁 73~110;張廖年仲,「論中共談判『原 則』之策略運用:從簽訂『全面禁止核試條約』為例」,中國大陸研究,第 47 卷第 3 期(2004 年 9 月),頁 169~188;王宗安,「達賴喇嘛與中共談判之癥結分析」,中國大陸研究,第 51 卷第 1 期 (2008 年 3 月),頁 103~117。 註 狋 朱景鵬,「區域主義、區域整合與兩岸整合問題之探討」,中國大陸研究,第 42 卷第 8 期(1999 年 8 月),頁 71~94;趙甦成,「中國大陸外貿與外資發展模式:省區與區域層面之比較」,中國大陸研 究,第 43 卷第 8 期(2000 年 8 月),頁 69~100。 註 狘 散見於劉勝驥、蕭真美為主的,發表於中國大陸研究,第 41 卷第 3 期至第 48 卷第 4 期之間的 8 篇論 文。
找原因,並提出公部門可改進之處。狉總體上,本主題分群為「中國大陸研究」所刊登 論文之類別主流主題,已為成熟發展之學科。
二、「外交與軍事」群
分群 2 共有 71 篇文章被編入此類。本分群的特色是以外交、軍事議題為主,在 1990 年代為臺灣社會對中國(大陸)的主要認知視角。本分群發表量占各分群第三 多,作者主要為國際關係學者。具體內容涵蓋外交行為、外交(戰略)思想、以及因 現實發展變化的軍事議題。依據分群主題關鍵字為:「安全、國際、軍事、全球化、戰 略」等等。 圖 5 「外交與軍事」群主題樹狀 資料來源:作者自製。 本分群具體內容有四個主題。主題一國際政治相關研究,主要為中共崛起如何改 變國際秩序,其中又以「新秩序」為重要關鍵字,如對外影響的視角上,「中國威脅 論」亦為重要主題。狜主題二為中國大陸周邊安全環境與安全政策的研究,內容牽涉到 軍備或軍事相關思想,其中大多與「中外關係」掛勾,著重中國對外來刺激的反應, 或者中國對外(國際環境)的影響。在外來刺激方面,美國與中國的擁核鄰國(印 度、巴基斯坦)是主要的議題來源,不同的研究者就核武裝、空中防禦、鄰國核試爆 的因應,發現中國在不同區域皆傾向奉行「和平共處」之外交原則,可依照中國放棄 核試爆的核武政策事例看出。狒 主題三是「安全相關研究」,內容以「新安全觀」為主,包括:1990 年代的安全 註 狉 江振昌,「欠薪問題與近期大陸工潮-集體行為觀點」,中國大陸研究,第 43 卷第 9 期(2000 年 9 月),頁 81~102;葉章美,「改革開放後大陸勞動力市場情勢與就業政策」,中國大陸研究,第 43 卷第 7 期(2000 年 7 月),頁 21~46;黃德北,「新自由主義與中國大陸退休養老制度改革」,中國 大陸研究,第 47 卷第 4 期(2004 年 12 月),頁 53~74;歐陽新,「中共網際網路的發展及其管制的 困境」,中國大陸研究,第 41 卷第 8 期(1998 年 8 月),頁 41~57。 註 狜 陳永康、翟文中,「中共海軍現代化對亞太安全之影響」,中國大陸研究,第 42 卷第 7 期(1999 年 7 月),頁 1~25;邵軒磊,「中國威脅論之解析-以日本相關研究文獻為例」,中國大陸研究,第 55 卷第 3 期(2012 年 9 月),頁 85~105。 註 狒 丁樹範,「中美關於太空、導彈防衛與核武政策爭議之研究」,中國大陸研究,第 53 卷第 1 期(2010 年 3 月),頁 99~133;張雅君,「印巴核武試爆後中共的南亞安全政策」,中國大陸研究,第 43 卷 第 2 期(2000 年 2 月),頁 15~35。規範建構、狔防禦性軍事政策狚,結論多傾向於中共外交、軍事政策屬於被動性質,旨 在追求避免衝突的「安全」。此外,解釋了中共領導人的世界認知的形成過程亦為主要 主題,此一認知再形成新安全觀,導致諸如「中俄不結盟」的結果。狌總體來看,研究 對象仍以「鄧、江、胡」三代領導人時期為主。 主題四為中國面臨「全球化」之應對,由於中共的「獨立自主外交政策」具有深 遠傳統,相關研究主攻歷史回顧,結論也大致吻合現實中的後續發展。狑此外隨著 2000 年代國際恐怖主義抬頭,國際關係多元化,以及臺灣國際參與的過程,各種議題 也受到矚目,也反映於本分群的選題之中,其包括有石油外交、旅遊外交、反恐外 交 、 經 濟 援 助 , 研 究 者 透 過 環 境 理 論 ( contextual approach)、 援 外 分 布 理 論 ( aid distribution approach)、對元理論(dyadic approach)等等途徑解釋中國外交行為。玤
三、「社會問題」群
分群 3 包括 44 篇文章,在各分群中數量第四多,由 2 個分類合併而成,分別涉及 金融與企管、農村問題與地方經濟。本分群的特色在於處理微觀的議題,部份研究雖 然接近「國際經貿」分群的範圍,但本分群聚焦於稅制、貨幣使用、農業生產這些國 內日常民生議題。相較於「外交軍事」,本類別相關主題研究的基本較小,最多跨至 省、市,不討論全國、跨國的規模,但部份選題也與海外(美國、臺灣)有一定關 係,這是現代金融的本身特性及「改革開放」創造的金流環境所致,吻合現實。此 外,極具中國當地特色之農業問題,也是本分群的特色之一。依據機器分類,本分群 總關鍵字為:「結構、華裔、土地、人民幣、支出」,各分類另有關鍵字。 註 狔 朱蓓蕾,「全球化與中共安全觀:轉變與挑戰」,中國大陸研究,第 46 卷第 1 期(2003 年 11 月), 頁 75~108;于有慧,「後冷戰時代中共新安全觀的實踐與挑戰」,中國大陸研究,第 44 卷第 2 期 (2001 年 2 月),頁 57~76;袁易,「重新思考外空安全:一個中國建構安全規範之解析」,中國大 陸研究,第 52 卷第 2 期(2009 年 6 月),頁 1~41。 註 狚 張雅君,「世紀之交中共的軍事政策與亞太安全:防禦取向模糊性的探討」,中國大陸研究,第 42 卷 第 3 期(1999 年 3 月),頁 25~44。 註 狌 張雅君,「中俄睦鄰友好合作條約的性質、意涵與影響」,中國大陸研究,第 45 卷第 2 期(2002 年 3 月),頁 35~59;于有慧,「中共獨立自主外交政策的持續與轉變」,中國大陸研究,第 43 卷第 6 期 (2000 年 6 月),頁 1~19。 註 狑 于有慧,「中共獨立自主外交政策的持續與轉變」,頁 1~19;于有慧,「中共的大國外交」,中國大 陸研究,第 42 卷第 3 期(1999 年 3 月),頁 45~62。 註 玤 于有慧,「胡溫體制下的石油外交與挑戰」,中國大陸研究,第 48 卷第 3 期(2005 年 9 月),頁 25~50;范世平,「中國大陸旅遊外交政策之研究:以出境旅遊發展為例」,中國大陸研究,第 48 卷 第 2 期(2005 年 6 月),頁 61~97;張雅君,「中共反恐外交的實踐與成效之分析」,中國大陸研 究,第 48 卷第 1 期(2005 年 3 月),頁 53~83;林德昌,「海峽兩岸在非洲地區的經援政策」,中國 大陸研究,第 42 卷第 3 期(1999 年 3 月),頁 63~83。圖 6 「社會問題」群主題樹狀圖
資料來源:作者自製。
金融與企管部分以「企業、華裔企業、匯率、人民幣、東亞」為主題關鍵字,相 關研究主題有二。主題一,是人民幣、稅賦等金融問題,如透過複迴歸分析研究「兩 稅合一」、玡結合「權重推估法」(weight-inference approach)與「匯率浮動程度推估
法」(flexibility-inference approach)之「綜合推估法」(the synthesized approach)研究 東亞匯率中的人民幣角色,再加上時事性質的中美政府介入匯率、玭匯率走勢玦等議 題。由於存在人民幣「緊盯美元」、中央推行「新稅法」這些背景事實,此類研究較依 賴實證資料。研究者大多根據現實的波動,描述現狀後再預測其短期趨勢。主題二, 是企業經營與政治經濟環境,案例研究包括中國國營企業、民間企業、台資企業等玢, 研究者運用包絡研究(DEA)、玠比較方法,玬主攻經營績效、需求不足玝的議題。比較 特殊的發現如:政治決定(如國企改革)對於中國地方經濟的絕對主導力、瓝國營傳媒
的變遷能證明季登斯結構化理論(Giddens’ Structuration Theory)中的「二重性」。 農村問題與地方經濟部分以「財政、農民、經濟、農村、中央」為關鍵字,相關 研究著重於農村經濟問題、社會現象的解決方法,其包括了「非農化」引起的現象、瓨 水資源短缺、甿粳稻與秈稻生產、畀土地所有制、村黨委書記的魅力型權威、甾義務教 註 玡 張敏蕾、黃智聰,「大陸『兩稅合一』稅制改革之意涵與其影響」,中國大陸研究,第 56 卷第 2 期 (2013 年 6 月),頁 70~113。 註 玭 趙文志,「美、中政府與市場在人民幣匯率改革中的角色:2003~2005」,中國大陸研究,第 51 卷第 4期(2008 年 12 月),頁 51~88。 註 玦 洪淑芬,「人民幣匯率走勢的探討」,中國大陸研究,第 42 卷第 1 期(1999 年 1 月),頁 19~35。 註 玢 傅豐誠,「中國大陸國有企業經營績效的變化」,中國大陸研究,第 48 卷第 4 期(2005 年 12 月), 頁 1~30;陳永生,「華裔與非華裔企業大陸投資績效之比較研究」,中國大陸研究,第 44 卷第 8 期 (2001 年 8 月),頁 23~42;林祖嘉、陳湘菱,「中國大陸本土企業、台資企業與外資企業生產效率 之比較研究」,中國大陸研究,第 52 卷第 4 期(2009 年 12 月),頁 1~20;邱正仁、吳志正、林怡 盈,「台商大陸投資兩岸三地財務績效之實證研究」,中國大陸研究,第 44 卷第 9 期(2001 年 9 月),頁 41~55。 註 玠 傅豐誠,前引文,頁 1。 註 玬 陳永生,「華裔與非華裔企業大陸投資績效之比較研究」,頁 23。 註 玝 洪淑芬,「大陸有效需求不足之分析」,中國大陸研究,第 46 卷第 1 期(2003 年 1 月),頁 1~22。 註 瓝 賴祥蔚,「湖南廣電集團的政治經濟分析」,中國大陸研究,第 46 卷第 4 期(2003 年 7 月),頁 103~124。 註 瓨 宋國誠,「『非農化』與農民意識之變遷」,中國大陸研究,第 42 卷第 4 期(1999 年 4 月),頁 45~64。 註 甿 熊自健,「評析中國大陸水資源短缺問題及中共的對策」,中國大陸研究,第 46 卷第 3 期(2003 年 5 月),頁 63~78。
育經費保障機制疌以及括及外省市的「外來現象」。疘這些研究普遍依賴歷史文獻,比 較重要成果包括:細緻探討農民的意識變遷、皯預測農村土地私有化的可能性、盳內陸 長距離跨省移民的性別問題。盱 前述已經提及本主題為逐漸發展之主題領域有逐漸攀升現象,其原因,隨著中國 大陸持續開放,各種社會問題浮現之外,國際(及兩岸)交流持續擴大臺灣得以開始 田野調查對中國社會問題已有更深認識,業已反映在發表趨勢上。
四、「制度改革」群
分群 4 包括 15 篇文章,本分群的特色在於對制度(法律、規範)因素的強調,選 題的著眼點多在於政治體制的「輸入」與「輸出」,不強調領導人或特殊事件的作用。 不過,中國政治關聯的研究,在機器分群中,已各別散至 6 大分群,本分群僅專注於 「政治體制」的範圍而已。原因之二,可從分群統計發現,其發表的高峰在 1999 年及 2001 年,時逢港澳回歸與中共領導人換屆,疊合外界對「中共政治體制改革」期待的 時間點。具體上,研究內容大多牽涉短期內不易產生劇變的議題,如所得分配、基層 民主以及社會網路。 圖 7 「制度改革」群主題樹狀圖 資料來源:作者自製。 從研究對象著眼,本分群的研究具有「高層」與「基層」兩種特徵。首先在高層 註 畀 施正屏,「中國大陸粳稻生產之經濟分析」,中國大陸研究,第 42 卷第 8 期(1999 年 8 月),頁 17~33;施正屏,「中國大陸秈稻生產之經濟分析」,中國大陸研究,第 42 卷第 1 期(1999 年 1 月),頁 77~93。 註 甾 江振昌,「魅力型權威與大陸農村社區發展之研究-以村黨委書記權威為例」,中國大陸研究,第 45 卷第 1 期(1999 年 1 月),頁 19~38。 註 疌 陳永生,「大陸優先設立『農村義務教育經費保障機制』之分析」,中國大陸研究,第 52 卷第 3 期 (2009 年 9 月),頁 39~70。 註 疘 江振昌,「『外來妹現象』與大陸的跨省區聯姻熱」,中國大陸研究,第 43 卷第 7 期(2000 年 7 月),頁 75~90。 註 皯 宋國誠,前引文,頁 45。 註 盳 許光泰,「中國大陸集體土地所有制變革趨勢之研究」,中國大陸研究,第 42 卷第 8 期(1999 年 8 月),頁 1~16。 註 盱 江振昌,「『外來妹現象』與大陸的跨省區聯姻熱」,頁 75。 類型; 組織; 政治; 主義; 極權的範疇,相關研究多使用「極權主義」、「派系政治」、「世代政治」、「技術專家政治」 這四種典型研究途徑,研究者考察中共黨內的派系政治、菁英晉升以及監督機制後, 證實中共高層運作中並存著制度化、非制度性質,並肯定其中具有規律性。盰另在基層 的範疇,研究者著重關心基層民主、農村組織以及自發的社會運動,並發現在中國當 前極權體制下,民間力量仍有一定能動性,惟不能超出高層給定的「活動空間」,僅能 作事務性訴求,黨國體制不容動搖。盵高層、基層彼此相比,前者反而較具變遷潛力。 值得注意的是,本分群的部分研究主題(高層相關部分)雖與下一分群主題之一「中 共領導階層」相當類似,惟本分群以「國家體制」為中心,後一分群則以「黨」為著 眼點,須加區別。本主題在 1990 年代之前較少,如今隨中國大陸逐漸崛起,在「中國 大陸研究」刊物上是逐漸成長的主題。
五、「中共黨政」群
本主題為「中共黨政」,包括 90 篇文章,在各分群中數量第二多,由 3 個分類合 併而成,分別涉及中共領導階層、中共敏感議題(改革、領土、宗教)、中共黨史。由 於兩岸對峙的歷史背景,本分群在臺灣具有悠久研究傳統。本分群的具體內容,幾乎 牽涉了中國共產黨的各個方面,由裡到外的著眼點有:領導人決策、菁英晉升、共青 團、技術官僚、人民大會、黨國體制、中國宗教,以及中共黨組織之外的兩岸宗教、 在中臺灣人、臺灣統獨民意、外蒙古、梵蒂岡。依據機器分類,本主題總關鍵字為: 「政治、領導、決策、運動、人大」,各分類另有關鍵字。 圖 8 「中共黨政」群主題樹狀圖 資料來源:作者自製。 主題一:中共領導階層部分以「菁英、領導、中央、政治、層面」為關鍵字,相 關研究從「黨人」與「黨組織」兩處著眼,前者以正部級以上為分界,研究其菁英的 註 盰 蔡文軒,「中共派系政治途徑的分析:以大躍進起源為例」,中國大陸研究,第 48 卷第 1 期(2005 年 3 月),頁 85~104;寇健文,「中共菁英政治的研究途徑與發展」,中國大陸研究,第 47 卷第 3 期(2004 年 9 月),頁 1~28;馬祥祐,「論中國共產黨黨內監督條例(試行):從機制設計理論角度 分析」,中國大陸研究,第 51 卷第 2 期(2008 年 6 月),頁 1~2;徐斯儉,「軟紀律約束-中共強化 監督之政改的內在限制」,中國大陸研究,第 50 卷第 2 期(2007 年 6 月),頁 35~60。 註 盵 徐斯儉,「大陸農村經濟發展與基層民主發展的關係-鄉鎮企業產權改革與農村基層民主」,中國大 陸研究,第 44 卷第 5 期(2001 年 5 月),頁 19~40;張弘遠、李宗義,「中國大陸農村經濟發展中的 組織演變:四川省瀘江市 K 鎮勞保製品專業技術協會的個案研究」,中國大陸研究,第 44 卷第 10 期 (2001 年 10 月),頁 71~96;汪莉絹,「鑲嵌與自主:反壩運動中的大陸環保組織」,中國大陸研 究,第 56 卷第 1 期(2013 年 3 月),頁 1~32。組成與甄補、矸幹部的政治繼承。矼在「改革開放」的時代變遷下,研究者發現了若干 不變之處,如:中共雖傾向以「專業技能」選拔菁英,但在日後升遷中仍以「黨職經 歷」為首要考量。綜合其他成文、不成文規則的研究,可發現期選拔機制根植深厚歷 史。矹此外,在此分類中,針對共青團、人民日報的研究有一共同發現,就是黨的次級 組織除了「幹部輸送」與「儀式化」的功能外,數十年來並未衍生更多自主性。矻 主題二:黨政議題一向是中共敏感之處(改革、領土、宗教)如「政黨、民主、 社會、態度、制度」等關鍵字。其下細分對內有社會不平等結構問題、黨的貪腐問 題、城鄉戶口問題,矺對外有臺灣統獨民意、西藏獨立問題、天主教管制、梵蒂岡「聖 統制」問題以及蒙古相關消息。矷這些研究有助理解中共黨組織之行為準則。 主題三:中共黨史部份以「決策、政治、黨國、事件、民主」為關鍵字,研究重 點是決策機制。首先,有關制度的主要發現是:中共具有自訂規則解決問題、自我強 化的傳統,其「黨管幹部」管理體制與西方的「行政中立」有若干不同之「黨政協 調」機制。祂其次,有關領導人研究的主要發現是:鄧小平與毛澤東在「反右運動」、 註 矸 黃信豪,「有限活化的中共菁英循環:黨政領導菁英組成的跨時考察」,中國大陸研究,第 53 卷第 4 期(2010 年 12 月),頁 1~33;陳德昇、陳陸輝,「中共『十七大』政治菁英甄補與地方治理策 略」,中國大陸研究,第 50 卷第 4 期(2007 年 12 月),頁 57~85;趙建民、張鈞智,「菁英循環或 再生?十二大以來中共技術官僚的發展趨勢」,中國大陸研究,第 49 卷第 2 期(2006 年 6 月),頁 69~97。 註 矼 寇健文,「中共『幹部年輕化』與政治繼承」,中國大陸研究,第 44 卷第 5 期(2001 年 5 月),頁 1~17;黃信豪,「制度化下的中共菁英晉升:接班人栽培的觀點」,中國大陸研究,第 56 卷第 1 期 (2013 年 3 月),頁 33~60。 註 矹 黃信豪,「制度化下的中共菁英晉升:接班人栽培的觀點」,頁 54~55。 註 矻 寇健文,「共青團與中共政治精英的甄補:團中央常委仕途發展調查」,中國大陸研究,第 44 卷第 9 期(2001 年 9 月),頁 1~26;張裕亮,「大陸黨報從業員依附行為的轉變-以人民日報為例」,中國 大陸研究,第 46 卷第 6 期(2003 年 11 月),頁 109~135。 註 矺 陳志柔,「中國大陸的不平等結構與制度變遷」,中國大陸研究,第 42 卷第 10 期(1999 年 10 月),頁 1~15;于有慧,「列寧式黨國體制與中國貪腐問題的發展」,中國大陸研究,第 56 卷第 1 期(2013 年 3 月),頁 127~147;林宗弘、曾惠君,「戶口的政治:中國大陸與臺灣戶籍制度之歷史 比較」,中國大陸研究,第 57 卷第 1 期(2014 年 3 月),頁 63~96。 註 矷 沈赫周,「中國對西藏獨立態度之研究」,中國大陸研究,第 46 卷第 6 期(2003 年 11 月),頁 163~183;陳義彥、陳陸輝,「模稜兩可的態度還是不確定的未來:臺灣民眾統獨觀的解析」,中國大 陸研究,第 46 卷第 5 期(2003 年 9 月),頁 1~20;劉勝驥,「臺灣民眾統獨態度之變化」,中國大 陸研究,第 41 卷第 3 期(1998 年 3 月),頁 7~30;喬一名,「2001 年的梵中(共)關係之研析」, 中國大陸研究,第 44 卷第 6 期(2001 年 6 月),頁 25~40;喬一名,「展望公元 2000 年梵蒂岡與中 共的關係」,中國大陸研究,第 43 卷第 4 期(2000 年 4 月),頁 43~58;喬一名,「梵蒂岡與中共關 係之探討」,中國大陸研究,第 41 卷第 7 期(1998 年 7 月),頁 59~69;熊自健,「『中國天主教愛 國會』與『中國天主教主教團』的組織與活動」,中國大陸研究,第 41 卷第 1 期(1998 年 1 月), 頁 30~41。 註 祂 黃意植,「領導格局轉換下的成文規則演變:以 1978 年至 2006 年中共黨內幹部管理法規為例」,中 國大陸研究,第 56 卷第 2 期(2013 年 6 月),頁 31~44;桂宏誠,「中國大陸黨管幹部原則下的公務 員體制」,中國大陸研究,第 56 卷第 1 期(2013 年 3 月),頁 61~89;邵宗海,「中共中央工作領導 小組的組織定位」,中國大陸研究,第 48 卷第 3 期(2005 年 9 月),頁 1~23。
「反教條主義運動」、中蘇關係、二線分工以及文藝政策當中的作用。礿中共黨政是傳 統研究主題,其主題亦為穩定發展,從趨勢來看是第二主流。
六、「意識形態」群
分群 6 包括 10 篇文章,是數量最少的分群。由於關鍵字較為分散,因此省略圖 示。本分群特色是傾向從歷史、文明「概念」中尋找現狀的解釋、問題的解決方法。 在這些研究中,主要研究文化「現象」,秅如文化研究、文化人類學、知識史的學問分 野。穸 本分群的主題可區分為二。其一是「中國知識的形成」等社會科學知識論問題, 主要發現是質疑中國學(China study)知識的非科學性,其作為西方二元知識論的產 物,可能形成封閉傾向的知識霸權。穻在此知識基礎上上,討論有關「中國」、「中國知 識」以及「中國民主化」的概念,竻其他以日本、印度為例的研究,就說明了這種知識 形成的過程。籵此外,古中國的戰略文化、朝貢體系的復甦跡象、少數民族的想像社群 與漢化,他們的未來走向,都被認為取決於中國本土思想或文化的方向。糽研究中共意 識形態主題歷史悠久,伴隨馬克思主義、社會主義、後現代、毛思想等等主題。 註 礿 鍾延麟,「鄧小平在 1957 年中共整風、『反右派』中之角色」,中國大陸研究,第 50 卷第 4 期 (2007 年 12 月),頁 87~116;鍾延麟,「1958 年鄧小平在解放軍『反教條主義』運動中之角色與活 動」,中國大陸研究,第 49 卷第 4 期(2006 年 12 月),頁 77~103;鍾延麟,「鄧小平在中蘇關係中 之角色與作為(1956~1976)-兼論對『鄧小平研究』之意義」,中國大陸研究,第 48 卷第 4 期 (2005 年 12 月),頁 85~110;趙建民、蔡文軒,「毛澤東時期『二線分工』的運作及其對決策過程 的意涵」,中國大陸研究,第 48 卷第 2 期(2005 年 6 月),頁 1~30;周玉山,「中共文藝政策溯 源」,中國大陸研究,第 41 卷第 7 期(1998 年 7 月),頁 21~31。 註 秅 石之瑜,「找回親屬血緣:貴州惠水布依族作為想像的社群」,中國大陸研究,第 46 第 3 期(2003 年 5 月),頁 115~129。 註 穸 文化研究關注工業社會中,特定現象與特定議題(意識形態、社會階級、種族、性別)的關聯。文化 人類學以田野調查為方法,以民族誌(Ethnography)為描述文本。知識史尚無嚴格定義,亦不屬於歷 史學的分支。 註 穻 石之瑜,「鑿開霸權:普世主義與相對主義之外關於『民主』的知識」,中國大陸研究,第 44 卷第 3 期(2001 年 3 月),頁 1~15。 註 竻 郭佳佳、石之瑜,「鄭永年的中國新民族主義敘事-華裔作家的一種身分策略」,中國大陸研究,第 51卷第 3 期(2008 年 9 月),頁 63~84。 註 籵 石之瑜、黃威霖、余帛燦,「在帝國之外看見精神聯盟-從泰戈爾的文明視野談印度知識界的一種中 國認識」,中國大陸研究,第 51 卷第 3 期(2008 年 9 月),頁 85~102;石之瑜、李靜旻,「斷代與 斷裂-日本近代中國認識的基礎脈絡」,中國大陸研究,第 50 卷第 1 期(2007 年 3 月),頁 9~28。 註 糽 楊仕樂,「物質基礎、理念慣性:中國『王道』戰略文化的實證檢驗 1838~1842」,中國大陸研究, 第 54 卷第 1 期(2011 年 12 月),頁 1~27;張登及、陳瑩羲,「朝貢體系再現與『天下體系』的興 起?中國外交的案例研究與理論反思」,中國大陸研究,第 55 卷第 4 期(2012 年 12 月),頁 89~123;石之瑜,「雲滇民族山區漢化問題初探」,中國大陸研究,第 41 卷第 9 期(1998 年 9 月),頁 25~43;王明珂,「當代中國民族政策下的羌族及其歷史─兼評中國少數民族研究中的『近 代建構論』」,中國大陸研究,第 43 卷第 7 期(2000 年 7 月),頁 1~19。七、「區域與治理」群
本分群為「區域與治理」,包括 29 篇文章,由 2 個分類合併而成,分別是開發與 治理、人口與都市管理。本分群的特色是與「人口的時空流動」息息相關,而研究對 象的行政層級是各分群中最低的,雖部分選題與「社會問題」分群接近,但本分群的 歷史跨度較大。選題較多的西部大開發、人口問題問題都具有較深的歷史背景。依據 機器分類,本分群總關鍵字為:人口、城市、香港、環境保護、辦學。 圖 9 「區域與治理」群主題樹狀圖 資料來源:作者自製。 各分類另有關鍵字。如開發與治理的類別以「城市、開發、建設、西部、安置」 為關鍵字,相關研究以「改革開放」後的人口空間流動為特徵,具體涉及了:西部大 開發的人力資本投資策略、西部大開發的歷史前身(三線建設)、中共與解放軍的關 係、隊伍軍人的安置、貧困農民工的安置耵等問題,這些研究所欲解決的問題,其根源 大多可追溯到毛澤東時代,公部門的作為(如何治理),則是解決問題的關鍵所在。 人口與都市管理的類別以「人口、香港、辦學、環境保護、房屋」為關鍵字,相 關研究主攻在時間流動中的人口,所帶來的人口老化問題、都市治理暨都市化問題。 研究者發現,毛時代的生育政策致使中國人口從 1970 年代開始快速轉型,隨之而來的 人口老化現象,對中國經濟、財政、社會產生各種衝擊。肏中國人口轉型的特殊性,在 於它是非自然、誘導式的轉變。肮故即使強制節育解決了人口過多問題,但又會衍生更 多問題,並與失業、民工潮、學童中輟匯流,共同構成複合性的中國人口問題。肣不同 的研究者分別以實證經濟研究方法與政治經濟學,從中國城鄉的人口就業趨勢、就業 差距的研究中,證明了這些問題,肸「城鄉一體化」則是解決方案之一。肵中國各大城 註 耵 王瑞琦,「從市場機制的發展看西部大開發中人力資本投資的策略」,中國大陸研究,第 45 卷第 3 期 (2002 年 5 月)頁 1~25;耿曙,「『三線』建設始末:大陸西部大開發的前驅」,中國大陸研究,第 44卷第 12 期(2001 年 12 月),頁 1~20;丁樹範,「1990 年代以來的中國黨軍關係」,中國大陸研 究,第 46 卷第 2 期(2003 年 3 月),頁 57~80;楊瑞宗,「中共退伍軍人轉業安置制度述評」,中國 大陸研究,第 42 卷第 6 期(1999 年 6 月),頁 45~58;方山,「大陸城市農民工貧困問題」,中國大 陸研究,第 42 卷第 11 期(1999 年 11 月),頁 33~42。 註 肏 方山,「大陸生育政策與人口老化」,中國大陸研究,第 43 卷第 7 期(2000 年 7 月),頁 47~57。 註 肮 方山,「析述大陸人口轉型與人口老化現象-從生育政策面探究」,中國大陸研究,第 41 卷第 4 期 (1998 年 4 月),頁 49~60。 註 肣 方山,「生育轉型與改革形勢下的大陸人口新問題」,中國大陸研究,第 41 卷第 12 期(1998 年 12 月),頁 23~33。 註 肸 耿慶武,「中國大陸人口就業城市化趨勢與展望」,中國大陸研究,第 44 卷第 11 期(2001 年 11 月),頁 37~65;吳德美,「中國大陸都市非正式部門就業中的城鄉差異」,中國大陸研究,第 46 卷 第 5 期(2003 年 9 月),頁 127~150。市的地位格局亦已固定。肭 從趨勢來看,本研究主題曾在 90 年代末較為流行,而在 2006~2011 年較為沈寂, 近日有逐漸復甦的傾向。
伍、綜合主題分群結果討論
針對 473 篇文章的自動化分群,共 7 個主題群組,做為本次分析的對象。此篩選 結果顯示 1998~2015 這 18 年來「中國大陸研究」期刊 473 篇文章的研究主題。上述分 類符合此領域學術知識的認知,顯示了本刊確實是本領域中重要的綜合性期刊。從各 主題的發表量(包括「發表數量」、「發表百分率」)之變化,可看出歷年期刊(或研究 者)偏好主題之演進。本研究顯示 C1 與 C3 是兩個主要的主流主題,其他主題則變化 較大,有的主題近年較為沈默、有的主題看得出有逐漸興起的趨勢。 茲將各類別在各年度的論文數量呈現如下: 表 5 各年主題變遷數量圖 分群 C1 C2 C3 C4 C5 C6 C7 Total 1998 22 5 7 0 7 1 7 49 1999 13 14 8 1 10 0 5 51 2000 27 8 1 0 8 1 5 50 2001 14 11 2 2 12 0 2 43 2002 8 6 2 0 5 1 2 24 2003 10 5 5 0 4 1 2 27 2004 10 1 1 2 5 0 1 20 2005 4 6 2 1 5 0 0 18 2006 4 3 1 0 5 0 0 13 2007 6 2 1 1 4 1 1 16 2008 7 1 1 1 2 1 1 14 2009 7 3 3 1 1 1 0 16 2010 4 2 2 0 5 0 0 13 2011 2 0 2 0 3 1 0 8 2012 5 4 1 1 2 1 0 14 2013 3 0 4 2 6 0 1 16 2014 7 0 1 2 2 0 1 13 2015 5 0 0 1 4 1 1 12 Total 158 71 44 15 90 10 29 417舠 資料來源:作者自製。 註 肵 洪朝輝、梁紅,「城市因素與大陸農村剩餘勞力的轉移」,中國大陸研究,第 42 卷第 6 期(1999 年 6 月),頁 31~43。 註 肭 楊勝群,「區域的整合與衝突:京津冀城市區域的治理與矛盾」,中國大陸研究,第 57 卷第 1 期 (2014 年 3 月),頁 1~31。 註 舠 註:最終數量不同於輸入資料是因為離群值,請參考表 3 後續之說明。依照歷年總體數據分布圖,可以看出總體發表之絕對數量而言,全體數據是在減 少。原因是因為「中國大陸研究」原為雙月刊,每期皆有 10 篇左右學術文章,每年約 有 50 篇論文。現為季刊,每期約有 4~6 篇文獻。若以絕對數量來看,則發現在 2002 年後,其數量均顯著下降,較不容易看出各主題趨勢的變遷,因此本文進一步使用 「各個類別文章數量除以該年文章發表總數量」,來計算「中國大陸研究」的各年各分 類之所占比例,如表 6 所示。 表 6 各年各主題發表比率表 主題 C1 C2 C3 C4 C5 C6 C7 Total 1998 44.90% 10.20% 14.29% 0.00% 14.29% 2.04% 14.29% 100.00% 1999 25.49% 27.45% 15.69% 1.96% 19.61% 0.00% 9.80% 100.00% 2000 54.00% 16.00% 2.00% 0.00% 16.00% 2.00% 10.00% 100.00% 2001 32.56% 25.58% 4.65% 4.65% 27.91% 0.00% 4.65% 100.00% 2002 33.33% 25.00% 8.33% 0.00% 20.83% 4.17% 8.33% 100.00% 2003 37.04% 18.52% 18.52% 0.00% 14.81% 3.70% 7.41% 100.00% 2004 50.00% 5.00% 5.00% 10.00% 25.00% 0.00% 5.00% 100.00% 2005 22.22% 33.33% 11.11% 5.56% 27.78% 0.00% 0.00% 100.00% 2006 30.77% 23.08% 7.69% 0.00% 38.46% 0.00% 0.00% 100.00% 2007 37.50% 12.50% 6.25% 6.25% 25.00% 6.25% 6.25% 100.00% 2008 50.00% 7.14% 7.14% 7.14% 14.29% 7.14% 7.14% 100.00% 2009 43.75% 18.75% 18.75% 6.25% 6.25% 6.25% 0.00% 100.00% 2010 30.77% 15.38% 15.38% 0.00% 38.46% 0.00% 0.00% 100.00% 2011 25.00% 0.00% 25.00% 0.00% 37.50% 12.50% 0.00% 100.00% 2012 35.71% 28.57% 7.14% 7.14% 14.29% 7.14% 0.00% 100.00% 2013 18.75% 0.00% 25.00% 12.50% 37.50% 0.00% 6.25% 100.00% 2014 53.85% 0.00% 7.69% 15.38% 15.38% 0.00% 7.69% 100.00% 2015 41.67% 0.00% 0.00% 8.33% 33.33% 8.33% 8.33% 100.00% 資料來源:作者自製。 就百分比堆疊圖來看,可以看出各年比率較明顯的波動。
圖 10 各年各主題發表比率表 資料來源:作者自製。 總上述圖表看來,C1 為「中國大陸期刊」之主流,比例始終排名第一,為穩定發 展之研究主題,特別是近年隨中國在世界經濟角色之增強,發表比率也有微幅增加的 趨勢。而次一穩定發展之研究主題為 C3,每年也均有穩定成長。C5 之研究,雖然較 少,但每年也有固定的發表數量。上述三個分類較為穩定,且總體而言持續發展。 相對稀缺之主題為 C6,除 2011 年外,比率均為個位數,是比較少人研究的主 題。在 2006~2012 年較為風行,但近年較少研究。C2 在前半期一直是「中國大陸研 究」期刊之研究主力,但近幾年逐漸減少,由一些關鍵字觀察,可發現其研究多與 C1 主題相近,可能是主題轉移之原因。C7 主題之變化較大,大略呈現週期性變化。初 期、中期、末期均有發表量,但過程中有萎縮,特別是在 2008~2012 期間,幾乎沒 有。因此是否該主題在 2008 年前後有變化?或是期刊之性質改變?則是可以深入思考 之議題。C4 這一主題一直有少量發表,近年亦有漸漸變多傾向。
陸、結 論
本研究蒐集 473 篇「中國大陸研究」期刊的文獻,年份介於 1998~2015 年間,使 用自動化分類計算工具(CATAR),並配合人工檢閱篩選結果,實現以中文單一期刊之「篇名、摘要」之非結構化文字資料對主題進行分群的實作。配合近年來對「中國 大陸研究」的反思,本研究提供一個可快速獲得結果,並可反覆檢驗的基礎。讀者可 由本文第三節的試做中窺諸一二,從測試樣本中,可以看出本方法雖未及完美,但已 經可以做到便利使用者能輕易觀測大量文獻之方法。因此,在後續的節次中,本研究 繼續分析較大量的目標文獻。 本文並不宣稱在此方法、語料能夠全面性的找到臺灣之中國研究之關鍵主題,而 是就單一期刊(國際關係研究中心發行之「中國大陸研究」)中,找到歷年之主題變 化,並檢選出關鍵字,以供人檢閱。如表 4 所示,本研究從上述文獻基礎,區分了 「中國大陸研究」之七大主題及其關鍵字,分別是:「1 兩岸、經貿、海歸、交流、 經濟、政府、臺灣」、「2 安全、國際、軍事、全球化、戰略」、「3 結構、華裔、土 地、人民幣、財政、農民」、「4 類型、組織、政治、主義、極權」、「5 政黨、民 主、社會、態度、制度、決策、政治、黨國」、「6 斷裂、文化、民族、血緣、近 代」」、「7 人口、城市、香港、環境保護、辦學」,並從發表量(包括「發表數 量」、「發表百分率」)之變化,看出歷年期刊(或研究者)偏好主題之演進。 本研究旨在:1.呈現了臺灣「中國研究」逐年文章主題與關鍵詞彙的演變趨勢。2. 將所有「個別」的研究找到共通議題或主題之可能性,並且試做了少量樣本的分群, 其分群結果與常識相符,顯示此自動化工具應用到較大樣本也有一定的成效。3.此主 題分類自動化技術可篩選出各個分群關鍵字,提供研究者方便查閱過去的研究趨向。4. 根據各主題逐年的趨勢演變,提供後續研究的方向指引。 本研究所使用之自動化軟體,僅是讓後進學習者更方便能歸納前人知識,並不否 定專家歸納、整理、判斷之重要性。文本數據有其用處與限制,合理的應用依然要靠 讀者活學活用,以自身專業找尋「脈絡」。本研究驗證了自動方法的可行性,後續可 擴大分析範圍(如更多期刊、更長時間),以利用自動化主題分析帶來的效率以及更 多可能的意外發現。 * * * (收件:105 年 7 月 1 日,接受:106 年 11 月 27 日)