• 沒有找到結果。

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

5 第四章 資料介紹

本文以TSSCI、美國專利與《人民日報》作為分析對象,前兩者為制式化 風格文本,而兩者差別在於TSSCI 由主題分別收集而來,而美國專利則是依據 公司檢索的結果,人民日報為中文報章雜誌類型文本,描述1946 至 2003 年中 國政治走向,本章將闡述個資料庫特色,表 5-1 簡略描述各個文本資訊。

第一節 臺灣社會科學引文索引

臺灣社會科學引文索引,簡稱TSSCI,是國科會社會科學中心所建立的社 會科學核心期刊引用文獻資料庫,資料庫中每年收錄多個不同領域期刊,學門 包含人類學、社會學、教育學、心理學、法律學、政治學、經濟學、管理學、

區域研究及地理學、綜合類與跨領域或新興領域.由於期刊中的每篇論文都會 紀錄該文關鍵詞,因此從2015 年 TSSCI 收錄期刊中,每一學門隨機挑選一期 刊,將期刊三年內的中英文摘要與關鍵詞剪貼出來,期刊包含特殊教育學報、

圖書資訊學研究、中華傳播學刊、經濟研究、中華心理學刊、人力資源管理學 報、人文及社會科學集刊、女學學刊:婦女與性別研究,中文共9 大類別標籤 共149 則,文章平均長度為 431 字,英文共三大類 53 則,文章平均長度為 407 字。

第二節 美國專利

專利是一種交換制度,專利權人透過專利申請、專利佈局與公開專利說明 書的方式取得一定期間內,排除他人未經許可而使用該專利技術做產業販售。

專利的本質在於鼓勵專利權人公開其專利技術,使該技術領域或競爭對手了解 現有技術的佈局,促進技術的改良與創興。而專利也是公司間權力制衡的要 素,透過收購專利技術,使得對手陷入侵權危機,專利訴訟同樣也成為影響公

類號、引用文獻、專利摘要(Abstract)、發明領域(References Cited)、發明背景 (Background of The Invention)、發明摘要(Abstract)、圖示說明(Brief Description of The Drawings)、發明詳述(Detailed Description of The Invention)、專利申請範 圍(Claim)。 (UPC)、歐洲專利 局(EPO)所使用的歐洲專利分類號(ECLA)與日本專利局(JPO) 所使用的日 本專利分號(FI/FT)等等。

本文藉由USPTO 的專利檢索平臺,檢索 MEDIATEK、MERCK、

Microsoft、Toyota 等四家公司的專利文本,並僅使用該公司某一區間專利號的 專利,避免一間公司的專利文本年份過長導致文本間的相似度不夠,而四間公 司在挑選範圍時也盡量相似,避免相隔太久,從MEDIATEK 3103 篇專利截取 專利號9700000 至今的文本共 451 篇、MERK 4358 篇專利截取專利號 98 開頭

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

文本的文本共842 篇、Microsoft 6551 篇專利截取 99 開頭的文本共 3348 篇、

Toyota 3004 篇專利截取專利號 98 開頭的文本共 549 篇,其中由於 Microsoft 文 本相較於其他三家企業文本仍過多,因此隨機抽取900 篇,最後由以上四間企 業檢索出的抽樣專利文本共2742 篇做後續分析。

第三節 人民日報

《人民日報》是中國共產黨中央委員會的機關報,與新華社及中國中央電 視台,並列為中國共產黨和中華人民共和國政府官方三大傳媒機構,為中華人 民共和國第一大報,於1946 年 5 月 15 日起發行,是中國共產黨黨中央向外界 表達其觀點的宣傳工具,以委婉的手法傳遞北京官方對國內和國際事務的看 法,該報的社論在不同的時期對中國大陸政治都有著決定性的指導作用,更是 許多事件引發的起點,如為文化大革命、六四事件。

網路上提供公開下載《人民日報》報導的網站不少,但許多都是抽樣、而 非全部報導,本文蒐集《人民日報》於 1946 至 2003 年的報導,以月分的格式 呈現,透過網頁爬蟲後輸出的文字檔案,記錄年、月、日、版數、標題與內 文,類型繁 雜,需要根據研究需求整理成合適的資料格式及檔案,另外,考慮 到文章數量龐大,而且各版面報導寫作及用字風格會受到 版面主題、記者等因 素影響,分析所有報導未必有效率,因此本研究僅選取《人民日報》的每日頭 版,從 1946 年至 2003 年共 58 年的報導,合計 169739 篇文章。 選取頭條 報導的原因包括報紙頭版大多放置當日重要新聞,其考量層級大多為國 家、社 會大眾關心的議題與事件,比較不會像社會新聞或生活消費新聞,容易受突發 事件影響。

由於人民日報並沒有明顯的類別標籤,而梁家安(2016)提出人民日報依據 集群分析發現1946 至 2003 年人民日報文本的用詞行為的轉變共可以分成四個

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

時期,分別為 1949 年建國前、建國初期的 1949 至 1965 年、文化大革命時 期的 1966-1978 年以及 1979 年以後的改革開放時期,因此人名日報文本依據 年份分成4 個類別標籤,文本數量分別為 10026 篇、53297 篇、20166 篇、

85950 篇。

表 5-1 資料庫資訊

TSSCI(中) TSSCI(英) 美國專利(英) 人民日報(中)

類別標籤數 9 3 4 4

原文章數 149 53 17014 169739

關鍵詞標註 有 有 無 無

平均字數 431 407 5018 1154 文本範圍 2016 至 2018 年 USPTO 檢索結果 1946 至 2003 年

每篇文字抽樣 無 無 每篇抽樣5000 字 無

篩選文章範圍 無 無

專利號97,98 開頭 (依文本而有不同 設定,共2742 篇)

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

相關文件