國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
5 第四章 資料介紹
本文以TSSCI、美國專利與《人民日報》作為分析對象,前兩者為制式化 風格文本,而兩者差別在於TSSCI 由主題分別收集而來,而美國專利則是依據 公司檢索的結果,人民日報為中文報章雜誌類型文本,描述1946 至 2003 年中 國政治走向,本章將闡述個資料庫特色,表 5-1 簡略描述各個文本資訊。
第一節 臺灣社會科學引文索引
臺灣社會科學引文索引,簡稱TSSCI,是國科會社會科學中心所建立的社 會科學核心期刊引用文獻資料庫,資料庫中每年收錄多個不同領域期刊,學門 包含人類學、社會學、教育學、心理學、法律學、政治學、經濟學、管理學、
區域研究及地理學、綜合類與跨領域或新興領域.由於期刊中的每篇論文都會 紀錄該文關鍵詞,因此從2015 年 TSSCI 收錄期刊中,每一學門隨機挑選一期 刊,將期刊三年內的中英文摘要與關鍵詞剪貼出來,期刊包含特殊教育學報、
圖書資訊學研究、中華傳播學刊、經濟研究、中華心理學刊、人力資源管理學 報、人文及社會科學集刊、女學學刊:婦女與性別研究,中文共9 大類別標籤 共149 則,文章平均長度為 431 字,英文共三大類 53 則,文章平均長度為 407 字。
第二節 美國專利
專利是一種交換制度,專利權人透過專利申請、專利佈局與公開專利說明 書的方式取得一定期間內,排除他人未經許可而使用該專利技術做產業販售。
專利的本質在於鼓勵專利權人公開其專利技術,使該技術領域或競爭對手了解 現有技術的佈局,促進技術的改良與創興。而專利也是公司間權力制衡的要 素,透過收購專利技術,使得對手陷入侵權危機,專利訴訟同樣也成為影響公
‧
類號、引用文獻、專利摘要(Abstract)、發明領域(References Cited)、發明背景 (Background of The Invention)、發明摘要(Abstract)、圖示說明(Brief Description of The Drawings)、發明詳述(Detailed Description of The Invention)、專利申請範 圍(Claim)。 (UPC)、歐洲專利 局(EPO)所使用的歐洲專利分類號(ECLA)與日本專利局(JPO) 所使用的日 本專利分號(FI/FT)等等。本文藉由USPTO 的專利檢索平臺,檢索 MEDIATEK、MERCK、
Microsoft、Toyota 等四家公司的專利文本,並僅使用該公司某一區間專利號的 專利,避免一間公司的專利文本年份過長導致文本間的相似度不夠,而四間公 司在挑選範圍時也盡量相似,避免相隔太久,從MEDIATEK 3103 篇專利截取 專利號9700000 至今的文本共 451 篇、MERK 4358 篇專利截取專利號 98 開頭
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
文本的文本共842 篇、Microsoft 6551 篇專利截取 99 開頭的文本共 3348 篇、
Toyota 3004 篇專利截取專利號 98 開頭的文本共 549 篇,其中由於 Microsoft 文 本相較於其他三家企業文本仍過多,因此隨機抽取900 篇,最後由以上四間企 業檢索出的抽樣專利文本共2742 篇做後續分析。
第三節 人民日報
《人民日報》是中國共產黨中央委員會的機關報,與新華社及中國中央電 視台,並列為中國共產黨和中華人民共和國政府官方三大傳媒機構,為中華人 民共和國第一大報,於1946 年 5 月 15 日起發行,是中國共產黨黨中央向外界 表達其觀點的宣傳工具,以委婉的手法傳遞北京官方對國內和國際事務的看 法,該報的社論在不同的時期對中國大陸政治都有著決定性的指導作用,更是 許多事件引發的起點,如為文化大革命、六四事件。
網路上提供公開下載《人民日報》報導的網站不少,但許多都是抽樣、而 非全部報導,本文蒐集《人民日報》於 1946 至 2003 年的報導,以月分的格式 呈現,透過網頁爬蟲後輸出的文字檔案,記錄年、月、日、版數、標題與內 文,類型繁 雜,需要根據研究需求整理成合適的資料格式及檔案,另外,考慮 到文章數量龐大,而且各版面報導寫作及用字風格會受到 版面主題、記者等因 素影響,分析所有報導未必有效率,因此本研究僅選取《人民日報》的每日頭 版,從 1946 年至 2003 年共 58 年的報導,合計 169739 篇文章。 選取頭條 報導的原因包括報紙頭版大多放置當日重要新聞,其考量層級大多為國 家、社 會大眾關心的議題與事件,比較不會像社會新聞或生活消費新聞,容易受突發 事件影響。
由於人民日報並沒有明顯的類別標籤,而梁家安(2016)提出人民日報依據 集群分析發現1946 至 2003 年人民日報文本的用詞行為的轉變共可以分成四個
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
時期,分別為 1949 年建國前、建國初期的 1949 至 1965 年、文化大革命時 期的 1966-1978 年以及 1979 年以後的改革開放時期,因此人名日報文本依據 年份分成4 個類別標籤,文本數量分別為 10026 篇、53297 篇、20166 篇、
85950 篇。
表 5-1 資料庫資訊
TSSCI(中) TSSCI(英) 美國專利(英) 人民日報(中)
類別標籤數 9 3 4 4
原文章數 149 53 17014 169739
關鍵詞標註 有 有 無 無
平均字數 431 407 5018 1154 文本範圍 2016 至 2018 年 USPTO 檢索結果 1946 至 2003 年
每篇文字抽樣 無 無 每篇抽樣5000 字 無
篩選文章範圍 無 無
專利號97,98 開頭 (依文本而有不同 設定,共2742 篇)
無