• 沒有找到結果。

第三章 研究架構與方法

第四節 研究步驟與參數選擇

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

(3) 專利家族:串聯 EPO 查詢該專利是否在其他國家有做過申請。

(4) 匯出功能:可將查詢結果匯出存檔、或以 e-mail 方式取得檢索結果。

二、 分析工具

從資料庫中取得的原始資料,僅為簡單的文字格式,尚需要進一步的處理和 篩選才能使用。本研究使用知名的電腦程式語言 python 將儲存下來的資料轉成 適合本研究分析的格式,再進行資料的統整與分類。在整理格式並分類完成之後,

便可以將資料輸入合適的工具進行分析。

本研究主要使用知名軟體 Excel 進行書目計量分析和專利分析,即將資料庫 取得並分類後的資料,繪製出書目計量分析和專利分析所需的各種圖表。Excel 是 Microsoft 公司所開發的整合性詴算表套裝軟體,主要包含三種資料型態之應 用軟體:

(1) 詴算表:建立、編輯、運算工作表等工作。

(2) 圖表繪製:繪製統計圖表,例如:直條圖、折線圖、圓餅圖…等等。

(3) 資料處理:排序、篩選、彙總、分析工作表之資料肉容…等等。

第四節 研究步驟與參數選擇

第三節介紹了本研究的研究工具後,本節將介紹使用這些工具時的步驟與參 數選擇。

一、 資料檢索

首先,本研究針對不同的研究對象與範圍,在不同的資料庫帄台上,使用合 適的策略檢索所需的資料:檢索策略在設計上為儘量避免雜訊,使用複合的詞彙 作為檢索的關鍵字。在賈伯濾波器的技術領域中,「gabor filter」、「gabor function」、

「gabor wavelet」和「gabor transform」是和本研究的目標關聯性較高的詞彙,因 此藉由僅檢索關聯性高的複合字來降低檢索結果的雜訊。

1. SCIE:以下詳述將資料從 Web of Science 擷取回來的步驟:

(1) 在 Web of Science 的「進階搜尋(Advanced Search)」輸入檢索字串

「Topic=("gabor filter*") OR Topic=("gabor function*") OR Topic=("gabor wavelet*") OR Topic=("gabor transform*")」,並選擇時間(Timespan)為

「1985~2008」,以及資料庫為「SCIE」。使用 Web of Science 查詢論文時的查詢 畫面如下:

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

圖 3-2:Web of Science 檢索畫面

(2) 由於 SCIE 檢索出來的資料並非完全符合研究個案的技術領域,可以再使 用 Web of Science 的 Refine Results 將四種較符合的領域篩選出來,總共得到 881 筆資料。

圖 3-3:使用 Web of Science 的 Refine Results

(3) 接下來將資料下載回來。檢索結果畫面下方選取要儲存的項目範圍之後

(一次最多只能 500 項),勾選 Full Record(因為需要使用 citation 的資料)。接 著,點選「Save to Plain Text」將資料儲存為 Plain Text 格式,最後再點選「Save」

按鈕,過一陣子便會出現儲存檔案的對話窗,再選擇資料要儲存的位置即可。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

圖 3-4:使用 Output Records 從 Web of Sciencem 下載資料

由於 SCIE 一次只允許下載 500 筆的資料,如果總資料筆數超過 500 筆,就 需要分批下載。以本研究為例,需要分兩次下載。

2. USPTO:以下詳述將資料從 Webpat 下載回來的步驟。

(1) 在 Webpat 的「進階檢索」中使用以下的檢索字串:「("gabor filter*" <IN>

ANY ) OR ("gabor function*" <IN> ANY ) OR ("gabor wavelet*" <IN> ANY ) OR ("gabor transform*" <IN> ANY )」。同時,在進階檢索的下方設定檢索時間為 1985/01/01 到 2010/12/31,總共可取得 697 筆 USPTO 的核準專利資料。

圖 3-5:Webpat 的檢索畫面

(2) 接著,在檢索結果畫面下方的「資料匯出」區域輸入欲匯出的紀錄範圍,

勾選「書目資料」,並在步驟 3 選取「PG 格式」,最後點選「儲存」,便可以將 Webpat 的資料下載回來。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

圖 3-6:使用「資料匯出」從 Webpat 下載資料

由於 Webpat 同樣只允許一次下載 500 筆的資料,如果資料筆數超過 500 筆,

還是需要分批下載才行。

二、 資料格式轉換

經由步驟一檢索出來的資料,需要進一步擷取出本研究所需的部份,以及轉 換為容易處理的格式。

(一) 專利被引用次數計算

由於 USPTO 的資料僅包含「引用其它專利或論文」的資料,需要藉由比對

「專利號碼」和「引用其它專利或論文」兩欄資料去計算專利的被引用次數。

(二) 格式簡化

此步驟將 SCIE 和 USPTO 取回的資料簡化成容易處理的表格形式。

SCIE 的資料將被簡化成以下的表格形式:

論文編號 作者列表 發表年份 論文標題 被引用次數

1

USPTO 的資料亦將被簡化成類似的表格形式:

專利編號 發明人列表 申請年份 專利標題 被引用次數 1

三、 作者與發明人分組

經過步驟二簡化資料格式後,便可以較容易地進行處理。此步驟將擷取「論

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

文作者」、「專利發明人」以及「發明作者」的列表。接著,計算每個列表中的作 者的論文(專利)總數和被引用次數。最後,將列表中的作者依據研究架構的定 義分類,建立分類後的列表。茲將所有分組列表如下:

表 3-4:作者與發明人分組列表 編號

1

頂尖作者

2

關鍵發明人

3

天才發明人

4

勤奮發明人

5

發明作者

四、 資料產生

此步驟將透過分類好的作者、發明人和發明作者的列表,篩選各個組別擁有 的專利和論文,並產生兩種計量資料:「歷年人數」、「歷年專利申請數」、「歷年 論文發表數」。同時,本研究為了分析技術生命週期的需要,亦產生「歷年全體 專利申請數」的資料以供比較分析。

另一方面,為了更進一步瞭解發明作者的技術發明和科學研究的關係,發明 作者中關鍵發明人的背景資料和論文和專利標題也被擷取出來分析。發明作者的 背景資料主要由本研究整理自各發明作者的個人網站而得。

五、 資料分析

最後,將步驟四的歷年趨勢資料輸入 Excel,呈現並分析數據。本研究將分 析的數據包含了以下幾項:

1. 各組作者和發明人的人數、專利申請、論文發表的時間分佈

2. 發明作者與各組作者、發明人的關聯性(如:頂尖作者佔發明作者的比 例)

3. 發明作者的首次專利申請時間和首次論文發表時間的時間差

4. 發明作者中關鍵發明人申請專利和發表論文的時間點與主題的關係

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y