第三章 資料來源與整理
第一節 資料來源
國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
22
第三章 資料來源與整理
第一節 資料來源 一、社會網絡連結資料來源
要分析台灣創業投資案的深層問題,必須先找出曾發生在台灣創業投資案的 投資紀錄,接著整理出創投方經理人及被投資方董監經理團隊的學歷背景資料以 衡量「教育網絡」對創業投資案的影響。但創業投資研究最大的困難就是資料取 得非常不易,因為目前並沒有任何資料庫專門整理創投公司經理人過去的學經歷 背景資料,因此為了克服這一限制,我們研究團隊便必須從零開始建置資料庫。
(一) 創業投資案資料
根據過去創投研究的文獻得知我們可從 Thomson Financial 資料庫中的 Private Equity 子資料庫取得台灣的創業投資案紀錄,我們向該資料庫母公司 Thomson Reuters 聯繫並購買 Thomson Financial 資料庫中的 Private Equity 子資料庫。而由於 過去文獻所使用的都是 Thomson Financial 單機版資料庫,若臨時有查詢資料需求 將非常不方便,所以我們特地購買網頁版資料庫 DataStream Professional 資料庫5, 並從中擷取曾發生在台灣的創業投資案,其內容包含投資案發生時間(Funding Date)、注資的創投公司(Investing Firm)及創投基金(Investing Fund)、被投資的公司 (Invested Company)、該投資案是發生在被投資公司的哪個階段(Funding Stage)及第 幾輪被投資(Funding Round)、是否有聯合投資紀錄(Syndication Investment)等重要 資料。
(二) 創投公司與被投資公司成員學經歷背景
由於創投公司經理人的背景資料不像一般共同基金經理人的背景資料可透過
5 本研究向英商路透股份有限公司(Thomson Reuters)購買 DataStream Professional 資料庫中的 Private Equity 子資料庫 2013-2014 之使用權,並從中擷取曾發生在台灣的創業投資案。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
23
MorningStar、Preqin、BoardEx 等學經歷背景資料庫取得,因此為成功取得資料,
我們向經濟部商業司(Commercial Industrial Services Portal, Ministry of Economic Affairs)索取創投公司自成立以來所有經理人的名單及股權變動資料以了解歷年創 投公司的成員變動情況。
被投資公司方面則困難多了,由於其包含已公開發行公司(Listed Company)及 未公開發行公司(Non-listed Company)兩類,未公開發行公司的資料取得方式與創 投公司相同,向經濟部商業司索取未公開發行公司自成立以來所有董監經理人的 名單及股權變動資料;對於已公開發行公司,我們從公開資訊觀測站網站(Market Observation Post System)下載已公開發行公司歷年的年報資料,其內容包含當年該 公司董監經理人團隊的成員、股權、學歷、經歷等重要資訊。可惜的是,公開資 訊觀測站只提供 1998 年至 2011 年的年報,因此為補足 1998 年前的資料,我們同 樣向經濟部商業司索取已公開發行公司自成立以來至 1998 年歷年所有董監經理人 的名單及股權變動資料,並將經濟部商業司的資料及年報資料結合起來,再加上 未公開發行公司的資料組合成所有被投資公司自成立以來至 2011 年歷年董監經理 人團隊的名單、學經歷背景及股權變動資料。
然而本研究的核心是「教育網絡」,尤其是 Type3 及 Type4 兩層級涉及到「時 間」因素,但到目前為止只有 1998 年以後的已公開發行公司董監經理人團隊的學 經歷資料,仍缺乏他們的畢業年份資料,因此為了補足創投公司、未公開發行公 司及 1998 年以前的已公開發行公司董監經理人團隊學經歷背景的缺漏,我們先透 過商業客戶導向的社交網路服務網站 LinkedIn 查詢所有創投公司及被投資公司董 監經理人團隊的學經歷背景資料並補上畢業年份,但仍難免有相當多的董監經理 人無法透過 LinkedIn 查到學經歷資料及畢業年份,故我們再以 Google、各大學校 友網站、新聞專題採訪報導等方法補齊學經歷資料及畢業年份。
二、專利與研究發展資料來源
在公司研發能力資料方面,文獻上已提出一家廠商自身的研發能力有數種衡
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
24
量指標,包含:廠商提出的專利申請數量、專利被引證次數及加權專利總數等指 標;衡量專利品質的指標則包含專利被引證次數、專利訴訟案件數及單一專利向 不同國家提出申請次數。
(一) 專利資料篩選
由於「專利訴訟案件數」及「單一專利向不同國家提出申請次數」兩資料僅 能看出單一專利的品質優劣或是否為核心專利,較不適合用來衡量公司整體的研 發能力,因此衡量專利品質時僅以「被引證次數」為指標;另方面,「加權專利總 數」必須考慮專利總數及被引證次數的時間落後問題,因為一般而言,從專利提 出申請至被核准再至被引證會有兩個時間間隔,Hall, Jaffe and Trajtenberg(2001)文 中指出隨著技術的進步,從專利提出申請至被核准的時間間隔從 1960 年代的平均 2.4 年降至 1990 年代的 1.8 年,因此文獻上也大多以 2 年為衡量基準;然而,引證 次數不若申請時間及核准時間只有一個時間點,可能每年都會被引證,因此造成 引證的時間間隔難以估計,故在文中指出 1990 年代後專利從申請年度算起大約經 過 5 年就會有被引證紀錄,然而文獻上目前仍鮮少著墨於引證的落後時間問題,
故本研究也將剔除加權專利總數指標,將重心投入在「專利申請數量」及「被引 證次數」。
另方面,絕大多數的專利研究文獻都是以美國專利商標局(USPTO)的資料為基 礎進行研究。原因是美國是當今世界最大的市場,世界各國的公司(尤其是跨國公 司)除了會在本地申請專利外,也會把公司重要的或核心的專利向美國提出申請以 增強公司專利網的布局及做未來進軍美國市場的事前準備,平均而言美國專利商 標局所核准的專利大多都是品質較好或核心專利,因此本研究的專利資料也將以 美國專利商標局(USPTO)的資料為基礎進行研究。
‧
提供 2001 年後的世界各國向其提出申請的所有公開專利(Patent Application)資料,並沒有 2000 年以前歷年的公開專利資料;此外,USPTO 網站上的核准專利(Granted Patent)資料一次只能看到一筆專利的簡歷,且不能將專利資料下載下來做分析,故 捨棄美國專利商標局(USPTO)網站資料庫。
2. NBER 核准專利資料庫
由於 USPTO 網站使用不方便,故轉而尋求由 Hall, Jaffe and Trajtenberg(2001) 三位教授所建置的核准專利(Granted Patent)資料庫,該資料庫置於美國全國經濟研
6 NBER 專利資料是由 Hall, Jaffe and Trajtenberg 三位教授所建置,詳細的資料介紹都寫在 Hall, Jaffe and Trajtenberg(2001)這篇文章中。該資料內容只包含核准專利(Granted Patent),並不包含申請專 利(Patent Application),其中專利核准日期(Granted Year)時間範圍是從 1963 年~1999 年;申請日 期(Application Year) 時間範圍是從 1967 年~1997 年;引證資料時間範圍是從 1975 年~1999 年
。另方面,NBER 專利資料包含專利所有權人(Assignee)、SIC Code、發生訴訟案件次數(Number of claims)、引證次數(Citation Made)、被引證次數(Citation Received)、自我引證次數(Self-citation) 等資料,屬於公司層級資料(Firm-Level Data),故適合可用來做產業研究(實際上大多數學術研究 也都是做產業研究),但缺點是不包含專利申請人(Applicant)資料,因此不適合用來衡量公司自身 的研發能力。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
26
3. Mtrends 專利檢索暨分析管理平台
政治大學有購買 Patent Guider 專利檢索平台,該平台包含 USPTO-Issed(美國 核准專利資料庫)、USPTO-Application(美國申請專利資料庫)等專利資料庫,但一 家公司一次至多只能輸出 500 筆專利資料,然而在我們研究的被投資公司中有相 當多公司專利數量均超過 500 筆,故使用上相當不方便。因此我們轉而向 Patent Guider 專利檢索平台母公司 ─ 台灣連穎科技公司(LearningTech Corp.)洽詢並購 買專利資料庫。與 DataStream Professional 資料庫相同狀況,如果購買單機版 Patent Guider 專利檢索平台,若臨時有查詢資料需求將非常不方便,所以我們購買網頁 版專利檢索平台「Mtrends 專利檢索暨分析管理平台」7,其包含 USPTO-Issed(美 國核准專利資料庫)、USPTO-Application(美國申請專利資料庫)、EPO(歐盟專利資 料庫)、SIPO(大陸專利資料庫)等資料庫。
然而,這些專利資料庫都有一個共同的缺點,同一間公司在申請不同專利時 可能會以不同申請人名義申請,因此如果以申請人為基礎搜尋某一間公司的專利
,可能無法查詢到該公司的所有專利。若要查詢該公司所有的專利資料,必須將 所有可能的申請人全部查詢一次,再將全部專利加總才能得出該公司所有的專利 資料。以「鴻海精密工業股份有限公司」為例:若將申請人設定成「HON HAI PRECISION IND. CO., LTD.」可查到 5588 筆專利,但若將申請人設定成「HON HAI PRECISION INDUSTRY CO., LTD.」可查詢到 9105 筆專利。兩個檢索條件差異在 於「IND.」及「INDUSTRY」,此兩個檢索條件都是指鴻海精密工業股份有限公司
,但資料庫在檢索時會將此兩者視為不同公司,因此應將此兩者之專利筆數加總(
即 5588+9105=14693)才是鴻海精密工業股份有限公司所有的申請專利。故可知若 使用 USPTO-Issed(美國核准專利資料庫)或 USPTO-Application(美國申請專利資料 庫)兩資料庫,將無法找出被投資公司所有的申請專利及核准專利。
7 本研究向連穎科技公司(LearningTech Corp.)購買 Mtrends 專利檢索暨分析管理平台 2013-2014 之 使用權,並使用其內建的 WebPat 資料庫擷取以專利申請人為基礎的各被投資公司核准專利。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
27
所幸 Mtrends 專利檢索暨分析管理平台中的 WebPat(連穎-全球專利資訊網)解 決了此一問題。首先 WebPat(連穎-全球專利資訊網)可直接連結至 USPTO-Issed(美 國核准專利資料庫)、USPTO-Application(美國申請專利資料庫)、EPO(歐盟專利資 料庫)、SIPO(大陸專利資料庫)等資料庫的系統截取資料庫裡所有的專利資料;其 次,將檢索條件設定成以「專利申請人」為基礎再透過「放大鏡檢索」功能即可 檢索出某一公司所有的專利申請人,並找出這些專利申請人分別提出多少次專利 申請次數,最後再把這些申請專利資料下載下來並儲存成一個專案,即可取得公 司歷年提出專利申請數量,故本研究採用此一系統擷取專利資料。
(三) 專利及被引證次數資料下載
由 於 我 們 需 要 被 投 資 公 司 歷 年 專 利 申 請 數 量 及 被 引 證 次 數 , 但 因 為 USPTO-Application(美國申請專利資料庫)僅提供 2001 年後的專利資料,而本研究 的被投資公司大多在 2001 年前即有專利申請紀錄,故必須用 WebPat(連穎-全球專 利資訊網)連結至 USPTO-Issed(美國核准專利資料庫)並設定檢索條件為「專利申請 人」,再透過「放大鏡檢索」功能,將檢索結果依公司別儲存成不同的專案,取得
由 於 我 們 需 要 被 投 資 公 司 歷 年 專 利 申 請 數 量 及 被 引 證 次 數 , 但 因 為 USPTO-Application(美國申請專利資料庫)僅提供 2001 年後的專利資料,而本研究 的被投資公司大多在 2001 年前即有專利申請紀錄,故必須用 WebPat(連穎-全球專 利資訊網)連結至 USPTO-Issed(美國核准專利資料庫)並設定檢索條件為「專利申請 人」,再透過「放大鏡檢索」功能,將檢索結果依公司別儲存成不同的專案,取得