經濟價值的產物[29]。根據世界智慧財產局組織 (World Intellectual Property Organization, WIPO)的報告,專利說明書包含了世界上 90~95%的研發成果,其 它技術文獻 (如論文或期刊) 僅含有 5~10%的研發成果。專利資訊是各種產業
件中萃取有用的情報與資訊,以進行專利分析是刻不容緩的工作。
專利的主要功用可分為:進行權利分析以保障權益、評估與預測技術發展、
規畫研發或技術發展項目、掌握企業發展動向及市場需求等四項 [27] ,其中 後三者皆與專利趨勢分析具有密不可分的關係,可見在專利分析中,專利趨勢 分析是相當重要的一環。
現今大部份專利趨勢分析大都以傳統苦力式的人工閱讀方式進行,再經由 專家解釋整合才能向外發佈。目前電腦技術已逐漸應用於專利欄位的統計量化 分析,例如大部份專利資訊系統會將專利文件予以分類,而後統計歷年申請專 利數、歷年申請公告數、歷年專利成長率、歷年專利權人國家數、歷年專利權 人所屬國數、歷年專利權人數量、歷年發明人數量、歷年發明人成長率等。這 些專利資訊系統藉著量化統計分析出有用的情報,但對於使用者而言,這些分 析只能讓使用者得到廣泛的趨勢,若使用者想進一步暸解技術情況時,這些資 訊的幫助是相當有限的。
專利本身包含了大量的資訊,要以快速且經濟的方式分析獲取有用的情 報,除了針對欄位進行統計分析外,有更多重要資訊是隱含在龐大的文字裡面。
統計專利中各個欄位的資訊而得到以統計數字為基礎的專利分析資料,僅是概 括的趨勢情報。本論文企圖從專利文件的龐大文字敍述中,擷取出專利的主題 內容,藉著專利文件的分析希望能呈現技術與經營的脈絡,輔佐使用者進行專 利分析。
第二節 研究方法與目標
本論文所提出的專利分析系統,主要架構是結合文字探勘 (Text Mining)、
統計檢定方法與專利地圖 (Patent Map)的觀念,提供一個回饋式 (Feedback)的 介面,並結合使用者的專業,期使本系統的服務能更貼近使用者的需求。
近年來,文字探勘在各個領域逐漸受到重視,主要用於文件庫中,目前逐 漸與專利分析做結合 [14][18],從專利文件裡挖掘對使用者有用的情報。本論 文所提出的專利分析系統,是採用文字探勘來擷取重要的概念(Concept),而對 概念主要有兩種不同的假設:
針對各篇專利文件,若一些詞出現在同一篇文章同一個句子的頻 率超過一定的比例,則這些詞具有同樣語意,即為該篇專利的重 要概念 。
針對整個專利文件庫的字而言,以字的相似度分成 N 個群,每 個群視為候選的重要概念。
本論文利用文字探勘的方式,希望能分析專利文件中的文字,擷取重要的 概念後,再採用統計檢定的方法針對先前所挖掘的概念,檢定在某特定時間內,
哪些概念已曾熱烈的被討論或是才在萌芽,並把分析結果地圖化─以專利地圖 的形式指引使用者,輔佐使用者進行專利分析,當使用者接觸新的領域時能快 速的知道自己的位置,掌握正確方向與里程。
第三節 論文架構
本論文的第二章將介紹目前專利分析的研究、相關文字探勘的方法,以及
與趨勢相關的統計檢定;在第三章則介紹本論文所提專利系統的架構及處理程 序;第四章透過個案分析驗證處理程序的合理性;最後在第五章總結本論文,
並且提出結論以及探討未來研究的方向。
第二章 相關研究工作
Lert 97 Uchida 04
Swan 00 Morris 02
Agrawal 95