• 沒有找到結果。

趨勢分析與介面

第四章 個案探討(USPTO)

第三節 趨勢分析與介面

依前述實作兩個不同定義概念的結果,發現到當關連式探勘適合擷取各篇 專利說明書所強調的概念與語意,經過關連式探勘所擷取的概念雖然會有語意 重疊的情況發生,會挖掘出過多的詞,但所挖掘的結果還蠻符合各篇專利所探 討的主題。而 K-means 所分出來的群是整個語料庫所在探討,比較廣泛的概念。

在進行趨勢分析時,受限於專利領域裡,不同的專利說明書作者習慣以不 同的用語形容其技術核心,如某一篇專利文件 A 的重要概念包含”SQL”,另一 篇專利文件 B 作者針對查詢語言(Query)的結合 (Join)運算進行改良,B 的作者 在這份專利文件中比較常出現的是 ”Join”,在一般的認知上對 ”Join” 做改良 其實相當於對 ”SQL” 的執行程序進行改善,但在專利文件 B 中, ”SQL”幾乎 從未出現,所以若在計算 ”SQL” 這個詞出現在文章的篇數時,專利文件 B 卻 往往不會被算進去,會使得結果有所偏差。在進行趨勢分析的時候,會以 K-means 所得到的概念進行趨勢分析,以關連式探勘的結果提供給使用者各篇 專利所強調的概念。

第三節 趨勢分析與介面

本節是在介紹前述處理所擷取出來的概念,在經過本論文的趨勢分析 得到的結果。目前群的命名先以人工暫定,使用者可以在介面上得知群的組成 分子,再結合本身的專業對群的命名做更改。在這個專利地圖上,橫軸代表的 是時間,而縱軸代表的是卡方的分數。

圖 4-4 為使用者查看 1993-7-13 到 2003-1-14 中間熱門的趨勢所得到的結 果,得到 6 個群,在這 6 個群中,有 5 個群各自出現的專利篇數佔整個資料庫 的 10%~20%。本語料庫中的專利說明書,大部份都是在探討有關 ”資料庫” 方 面的改良,但在 1994 與 1995 年間的時候,與影像處理有關的詞在這段期間卻 是具有顯著性,由此現象,我們或許可以猜測在那段時期左右,曾興起一波影 像處理與資料庫結合的研究熱潮。

群的命名是以人工的方式,在群裡挑選兩個比較能代表這群大致上所討論 議題的詞,但除此之外使用者也可依本身的專業在圖 4-5 的介面上,更改群的 命名,或影響分群的結果,使分析的結果能更貼切使用者需求。

除此之外,使用者可以在呈現概念的長條圖上,按左鍵列出在這分析時間 點包含這概念的專利文件或這語料庫中包列這概念的專利文件,圖 4-6 為使用 者在右邊的平面,mouse click 的區塊,選擇”show patents in the time”的選項後 在左邊的平面長條塊”cok, histogram”按右鍵所得到的結果。系統會呈現這段時 間點上,包含這概念的專利文件編號,使用者可依據這專利編號,進一步查看 這專利特別強調的概念,也就是關聯式探勘所得到的結果。

圖 4-4 呈現專利趨勢分析結果的介面

圖 4-5 專利趨勢分析中使用者修改概念的介面

圖 4-6 呈現包含選取概念的專利文件

第四節 結果分析

相較於挖掘出代表各篇的概念再做趨勢分析而言,先對相同意義的字做分 群再進行專利趨勢分析似乎能得到更佳的效果。現在趨勢分析的結果深受分群 結果、分群命名所影響,雖然採取的 K-means 針對語料庫進行分群的工作,在 有些分群中,所探討的議題還蠻貼近的,然而 K-means 同時也會產生過大或過 小的群,過大的群會導致不同意思的字被集中在一起,對我們分析結果造成相 當大的困擾。

日後工作需要再改善目前現在分群結果,如能改良分群的效果再進行專利 趨勢分析,相信可以得到一個更佳的分析結果。

相關文件