• 沒有找到結果。

專利主題與專利關聯度分析

在文檔中 深度學習之專利分析研究 (頁 63-71)

本節包含兩個部分,包括:專利分類號與主題歸類,分析結果與說明如下。

一、 專利分類號

專利分類號是根據專利的技術或應用主題進行分類,可以方便使用者檢 索與使用,目前常見的分類系統有美國專利商標局所使用的美國專利分類號、

歐洲專利局所使用的歐洲專利分類號以及日本專利局所使用的日本專利分號 等。美國專利文件的專利分類號包含美國專利分類號、合作專利分類號以及 國際專利分類號,USPTO 官方網站說明自 2013 年 1 月 1 日起從美國專利分類 號轉向合作專利分類號,並且不再使用美國專利分類號(United States Patent and Trademark Office, 2018c),故本研究僅分析合作專利分類號與國際專利分類 號。

合作專利分類號與國際專利分類號結構按階層次序分為五個等級,包括:

部(section)、主類(class)、次類(subclass)、主目(group)以及次目(subgroup)(葉 士緯、黃振榮,2017),例如:合作專利分類號 G06N 99/005,G 為部,06 為 主類,N 為次類,99/為主目,005 為次目;國際專利分類號 G06K 9/00,G 為 部,06 為主類,K 為次類,9/為主目,00 為次目。本研究針對合作專利分類號 與國際專利分類號的五階層與三階層進行統計。

專利文件僅顯示合作專利分類號與國際專利分類號,各分類號的解說需另 外 查 詢 , 本 研 究 在 臺 灣 經 濟 部 智 慧 財 產 局 國 際 專 利 分 類 查 詢 系 統

(https://www.tipo.gov.tw/sp.asp?xdurl=mp/lpipcFull.asp&ctNode=7231&mp=1)

查 詢 各 國 際 專 利 分 類 號 之 解 說 , 而 在 USPTO 專 利 分 類 檢 索 系 統

(https://www.uspto.gov/web/patents/classification/index.htm)查詢各合作專利分 類號之解說。

五階層合作專利分類號的前 7 名(專利超過 100 篇),如圖 4-17 所列,依 序為 Y04S 10/54(營運方面的管理)、G06N 99/005(學習機器,即根據機器 本身在完整運行期間獲得的經驗改變程序的計算機)、G06N 3/08(學習方法)、

G06N 3/0454(使用多個神經網絡的組合)、G06K 9/66(此等基準通過適宜的 方法係能夠進行調節,如學習)、G06K 9/4628(將過濾器集成到層次結構中)

以及 G06T 2207/20081(訓練;學習),在這七個五階層合作專利分類號中,

可以看出除了技術方法外,其主要應用領域為「營運方面的管理」。

圖 4-17 TOP7 五階層合作專利號(CPC)次數分佈圖

統計 14957 筆合作專利分類號,三階層合作專利分類號的前 11 名(專利 超過 300 篇),如圖 4-18 所列,依序為 G06K(數據識別;數據表示;記錄載 體:記錄載體之處理)、 G06F(電子數位資料處理)、G06T(一般影像資料 處理或產生)、G10L(語音分析或合成;語音識別)、A61B(診斷;外科;

鑑定)、G06N(基於特定計算模式之計算機系統)、H04L(數位資訊之傳輸,

例如電報通信)、H04N(影像通訊,例如電視)、B60W(不同類型或不同功 能之車輛子系統的聯合控制;專門適用於混合動力車輛的控制系統;不與某 一特定子系統的控制相關聯的道路車輛駕駛控制系統)、G08D(交通控制系 統)、以及 G05D(非電變量之控制或調節系統)。在三階層合作專利分類號 中,可以明顯看出應用領域的比例比五階層合作專利分類號要高很多,可以 看出除了技術方法外,其主要應用領域是「電子數位資料處理」、「一般影像 資料處理或產生」、「語音分析或合成、語音識別」、「診斷、外科以及鑑定」、

「數位資訊之傳輸」、「影像通訊」、「車輛控制系統」以及「交通控制系統」。

圖 4-18 TOP11 三階層合作專利號(CPC) 次數分佈圖

五階層國際專利分類號的前 9 名(專利超過 100 篇),如圖 4-19 所列,依 序為 G06K 9/00(用於閱讀或識別印刷或書寫文字或者用於識別圖形之方法或 裝置,例如:指紋)、G06K 9/62(應用電子設備進行識別之方法或裝置)、

G06F 17/30(資訊檢索;及其資料庫結構)、G06N 3/08(學習方法)、G06K 9/46

(圖像特徵或特性之抽取)、G06T 7/00(影像分析)、G06N 3/04(體系建構,

例如:互連拓樸)、G06N 99/00(本次類其他各目中不包括的技術主題)以及 G06K 9/66(此等基準通過適宜的方法係能夠進行調節,如學習),在這九個

五階層國際專利分類號中,可以看出除了技術方法外,其主要應用領域為「圖 像特徵或特性之抽取」與「影像分析」。

圖 4-19 TOP9 五階層國際專利號(IPC)次數分佈圖

統計 8208 筆國際專利分類號,三階層國際專利分類號的前 7 名(專利超 過 300 篇),如圖 4-20 所列,依序為 G06K(數據識別;數據表示;記錄載體:

記錄載體之處理)、G06F(電子數位資料處理)、G10L(語音分析或合成;

語音識別)、G06N(基於特定計算模式之計算機系統)、G06T(一般影像資 料處理或產生)、A61B (診斷;外科;鑑定)以及 H04N(影像通訊,例如 電視),在這七個三階層國際專利分類號中,可以看出除了技術方法外,其主 要應用領域是「電子數位資料處理」、「語音分析或合成、語音識別」、「一 般影像資料處理或產生」、「診斷、外科以及鑑定」以及「影像通訊」。

圖 4-20 TOP7 三階層國際專利號(IPC)次數分佈圖

根據這 1636 篇深度學習領域專利的五階層與三階層之合作專利分類號與 國際專利分類號,可以看出除了技術方法外,其主要應用領域有「語音分析或 合成、語音識別」、「電子數位資料處理」、「數位資訊之傳輸」、「一般影 像資料處理或產生」、「影像分析」、「影像通訊」、「圖像特徵或特性之抽 取」、「診斷、外科以及鑑定」、「車輛控制系統」、「交通控制系統」以及

「營運方面的管理」。

二、 主題歸類

本研究針對 1636 篇深度學習領域專利的題名進行共字分析,以進行主題 歸類,為避免歸類出來的主題詞與關鍵詞過於相似,也避免有些詞彙難以判 斷主題,除了 CATAR 本身設定的停用詞外,本研究額外加入了 9 個停用詞,

包括:apparatus(儀器)、deep(深)、device(設備)、learning(學習)、

machine(機器)、method(方法)、model(模型)、neural network(神經網 絡)以及 system(系統)。

歸類結果總共有六個階段,第一階段有 372 個集群;第二階段有 74 個集 群;第三階段有 16 個集群;第四階段有 5 個集群;第五階段有 2 個集群;第 六階段有 0 個集群。從六個階段的歸類結果來看,第三階段的歸類結果最好,

集群的數量適中,同時也能看出具體的主題,圖 4-21 為第三階段歸類結果的主 題地圖,一共有 16 個集群,各個集群的描述與主題說明如下。

圖 4-21 共現字歸類第三階段主題地圖

集群 1 有 23 篇專利,最早的專利是在 2016 年公告的,集群 1 的描述詞為 signal(訊號)、acoustic(聲音)、speech(語音)、noise(聲音)以及 filter

(過濾器),這個集群的主題為「語音」;集群 2 有 91 篇專利,最早的專利 是在 2013 年公告的,集群 2 的描述詞為 recognition(識別)與 speech(語音),

這個集群的主題為「語音識別」;集群 3 有 30 篇專利,最早的專利是在 2013 年公告的,集群 3 的描述詞為 audio(音頻),這個集群的主題為「音頻」,

這三個集群的主題較為接近,都是與語音有關。

集群 4 有 47 篇專利,最早的專利是在 2000 年公告的,集群 4 的描述詞為 train(訓練)與 recognition(識別),這個集群的主題為「數據訓練」;集群 5 有 97 篇專利,最早的專利是在 2009 年公告的,集群 5 的描述詞為 data(數據)

與 image(圖像),這個集群的高頻詞還有 automatic(自動的)與 predictive(預 測),這個集群的主題為「圖像」;集群 6 有 89 篇專利,最早的專利是在 2011 年公告的,集群 6 的描述詞為 vehicle(車輛)與 control(控制),這個集群的 高頻詞還有 autonomous(自主的),這個集群的主題為「自動駕駛」,這三個 集群的主題較為接近,都是與訓練或圖像有關。

集群 7 有 34 篇專利,最早的專利是在 2016 年公告的,集群 7 的描述詞為 generate(產生)、call(呼叫)、authenticate(驗證)、context(上下文)以 及 representation(特徵),這個集群的主題大多都與「驗證」或「上下文數據」

有關;集群 8 有 76 篇專利,最早的專利是在 2014 年公告的,集群 8 的描述詞 為 content(內容),這個集群的高頻詞還有 user(使用者)與 media(媒體),

這個集群的主題大多都與「內容」有關,例如:內容檢測與內容傳遞;集群 9 有 246 篇專利,最早的專利是在 2014 年公告的,集群 9 的描述詞為 text processing

(文字處理),這個集群的主題為「文字處理」,這三個集群的主題較為接近,

都是與內容或文字有關。

集群 10 有 101 篇專利,最早的專利是在 2013 年公告的,集群 10 的描述 詞為 object(目標)、recognition(識別)、object recognition(目標識別)、image

(圖像)以及 detection(檢測),這個集群的高頻詞還有 classification(分類),

這個集群的主題大多與「目標檢測」或「目標識別」有關;集群 11 有 27 篇專 利,最早的專利是在 2016 年公告的,集群 11 的描述詞為 detect(檢測)與 camera

(相機),這個集群的主題大多與「檢測」有關,例如:圖像檢測,這兩個集 群的主題較為接近,都是與檢測有關。

集群 12 有 49 篇專利,最早的專利是在 2016 年公告的,集群 12 的描述詞 為 quality(品質)與 image(圖像),這個集群的高頻詞還有 assessment(評估),

這個集群的主題為「圖像品質評估」;集群 13 有 38 篇專利,最早的專利是在 2015 年公告的,集群 13 的描述詞為 analysis(分析)與 communication(溝通),

這個集群的主題大多與「分析」有關,例如:圖像分析、場景分析、檢測分析 以及動態分析;集群 14 有 52 篇專利,最早的專利是在 2015 年公告的,集群 14 的描述詞為 computer(電腦)、diagnosis(診斷)以及 image(圖像),這 個集群的主題大多與「電腦」或「醫療診斷」有關;集群 15 有 87 篇專利,最 早的專利是在 2014 年公告的,集群 15 的描述詞為 image(圖像)與 feature(特 徵),這個集群的主題為「圖像特徵」,這四個集群的主題較為接近,都是與 圖像有關。

集群 16 有 84 篇專利,最早的專利是在 2014 年公告的,集群 16 的描述詞 為 detection(檢測),這個集群的主題大多與「檢測」有關,例如:惡意軟體 檢測、交通檢測以及路況檢測。

從第三階段歸類出來的 16 個集群,可以看出的應用主題有「數據訓練」、

「語音識別」、「文字處理」、「內容(例如:內容檢測與內容傳遞)」、「目 標檢測」、「目標識別」、「圖像檢測」、「圖像特徵」、「圖像品質評估」、

「醫療診斷」、「分析(例如:圖像分析、場景分析、檢測分析以及動態分析)」、

「檢測(例如:惡意軟體檢測、交通檢測以及路況檢測)」、「自動駕駛」以 及「驗證」,其中,「文字處理」、「目標檢測」、「目標識別」、「圖像品 質評估」、「場景分析」、「動態分析」、「惡意軟體檢測」、「交通檢測」、

「路況檢測」、「自動駕駛」以及「驗證」這幾個主題是在分類號看不出來的 應用領域。

在文檔中 深度學習之專利分析研究 (頁 63-71)