研究前沿之分析應用
以藥理與毒物學為例
- 以藥理與毒物學為例
國家實驗研究院科技政策研究與資訊中心 創新策略組
賴志遠 吳騏 吳悅 王碧玲
2
內容大綱
一、研究動機與目的 二、文獻回顧
三、研究方法
四、研究領域的決定與資料取得 五、如何應用這些寶貴的資料?
六、結論與建議
一、研究動機與目的
動機
洞悉科學發展趨勢
• 洞悉科學發展趨勢
• 累績繪製科學地圖能量
目的
• 提供決策者資源盤點資料
• 提供決策者資源盤點資料
• 提供學研界科學發展趨勢之變化
4
二、文獻回顧
科學計量/文獻計量學發展沿革
• 1955年,Eugene Garfield提出引文分析方法(citation 來探討學術文獻的潛在關係 g 並且從文獻之間的 ( analysis)來探討學術文獻的潛在關係,並且從文獻之間的 引用關係來探討科學發展的脈絡,從而開創了引文分析的 用途。
• 1963年, E. Garfield 成立ISI (Institute For Scientific Information) 並且建立了引文索引資料庫(SCI;Science Citation Index) 。
• 1963年,Derek J. de Solla Price發表的「小科學,大科 學 (Little Science Big Science 1963)一書 對科學發 學」(Little Science, Big Science,1963)一書,對科學發 展提出了定量化分析。
• 1974年Small和Griffith把他們所構思的「共引用群聚」和
「研究前沿」結合在一起,探討最新發表文獻中的高引用
資料。
二、文獻回顧
科學計量/文獻計量學發展沿革
• Martin和Irvine於1983年利用「收斂指數」(converging 來作為大科學建設的評價 」( 利用論文產出 g g partial indicator)來作為大科學建設的評價,利用論文產出 及被引用次數來作為評價指標。
• Narin、Olivastro和Stevens在1994年總結了文獻計量學的 發展,將文獻計量的工作分成三大類:學術活動量測、衝 擊量測、聯結度量測等。
• Boyack和borner於2003年提出一利用視覺化呈現方式來 表現研究論文產出成果對計畫撥款的影響。利用計畫-產 出地圖來作為一種輔助性的工具來提昇評量研發資源投入 出地圖來作為一種輔助性的工具來提昇評量研發資源投入 的效率。
• 2005年,Glenisson、Glanzel、Janssens和De Moor等人 結合了全文分析及文獻計量方法,並利用共用字及相關概 念來進行地圖的繪製。
6
三、研究方法
• 為完整呈現某科學領棫的發展面貌,且落實科學 地圖之客觀性與全面性;本研究採用三種分析方 地圖之客觀性與全面性;本研究採用三種分析方 法:專家意見、文獻計量、探勘技術。希望結合 三種方法,截長補短達到互補效應,並在未來能 夠整合三種方法,提出一套綜合方式以發展探視 未來科學發展趨勢的方法。
文獻計量 文獻計量
使用co-word或是 從引用的狀態來對
文獻群作分群
專家意見法 專家意見法
利用學者專家本 身的領域知識解
讀前沿結果
探勘技術 探勘技術
利用文字探勘方法 對前沿之文字進行
分群
四、研究領域的決定與資料取得
• 利用Thomson Reuters出版的ESI資料庫所提供之 「 研究前沿 」(Research Front) 功能,可找出各領域的 研究前沿主題。
• 研究前沿將過去十年間國際間各個領域的論文,
從高度被引用文獻之引用關係,通過群聚分析 (Cluster Analysis) ,產生聚類集合。有助於獲知目前 各領域的研究成果有哪些重要發現,以及反映出 當前科學家重點關注的方向
當前科學家重點關注的方向。
• 文獻的主要來源來自SCI及SSCI約11,000種的學術 期刊。
• 共提供22個研究領域的研究前沿。
8
研究領域的決定與資料取得
• 高引用率文獻:各領域於十年內被引用次數 Top 1%的文章。 p
• 因此ESI所收錄的文獻,可反映現今重要學術 研究潮流,具有一定之代表性。
• 而研究前沿又將ESI的文獻資料作更完整的萃 煉,使得在科學趨勢分析上更具有可信度。
基於政府兩兆雙星之政策 選擇生技領域作為
• 基於政府兩兆雙星之政策,選擇生技領域作為 研究標的。經篩選後共九個領域與生技相關,
最終以藥理毒物學(我國全球排名19)為標的。
ESI的研究前沿頁面
10
22領域列表
Agricultural Sciences 農業科學 Biology & Biochemistry 生物與生化
Chemistry 化學
Clinical Medicine 臨床醫學
Computer Science 計算機科學
Economics & Business 經濟貿易
Engineering 工程
研究前沿每個領域可直接
Environment/Ecology 環境Geosciences 地球科學
Immunology 免疫學
Materials Sciences 材料科學
Mathematics 數學
Microbiology 微生物
Molecular Biology & Genetics 分子生物與基因
Multidisciplinary 跨領域
研究前沿每個領域可直接 提供的訊息包含:
1.該領域之研究人員排名 2.該領域之研究機構排名 3.該領域之國家排名 4.該領域之學刊排名 5.
Highly Cited PapersMultidisciplinary 跨領域
Neuroscience & Behavior 神經科學與行為科學 Pharmacology & Toxicology 藥理與毒物學
Physics 物理
Plant & Animal Science 動植物學 Psychology/Psychiatry 心理學 Social Sciences, general 社會科學
Space Science 太空科學
6.
Hot Papers研究前沿搜尋結果呈現頁面
研究前沿單一領域經檢索 研究前沿單一領域經檢索 後所提供的資訊包括:
1.核心論文的基本資料 2.由群集論文標題之關鍵 字所組成的前沿關鍵字 3.每個前沿所含論文數量 4.該前沿論文的總引用次數 5.該前沿每篇論文的平均被 引用次數
6.該前沿論文的平均發表年 次
ps:每個前沿的論文稱之為核心論文
12
核心論文資料
1.標題 2.作者 3.出處 4.通訊住址 5.領域所屬
論文發表年度分佈
五、如何應用這些寶貴的資料?
14
進行前沿的中文化與解讀
目的:加強對前沿的理解,以提昇未來對前沿的分析及分群作業
前沿的中文化與解讀
Ex: Research Front 76
Fronts 原文 研究團隊中文化 專家解讀
NEURODEGENERATIVE DISORDERS;
PHARMACOLOGICAL IRON CHELATION PREVENTS MPTP- INDUCED
NEUROTOXICITY IN-VIVO;
PARKINSON'S DISEASE;
NOVEL THERAPY; MULTI-
神經退化性疾病、
藥理上以鐵螯合劑 預防神經毒素 MPTP誘發的神經 毒性體內研究、帕 金森氏症
鐵螯合劑抑制腦部 MPTP神經毒性及 其對帕金森氏症治 療之研究
O ; U
FUNCTIONAL DRUGS
16
專家分群
研究議題 總數 所含前沿編號
A1 訊息傳遞機制(受體)之研
究 40
3、9、14、17、18、21、29、31、39、41、45、48、49、50、58、61、65、67、69、81、82、
88、89、93、101、103、120、127、128、129、136、138、142、144、145、149、162、172、
究 186、194、211、217、237
A2 細胞生理學之研究 52
4、12、16、19、32、35、37、40、42、43、51、53、54、55、57、66、70、73、80、85、87、
92、95、96、99、108、111、115、123、126、137、139、140、141、146、150、153、161、
163、165、179、196、199、206、216、228、231、234、235、242、247、257
A3 藥效學/藥物動力學 40
8、10、25、27、36、68、109、116、121、132、134、141、151、154、169、174、177、180、
181、182、183、185、190、197、200、201、202、204、210、215、223、224、227、232、233、
245、248、249、250、251、256
A4 藥物毒理研究、劑量與藥
物安全 41
2、11、13、23、28、34、44、47、56、64、72、75、76、86、91、97、101、102、112、120、
122、130、135、143、147、157、159、160、166、178、184、193、209、212、218、219、222、
229、230、244、254、259
A5 大分子藥物的設計及傳遞 11 46、58、71、87、104、124、125、152、155、167、168、175、188、211、239
A6 以奈米、生物醫材或
polymer應用於藥物傳輸 28 24、30、33、38、52、74、83、84、98、106、110、113、114、121、133、148、173、175、
176、198、203、258
A7 基因體學的研究與應用於
藥物治療 9 15、22、63、79、100、118、158、192、195
A8 組織工程的應用 6 5、171、189、225、226、236
A9 新分析方法之應用 14 26、59、60、62、77、117、156、160、187、203、205、207、214、238、241
A10 其它 24 1、6、7、20、78、90、94、105、107、119、131、164、170、191、208、213、220、221、240、
243、246、252、253、255
新分析方法之應用 其他
專家分群
藥物毒理研究、劑量與藥物安全 大分子藥物的設計及傳遞 以奈米、生物醫材或polymer應用於藥物傳輸 基因體學的研究與應用於藥物治療 組織工程的應用 新分析方法之應用
0 10 20 30 40 50 60
訊息傳遞機制(受體/)之研究 細胞生理學之研究 藥效學/藥物動力學 藥物毒理研究 劑量與藥物安全
18
文獻計量分析
• 統計出論文發表最多的國家、機構、作者(研究人員),
以及這1,655篇最常引用的著作、學者、期刊 以及這1,655篇最常引用的著作 學者 期刊
USA
# 1
ENGLAND
# 2
GERMANY
# 3
CANADA
# 4
ITALY
# 5
FRANCE
# 6
TAIWAN
# 33
2002 0 2 1 0 1 0 0
2003 100 25 20 11 14 12 0
2004 145 37 29 21 14 10 1
2005 168 43 27 26 22 15 2
2006 189 49 28 26 21 23 0
2007 225 51 46 32 31 25 1
2008 149 30 33 23 25 19 2
篇數合計 976 237 184 139 128 104 6
文獻計量分析
• 「藥理毒物學」的研究前沿中,最具生產力的作者
Author Count Author Fractional Count Supuran, CT 19 Supuran, CT 7.4 Scozzafava, A 14 Di marzo, V 3.7 Di marzo, V 12 Scozzafava, A 3.1 Ramakrishna S 11 Pertwee RG 3 0 Ramakrishna, S 11 Pertwee, RG 3.0 Devarajan, P 10 Milligan, G 3.0 Pacher, P 10 Szabo, C 2.9 Piomelli, D 10 Dyson, PJ 2.9 Mabury, SA 10 Devarajan, P 2.9
20
文獻計量分析
• 「藥理毒物學」的研究前沿中,最具生產力的機構
Author's Institute Count Author's Institute Fractional Count Harvard Univ 75 Harvard Univ 27.6
Univ Texas 40 Univ Texas 19.1
Univ Calif San Diego 39 Univ Calif San Diego 18.7 Univ Washington 39 Natl Univ Singapore 15.9 Vanderbilt Univ 34 Vanderbilt Univ 14.5 Univ Calif San Francisco 34 Univ Calif San
Francisco 14 Univ Calif Los Angeles 30 Univ Calif Los
Angeles 14
群集分析
¾ 自組織映射圖
(Self Organizing Maps SOM)
(Self-Organizing Maps, SOM)
現階段在產官學研中被廣泛應用的智慧型群聚技術,是 芬蘭赫爾辛基大學 Kohonen 教授1980年所提出的群聚 分析方法。可對高維度及複雜難以認知的資料進行群聚 分析,再將這些資料映射到二維圖形上,這些二維的映 分析,再將這些資料映射到二維圖形上,這些二維的映 射結果會呈現多個群聚,讓使用者可以一目了然資料的 群聚特性。
22
群集分析
¾ 自組織映射圖
(S lf O i i M SOM)
(Self-Organizing Maps, SOM)
但對於某些具階層關係之資料, SOM 演算法無法表達 出資料的階層性。 SOM 只能將其群聚在相同的區域,
導致使用者對階層式資料的結果有著解讀分析上的困難。
群集分析
¾ 增長階層式自組織映射圖
(Growing Hierarchical Self Organizing Maps GHSOM)
(Growing Hierarchical Self-Organizing Maps, GHSOM)
由於SOM只能夠演算出第一階層的分群,沒有辦法展現 文件間階層性的關係,Rauber(2002)等學者提出了 GHSOM分群方法,增加組織圖縱向階層分群之功能。
24
群集分析
¾ 增長階層式自組織映射圖
(Growing Hierarchical Self Organizing Maps GHSOM)
(Growing Hierarchical Self-Organizing Maps, GHSOM)
Layer 0
Layer 1
Layer 2
寬度終止參數 深度終止參數
Layer 3
Example of Animals Clustering
(T. Kohonen )
Small Medium Big 2-Legs 4-Legs Hair Hooves Mane Feathers Hunt Run Fly Swim
1 0 0 1 0 0 0 0 1 0 0 1 0 Dove
1 0 0 1 0 0 0 0 1 0 0 0 0 Chicken
1 0 0 1 0 0 0 0 1 0 0 0 1 Duck
1 0 0 1 0 0 0 0 1 0 0 1 1 Goose
1 0 0 1 0 0 0 0 1 1 0 1 0 Owl
1 0 0 1 0 0 0 0 1 1 0 1 0 Hawk
0 1 0 1 0 0 0 0 1 1 0 1 0 Eagle
0 1 0 0 1 1 0 0 0 1 0 0 0 Fox
0 1 0 0 1 1 0 0 0 0 1 0 0 Dog
0 1 0 0 1 1 0 1 0 1 1 0 0 W lf
0 1 0 0 1 1 0 1 0 1 1 0 0 Wolf
1 0 0 0 1 1 0 0 0 1 0 0 0 Cat
0 0 1 0 1 1 0 0 0 1 1 0 0 Tiger
0 0 1 0 1 1 0 1 0 1 1 0 0 Lion
0 0 1 0 1 1 1 1 0 0 1 0 0 Horse
0 0 1 0 1 1 1 1 0 0 1 0 0 Zebra
0 0 1 0 1 1 1 0 0 0 0 0 0 Cow
26
SOM vs. GHSOM
F Ti
Engle
Fox Cat Dog Wolf
Tiger Lion Horse Zebra
Dove Chicken
Duck Cow
Engle
Fox Dog Wolf Cat
Tiger Lion Horse Zebra
Cow
Owl Dove Hawk
Goose Owl Hawk
Cow Cow
Chicken Goose Duck
28
專家與 GHSOM 分群結果 (A6)
研究議題 總數 所含前沿編號
A1 訊息傳遞機制(受體)之研
究 40
3、9、14、17、18、21、29、31、39、41、45、48、49、50、58、61、65、67、69、81、82、
88、89、93、101、103、120、127、128、129、136、138、142、144、145、149、162、172、
究 186、194、211、217、237
A2 細胞生理學之研究 52
4、12、16、19、32、35、37、40、42、43、51、53、54、55、57、66、70、73、80、85、87、
92、95、96、99、108、111、115、123、126、137、139、140、141、146、150、153、161、
163、165、179、196、199、206、216、228、231、234、235、242、247、257
A3 藥效學/藥物動力學 40
8、10、25、27、36、68、109、116、121、132、134、141、151、154、169、174、177、180、
181、182、183、185、190、197、200、201、202、204、215、223、224、227、232、233、245、
248、249、250、251、256
A4 藥物毒理研究、劑量與藥
物安全 41
2、11、13、23、28、34、44、47、56、64、72、75、76、86、91、97、101、102、112、120、
122、130、135、143、147、157、159、160、166、178、184、193、209、212、218、219、222、
229、230、244、254、259
A5 大分子藥物的設計及傳遞 11 46、71 、58 、87、104、124、125、152、155、167、168、175、188、211、239
A6 以奈米、生物醫材或polymer應用於藥物傳輸 23 24、30、33、38、52、74、83、84、98、106、110、113、114、121、133、148、
173、175、176、198、203、210、258 A7 基因體學的研究與應用於
藥物治療 9 15、22、63、79、100、118、158、192、195
A8 組織工程的應用 6 5、171、189、225、226、236
A9 新分析方法之應用 14 26、59、60、62、77、117、156、160、187、203、205、207、214、238、241
A10 其它 24 1、6、7、20、78、90、94、105、107、119、131、164、170、191、208、213、220、221、240、
243、246、252、253、255
研究前沿的直接產出
30
初級階層式資訊之結果呈現
領域 領域
主題1 主題2 主題3 ...
主題1 主題2 主題3
前沿編號25 前沿編號57 前沿編號192
文獻編號25-1 文獻編號25-2 文獻編號25-3
...
...
文獻編號57-1 文獻編號57-2 文獻編號57-3
列表所呈現之文獻架構是 領域-主題-前沿-核心論文 具代表性的期刊文獻。
閱讀此類的資訊相信對我 國的研究生或剛接觸此領域的
文獻編號25-4 文獻編號25-5
...
文獻編號57-4 文獻編號57-5
...
研究人員,於建立該主題的知
識架構上有一定的幫助。本
地圖的另外一個目的,就
是協助我國的研究社群挑
選重要文獻。
初級階層式資訊之結果呈現
Ex: Research Front 45
A1 訊息傳遞機制(受體)之研究
編號 前沿關鍵字 專家解讀
人類及鼷鼠類 蛋白偶聯
1. Narita, M et al. (2006). Direct involvement of orexinergic systems in the activation of the mesolimbic dopamine pathway and related behaviors induced by morphine. J.
Neurosci. 26(2), 398-405.
2. Foord, SM et al. (2005). International Union of Pharmacology. XLVI. G protein- coupled receptor list. Pharmacol. Rev. 57(2), 279-288.
45 HUMAN-MOUSE G PROTEIN-COUPLED RECEPTOR REPERTOIRES; G PROTEIN-COUPLED RECEPTOR LIST;
G-PROTEIN-COUPLED RECEPTORS; ORPHAN G- PROTEIN COUPLED RECEPTORS; HUMAN GENOME FORM FIVE MAIN FAMILIES
人類及鼷鼠類G-蛋白偶聯 受體研究-利用GPCRs五大 家族類別間交織反應及訊 息傳遞調控細胞功能之研 究
3. Fredriksson, R and Schioth, HB (2005). The repertoire of G-protein-coupled receptors in fully sequenced genomes. Mol. Pharmacol. 67(5), 1414-1425.
4. Wise, A et al. (2004). The identification of ligands at orphan G-protein coupled receptors. Annu. Rev. Pharmacol. Toxicol. 44, 43-66.
5. Fredriksson, R et al. (2003). The G-protein-coupled receptors in the human genome form five main families. Phylogenetic analysis, paralogon groups, and fingerprints.
Mol. Pharmacol. 63(6), 1256-1272.
6. Vassilatis, DK et al. (2003). The G protein-coupled receptor repertoires of human and mouse. Proc. Natl. Acad. Sci. U. S. A. 100(8), 4903-4908.
32
完整服務資訊應包含之訊息
一、領域趨勢
二、跨領域發展動向 三、研究議題分群結果 四、研究人力分佈
五、結合GRB成果展現之研究資源配置
GRB:政府研究資訊系統
針對決策者需求所提供之資訊
•結合GRB成果展現之研究資源配置
•利用前端結果所完成的分群及關鍵字,在GRB系統 中尋找我國相關聯的研發計畫。確認我國在該領 域各研究主題的資源分配以及計畫比重。所完成 之資訊可以作為決策者在領域規劃或資源分配的 參考資訊。
毒性 12計畫
12億 基因
22計畫 3億
其他 21計畫
12億
生物資訊 25計畫
7.5億
生物晶片 19計畫
1.2億 3億
34
製作流程
專 家 解
研究生
ESI
資料下載 研究前沿 中文化及 初步解讀 解 讀 關鍵字萃取 研究前沿分群
G研究生
學研界
研究前沿 資料探勘 分群分析
GRB資源盤點
決策單位
依需求提供不同的資訊
使用者 內容提供
研究生 應以 級 一 領域趨勢 碩博士研究生(應以博士級
為主)
一.領域趨勢
二.研究議題分群結果 三.文獻列表
研究人員(博士後…等研究 人員)
一.領域趨勢 二.跨領域發展動向 三.研究議題分群結果 四.文獻列表
四.文獻列表 決策單位(國科會、領域召
集人等)
一.領域趨勢 二.跨領域發展動向 三.研究議題分群結果 四.研究人力分佈
五.結合GRB成果展現之研究資源配置
36