第四章 資料分析與結果
第二節 描述性統計分析
本節進行問卷填答的分析,針對問卷填答情形、填答者的基本資料及資料使 用、資料管理與資料分享之認知與行為進行分析,共分為五個部分,包含問卷各 題項填答情形、學者基本資料、學者研究資料實踐的行為、學者研究資料儲存與 管理認知與行為、學者研究資料分享與再用認知與行為。
一、問卷各題項填答情形
本研究問卷無設定必填答之題目,即每項題目可自由選擇是否填答,而每題 之填答情形如表 4-3。
表 4-3 問卷各題項填答情形
表格 表格名稱 選項
(僅列出選項編號) 填答數
4-3 受訪者之年齡年齡統計分析 1079
4-4 受訪者之職稱統計分析 1069
4-5 受訪者之所屬學科統計分析 1059
4-6 受訪者之從事研究的時間統 計分析
1079
4-7 受訪者之研究活動比例統計 分析
1079
4-8 使用之研究資料來源
(1) 954 (2) 979 (3) 921 (4) 983 4-9 研究專案中使用之研究資料
的類型
1062
4-10 研究專案中產出之研究資料 的類型
1046
4-11
研究資料儲存與管理認知 (1) 1022
(2) 1021 (3) 1000 (4) 992 (5) 950
4-12 研究資料儲存位置 1070
54
55
56
二、學者基本資料分析
本研究問卷第一部分為基本資料,了解學者的年齡、職稱、所屬學科、從事 研究活動、在工作中花在與研究有關之活動比例,整理描述如下:
(一) 年齡
本研究回收的樣本的年齡大部分集中在 36-65 歲之間,其中最多為 46 歲至 55 歲年齡層共有 421 位(39.0%),次多為 36 歲至 45 歲共有 314 位(29.1%),
而本研究問卷調查結果沒有25 歲以下的學者,見表 4-4。
表 4-4 受訪者之年齡統計分析
年齡 樣本數 有效樣本百分比 25 歲以下 0 0%
26-35 歲 47 4.4%
36-45 歲 314 29.1%
46-55 歲
421 39.0%56-65 歲 278 25.8%
66 歲以上 19 1.8%
(二) 職稱
本研究問卷回收樣本中,近半數為教授/研究員(45.5%),共 454 位,副教 授/副研究員及助理教授/助研究員人數分別為 347 位(32.5%)及 253 位(23.7%), 人數最少的為講師,僅有3 位(0.3%),見表 4-5。
表 4-5 受訪者之職稱統計分析
職稱 樣本數 有效樣本百分比
教授/研究員
454 42.5%
副教授/副研究員 347 32.5%
助理教授/助研究員 253 23.7%
博士後研究 12 1.1%
講師 3 0.3%
57
(三) 所屬學科
本研究問卷回收樣本中,填答問卷之學者所屬學科以社會科學占最多數,計 有236 位(22.3%),其中以教育學的學者最多,計有55 位;其次為生物科學 234 位(22.1%),其中以生化及藥理醫學學者最多(31 位);其餘依次為工程技術、
人文學、自然科學永續發展、管理學、科學教育,見表 4-6。
表 4-6 受訪者之所屬學科統計分析
所屬學科 樣本數 有效樣本百分比
社會科學
236 22.3%
生物科學 234 22.1%
工程技術 209 19.7%
人文學 157 14.8%
自然科學與永續發展 134 12.7%
管理學 60 5.7%
科學教育 29 2.7%
(四) 從事研究活動
本研究問卷回收之有效樣本中,填答問卷之學者之從事研究活動以11 至 15 年占最多數,計有236 位(21.9%),其次為16 至 20 年,計有 192 位(17.8%), 少部分學者從事研究活動在5 年以下(5.0%),見表 4-7。
表 4-7 受訪者之從事研究活動統計分析
從事研究活動 樣本數 有效樣本百分比
5 年以下 54 5.0%
6-10 年 152 14.1%
11-15 年 236 21.9%
16-20 年 192 17.8%
21-25 年 191 17.7%
26-30 年 145 13.4%
30 年以上 109 10.1%
58
(五) 研究活動比例之統計分析
本研究調查了學者在工作時間中花在與研究有關之活動的比例,問卷回收之 有效樣本中,以研究活動比例41%至 60%占最多數,共 384 位(35.6%),其次為 21%至 40%,計有 324 位(30.0%),而花在與研究有關活動20%以下學者較少,
僅61 位(5.7%),見表 4-8。
表 4-8 受訪者之研究活動比例統計分析
研究活動的比例 樣本數 有效樣本百分比
20%以下 61 5.7%
21%-40% 324 30.0%
41%-60% 384 35.6%
61%-80% 216 20.0%
81%-100% 94 8.7%
三、學者研究資料實踐行為
本研究調查學者研究資料實踐的行為,包含使用研究資料來源、在研究專案 中使用研究資料類型及產出之研究資料類型,整理描述如下:
(一) 使用之研究資料來源
本研究調查問卷填答之學者研究資料來源,分為四個來源進行分析:(1) 創 建新資料以「經常」為最多數,計有335 名(35.1%);(2) 來自自己參與的研究 團隊或小組,以「經常」為最多數,計有 402(41.1%);(3) 透過自己的學術傳 播網絡(或個人/專業關係)以「偶爾」為最多數,計有 264 位(28.7%);(4) 從 研究資料儲存庫進行搜尋以「經常」為最多數,計有354 位(36.0%),見表 4-9。
此外,研究儲存庫來源包含了 arXiv、中央研究院 SRDA、NCBI、GitHub、
Benchmark Datasets、基因資料庫、全民健康保險資料庫(NHIDB)、政府開放資 料等。
整體而言,以各來源的平均值進行比較,填答問卷之學者最常創建新資料
(平均值=3.74)。
59
60
使用之研究資料的類型
(複選題)
樣本數 觀察值百分比
生物調查 72 6.8%
歷程紀錄 72 6.8%
遙測非生物資料 50 4.7%
非生物調查 42 4.0%
遙測生物資料 7 0.7%
而在學者研究專案中產出之研究資料類型實驗亦為最多數,共 538 位
(51.4%),其次為社會科學調查,計有287 位(27.4%),其餘依次為訪談、電腦 模擬、文本、觀察、與研究主題相關的電腦程式、書目或引文資料、資料模型、
生物調查、歷程紀錄、非生物調查、遙測非生物資料、遙測生物資料,見表 4-11。
其他產出之研究資料類型包含音樂錄音、影片、圖片、照片、神經影像(neuroimage)
等。
表 4-11 產出研究資料類型 產出之研究資料的類型
(複選題)
樣本數 觀察值百分比
實驗
538 51.4%
社會科學調查 287 27.4%
訪談 270 25.8%
電腦模擬 263 25.1%
觀察 241 23.0%
文本 239 22.8%
與研究主題相關的電腦程式 203 19.4%
書目或引文資料 193 18.5%
資料模型 187 17.9%
生物調查 59 5.6%
歷程紀錄 48 4.6%
非生物調查 26 2.5%
遙測非生物資料 22 2.1%
遙測生物資料 8 0.8%
61
62
(二) 研究資料儲存
研究資料儲存調查學者在研究中產生之研究資料儲存位置以及認為供長期 保存與取用之研究資料放置位置。
問卷分析顯示學者將研究資料儲存於自己的儲存裝置中比例最高,共 1,030 位(96.3%),其餘依次為雲端硬碟、服務機構所建置的研究資料儲存庫、學科領 域常用的研究資料儲存庫,如表 4-13。其他儲存位置包含衛生福利部所建置的 研究資料儲存庫、主要資助機構所建置或支持的研究資料儲存庫、實驗室自行建 置的研究資料儲存庫、實驗紀錄本等。
表 4-13 研究資料儲存位置 研究資料儲存位置
(複選題) 樣本數 觀察值百分比
自己的儲存裝置中
1030 96.3%
雲端硬碟 600 56.1%
服務機構所建置的
研究資料儲存庫 219 20.5%
學科領域常用的研
究資料儲存庫 153 14.3%
而對於應將研究資料儲存於何處供長期保存與取用的問卷分析顯示儲存於 自己的儲存裝置中比例最高,計有841 位(78.7%),其餘依次為雲端硬碟、服務 機構所建置的研究資料儲存庫、研究專案之主要資助機構所建置或支持的研究資 料儲存庫、學科領域常用的研究資料儲存庫,如表 4-14。亦有學者表示可將資料 儲存於實驗室自行建置的研究資料庫、個人研究網站等、實驗記錄簿、影印出來 等。
由上述兩項問卷分析可發現學者將研究資料儲存於自己的儲存裝置比例最 高,但對於供長期保存與取用的存放位置比例較為分散,以「服務機構所建置的 研究資料儲存庫」為例,問卷分析顯示有將研究資料儲存於此的學者有 219 位
(20.5%),但有 497 位(46.5%)認為可將資料放至於此供長期保存與取用。
63
表 4-14 資料供長期保存與取用儲存位置 資料供長期保存與取
用儲存位置(複選題) 樣本數 觀察值百分比 自己的儲存裝置中
841 78.7%
雲端硬碟 670 62.7%
服務機構所建置或支
持的研究資料儲存庫 497 46.5%
學科領域常用的研究
資料儲存庫 372 34.8%
研究專案之主要資助 機構所建置或支持的 研究資料儲存庫
362 33.9%
(三) 研究資料之詮釋資料訂定
本研究問卷詢問學者使否會對研究資料訂定額外的資訊,即詮釋資料,此題 有效樣本為 803 位,有訂定詮釋資料人數為 333 位(有效百分比為 41.5%),沒 有訂定詮釋資料的人數為 470 位(有效百分比為 58.5%),顯示超過半數的學者 沒有訂定詮釋資料。
而詮釋資料類型分為四類進行訪問:(1) 資料資訊,如創建者、創建日期、
檔案名稱、取用條件及限制等;(2) 檢索資訊,如創建者、資助機構、研究專案 名稱、研究專案ID、關鍵字等;(3) 技術資訊,如檔案格式、檔案大小、使用資 料所需的軟體/硬體等;(4) 資料檔案的描述,如檔案/資料的結構、欄位標籤/描 述、應用規則等。在有效樣本中,訂定管理資訊的比較最高,計有230 位(70.1%), 其次為資料檔案的描述,計有223 位(68.0%),其餘依次為檢索資訊、技術資訊,
如表 4-15。
表 4-15 詮釋資料類型 詮釋資料類型
(複選題)
樣本數 觀察值百分比
管理資訊
230 70.1%
資料檔案的描述 223 68.0%
檢索資訊 196 59.8%
技術資訊 124 37.8%
64
65
(五) 研究資料管理相關培訓
研究資料管理相關培訓訪問學者是否有接受過研究資料管理相關培訓、接受 研究資料管理培訓的意願以及需要的服務支援或建議。
問卷結果顯示,沒有接受過研究資料管理相關培訓的比例最高,共 741 位
(69.6%),其次為研究資料引註格式,計有212 位(19.9%),其餘依次為研究資 料管理計畫、詮釋資料、一致的檔案命名、研究資料集的版本控制,如表 4-17。
表 4-17 接受研究資料管理相關培訓 接受研究資料管理相關
培訓(複選題)
樣本數 觀察值百分比
無
741 69.6%
研究資料引註格式 212 19.9%
研究資料管理計畫 142 13.3%
詮釋資料 134 12.6%
一致的檔案命名 81 7.6%
研究資料集的版本控制 76 7.1%
而願意接受研究資料管理相關培訓的結果顯示,研究資料管理計畫最多數,
計有715 位(83.7%),其次為詮釋資料,計有375 位(43.9%),其餘依次為研究 資料集的版本控制、一致的檔案命名、研究資料引註格式,如表 4-18。學者提出 對於培訓的建議為提供簡單易懂的教學影片,不過有部分學者表示不需要接受相 關培訓,認為可以自學、資料無需特別管理、不想花費多餘時間等。
表 4-18 願意接受研究資料管理相關培訓 願意接受研究資料管理
相關培訓(複選題)
樣本數 觀察值百分比
研究資料管理計畫
715 83.7%
詮釋資料 375 43.9%
研究資料集的版本控制 340 39.8%
一致的檔案命名 316 37.0%
研究資料引註格式 290 34.0%
66
對於研究資料管理相關的需求及服務支援則依次為研究資料管理計畫
(62.8%)、研究資料儲存問題(46.7%)、技術協助(39.0%)、一般資料管理問題
(35.7%)、法律問題(30.6%)、研究資料倫理問題(30.4%)、出版及引用(28.0%)、 技術問題(26.0%),如表 4-19。另外也有學者提到需要資金支援、適當平台、開 放授權(Open license)的介紹以及效力等。
(35.7%)、法律問題(30.6%)、研究資料倫理問題(30.4%)、出版及引用(28.0%)、 技術問題(26.0%),如表 4-19。另外也有學者提到需要資金支援、適當平台、開 放授權(Open license)的介紹以及效力等。