• 沒有找到結果。

對臺大圖書館發展資料庋用服務之期待與需求

第四章 研究結果分析

第五節 對臺大圖書館發展資料庋用服務之期待與需求

由於大部份受訪者並無公開資料的經驗,臺大目前亦無資料庋用相關之服務 或平台,因此本研究在訪談過程中,先假設臺大圖書館未來會發展資料庋用服務,

並以此為基礎和受訪者們進行討論,希望瞭解受訪者對資料庋用服務的期待和需 求,並將之整理成對臺大圖書館的期望以及對資料庋用平台的需求兩個面向。

一、對臺大圖書館的期望

(一)、清楚界定資料收錄之範圍

本研究中有 4 位受訪者對資料收錄之範圍提出疑問或建議,有些是認為並非 所有資料都有保存的價值,有些則是認為資料處理之程度和品質需要考慮,才能 讓收錄的資料能被使用。受訪者 D 表示自己使用的部份資料是自行架設感測器 或觀測站而得,通常是在氣象局或水利署等單位沒有架觀測站的地方,且為了特

 

75 

定的計畫或研究來進行資料的收集,所以往往是小範圍且限於特定某段時間的片 段資料,故是否會有其他人需要這樣的資料,或是單純因為觀測資料的不可重製 性而保存,諸如此類資料收錄範圍和基準的問題,是需要首先釐清的。

「我有架一些 sensor 去偵測某些地方的雨量,這些都是中央氣象局沒 有設置觀測站的地方……但是它資料的時間是片段的……就是研究 計畫結束,它就結束了。」 (D:16-20)

受訪者 G 認為不同的資料所需的處理和校正不同,而原始資料和處理過的 資料何者較有價值,則依資料特性或使用者而有所不同,因此每筆資料的收錄都 要詳加考慮。

「很多實驗室一出來的資料其實還不能用,需要經過一些修正和加工,

才會變成研究中能用的 row data。……那你們(圖書館)到底要收集哪一 塊的資料,是一開始最原始的嗎?還是經過一些初步處理的呢?……

最 原 始 的 數 據 有 很 多 校 正 要 去 做 , 所 以 要 真 正 的 專 家 才 有 辦 法 用,……一般使用者應該還是有處理過的數據比較有用,……但是不 同領域差異很大,有些人是要用最原始的數據,有些人是喜歡處理過 的,用起來比較方便。」 (G:60-72)

(二)、訓練具學科專業背景的人協助資料整理

本研究中有 3 位受訪者希望圖書館能培養專門的人才來協助資料的整合與 保存,若能具學科知識或參與在研究過程中則更佳。受訪者 K 認為實驗過程中 所使用的控制組是一種很適合公開的研究數據,因為研究對照的基準點本來就是 應該被人所知的,這樣不同研究單位的研究結果才能互相比較,互相瞭解對方的 研究結果是基於什麼樣的基準點而得;而且控制組只是一個基準,不會因為公開 而對研究有所影響。不過由於每次研究中所使用的控制組都不見得相同,不同研 究者、研究單位也都有自己的控制組,所以要能夠整理、歸納這些數據,需要同 時具有食品科學和圖書資訊背景之專業人士,參與在整個研究過程中,才能對資 料的本質和如何整理有深入了解,進而真正讓這些資料顯出價值。

「像我想到,最需要互通的是 control group,是基準的那一組,...

這才是實驗室之間能夠互相比較的基準。……圖書館如果能蒐集到很

76 

多這種 control group 的資料,那將來就很容易知道和比較說這個研究 領域中,大家都用什麼變項,這個變項的來源是什麼,這對我們做實 驗的人來講,就可以知道很多訊息,像是彼此誤差的來源等等。 (K:

9-13)

「我覺得你們的館員或是圖資系學生的訓練,就可以開始來跟我們搭 配,瞭解研究室中有哪些資料,從頭開始釐清,慢慢去建立一個 model 出來,……建立跨領域的合作,彼此瞭解,這樣這個服務才會可行。」

(K:39-41)

(三)、政策和經費之支援

本研究中有 3 位受訪者認為明確的政策、規範,以及實質上的經費支援才是 現階段最需要的,也是推動資料庋用最快速、最有效的方法。受訪者 D 提到自 己曾經在中央研究院協助建製台灣生物多樣性資訊入口網,系統建製之初需要聯 絡該領域的研究者們,請他們提供自己所擁有的資料,讓系統建製人員匯整並上 傳,研究者們也都很樂意協助;不過一旦請他們開始整理相關資料並交出時,大 多數人卻表示研究都來不及做了,哪有多的時間去整理以前的資料,造成效率低 落,系統中的資料量也不足。系統建製團隊因此和出資單位進行協調,將該計畫 的部份經費撥給研究者們,讓他們有義務整理並交出手中的研究資料給該系統。

「我們那時候就是開放計畫申請,就是問那些老師願不願意,就是老 師手上的資料要不要趁這個機會,等於就是我們付老師錢,然後老師 就是趁機整理整理,然後給我們上傳。」 (D:94-95)

受訪者 K 認為由政府出資或委託的研究,其產出的資料應視為公共財,研 究者們其實是有義務要好好整理這些資料,並讓這些資料成為未來研究的基礎。

然而目前的學術環境中缺乏對資料的重視,很多資料都是由研究者自行保管,就 算有繳交給出資或委託的政府單位,政府單位也不見得會重視這些資料,或是讓 這些資料能被其中的相關研究使用,造成資源的浪費,很多有價值的資料也因此 被埋沒。

「我認為很公平的一件事,既然是國家經費支持的(研究),也不應該 想什麼回饋或不回饋的,……這應該是一個對等的,拿了國家的錢,

 

77 

這些資料就放到合理的資料庫,讓別人能應用。……那如果你資料放 不出來,這資料的品質是你自己就沒信心嘛,不能讓人檢驗,……資 料的分享代表其實可以讓人檢驗的。……後來很多美國的期刊都要求 你把資料提供出來,讓其他讀者是可以去檢驗的,……這樣的要求受 到大家的認同,……好的東西本來就會有人用,那用你的資料就會引 用你阿,等於你的研究就能不斷被引用,就是你的 credit 了。」 (K:

25-33)

二、對資料庋用平台的需求

(一)、提供簡單易懂的介面,節省上傳時間

由於國內目前並無資料庋用系統或介面能讓受訪者參考,因此對介面提出實 際建議的受訪者較少;在介面設計上,有 2 位受訪者希望能以簡單易懂為原則,

避免花費很多時間去學習,造成負擔。受訪者 F 認為如果真的要發展資料庋用,

並鼓勵研究者們自行上傳資料,則介面一定要簡單易懂並容易使用,因為研究者 們並不會想為了上傳或分享資料而多花時間去整理自己的研究資料,如果還要花 時間去熟悉介面和系統的話,意願就更低了,因此最好是將介面和上傳的流程都 能簡化,讓研究者很容易就能分批上傳,不需要花太多精力去整理資料。

「這樣的平台我很歡迎,但讓我有點疑慮的是我到底要花多少時間搬 東西上去,然後好不好搬,……舉例來說,學校常叫我們填一些東西,

有時候欄位很多,真的很頭痛。……另外像是大氣和其他領域的資料 怎麼整合,有沒有一個全部都適用的格式在,這格式好懂嗎?……對 我來說,關鍵點是 upload 越容易、越簡單,當然越容易達成。」 (F:

100-106)

(二)、讓資料提供者瞭解資料使用的情況,並建立有彈性的授權機制 部份受訪者希望知道自己的資料被什麼人使用,或是下載次數等資料的使用 情況,因此認為資料庋用平台應提供一些相關的統計數據,對他們而言也是一種 回饋,本研究中有 3 位受訪者提出希望能瞭解資料使用狀況之需求。

「定期的告訴我有多少人下載資料,回報一下使用狀況等等,……或 許將來可以設計下載次數多的,就給他多一點(儲存)空間,當作回

78 

饋;……甚至是在教學研究或是升等上面有些加分,有一點實質的鼓 勵,……這樣才會有誘因。」 (J:146-150)

受訪者 F 表示資料庋用平台應該要有兼具彈性和自動化的授權機制,最好是 讓想要下載資料的使用者先表明自己的身份和資料的用途後,透過系統自動發送 授權申請至資料的提供者端,讓資料提供者勾選是否授權,系統便能判斷能否開 放給該使用者下載資料。同時兼具自動化和彈性的授權機制,可以讓研究者自行 判斷是否讓對方使用資料,又不用花太多時間回覆電子郵件,省下許多麻煩。

「NASA 的全球觀測計畫……這個系統的好處是每個觀測點是誰負責 都有公開,這個觀測點的 PI 是誰,e-mail 是什麼都看得到,……資料 是可以 download 的,但你點下去時它會跳出一個視窗說,這資料是 誰的,應該先徵詢同意再 download 或使用。……又或是比如說有其 他研究者或學生想要資料,只要簡單描述一下是什麼系的或要做什麼 研究,再透過這系統讓我看到,……或是跳出一個選項來,我只要回 答好或不好,勾選之後,對方就能開始下載,……對我來說,等於是 多一層保護。」 (F:109-119)

(三)、以政府機關所擁有的資料作為資料整合的基礎

雖然只有 2 位受訪者建議在資料的收錄方面,以政府的資料為基礎,但在本 研究中,使用政府機關資料的受訪者多達 7 位,因此若是將政府資料整理的更好,

應能對研究者有所幫助。

受訪者 G 認為目前的學術環境中並無資料公開的習慣,因此若要針對每個 研究者都去問有沒有意願或資料能夠提供其實很困難,僅有事倍功半之效,所以 應該先由目前擁有最多資料之處下手,也就是從政府單位開始進行初步的接觸和 合作,例如透過提供儲存空間、專業人力、協助資料的規劃和管理等服務,取得 和政府機關合作之契機,將其所擁有的資料備份到台大。未來有人需要資料時,

受訪者 G 認為目前的學術環境中並無資料公開的習慣,因此若要針對每個 研究者都去問有沒有意願或資料能夠提供其實很困難,僅有事倍功半之效,所以 應該先由目前擁有最多資料之處下手,也就是從政府單位開始進行初步的接觸和 合作,例如透過提供儲存空間、專業人力、協助資料的規劃和管理等服務,取得 和政府機關合作之契機,將其所擁有的資料備份到台大。未來有人需要資料時,