第四章 研究結果分析
第三節 研究資料之分享
63
第三節 研究資料之分享
資料庋用的目標之一是資料的再利用,要達成此一目標則必須透過資料的分 享或公開,讓資料擁有者以外的人知道該資料的存在,或是取用所需的資料;故 受訪者對資料分享的意願和經驗,皆會對資料庋用的推廣有所影響。根據訪談結 果,大部份的受訪者對研究資料分享抱持正面的態度,也表示有分享之經驗,而 影響分享意願的因素則可歸納如下:
一、分享研究資料之對象以熟識者為主
大部份受訪者對於資料之分享是建立在一定程度的信任和瞭解的基礎上,對 於完全不認識的人則持較為保留的態度;有 10 位受訪者表示若是認識的人、同 一研究團隊或具名望的其他研究者向他們索取資料,他們較願意分享,但也有兩 位受訪者仍然認為有更多其他需要考慮的問題,因此持保留態度。若是非學術界 的其他人士,例如商業界,則全部受訪者皆表示較不願意分享他們的資料。
受訪者 A 近年參與過一個大型的考古學調查研究,由於範圍大且研究進行 的時間長,因此常會有一些不同領域的研究團隊以短期參與的方式,加入此調查 研究,因此受訪者 A 對資料分享抱持開放態度,認為曾經參與的團隊都可以獲 得他們所需的資料,也樂於彼此分享,但同時亦指出這種情況對考古學界來說並 非慣例。
「我們那時候其實採取了一個很 open 的態度,就是各國的人或團隊 或學生,只要願意參與,我們就讓他們來,……所以參與者超過 10 個不同國家,單位的話更多,20、30 個左右不同單位或團隊都來,……
地表調查大部份資料是比較開放的,……很多學生來參與,我們也都 讓他們能拿資料去寫論文或發表。」 (A:24-35)
「我自己去用別人 row data 的情況就很少,若是被處理過的資料就更 不會用,……考古學的東西有很多個人的思考脈絡在,別人的資料不 見得有用,每個人有自己的解釋。……這個圈子裡也有些人對自己的
64
資料很保密,所以不太會給別人。」(A:102-105)
受訪者 H 表示若有其他研究者對研究資料有興趣,則可以和對方進行討論 或意見的交換,但不一定會願意把原始的數據直接讓對方使用。
「 如 果 是 發 表 過 的 東 西 那 沒 關 係 , 別 人 來 要 的 話 我 們 是 樂 意 分 享,……因為譬如說期刊都會要求附上的圖有一定的解析度,所以(對 方)應該也不會再想要更原始的圖,……所以一般來說,我們的分享不 是資料本身,而是背後的解讀、意義或是一些想法阿,……可以討論 一些對研究的看法。」 (H:26-29)
受訪者 I 表示分享資料給自己不熟識的人帶有一定程度的風險,因為被分享 者或許會將資料再分享給第三者,而第三者不一定知道資料真正的源頭,因此就 算註明了資料出處,也是不正確的出處。
「我後來就覺得不是很好,……因為這資料我給你,但又有別人要用,
那這人是跟你拿,這樣第三者就不知道其實資料是我給的。……所以 我如果要給,就會講清楚是只給你用,不是讓你再給別人的,……所 以還是要熟悉的人比較有可能給吧。」 (I:51-53)
若是不屬於學術界或政府單位,受訪者則表示不會將資料給對方。受訪者 F 都認為資料分享應限於學術研究,受訪者 E 則指出資料不應用於商業用途。
「資料的話主要還是針對研究社群,……我覺得國內目前的普遍想法 是不能去用在商業用途。」 (E:100)
「不是學術界的人如果來問我,對資料有興趣,我會說 no,因為你不 是學術圈的人,而且我跟你不熟,所以還是有防備之心,……不知道 你的動機是什麼,而且我對你沒有約束力,不知道你會把資料拿去做 什麼」 (F:79)
二、分享研究資料之時間點在研究發表後
除了受訪者 L 之外的 11 位受訪者皆認為分享研究資料的時間點應在研究完 成並發表之後,主要是考慮到對自身學術研究進行的影響。受訪者 F 認為所分享 的資料必須是在自己的研究已經完成之後,研究仍在進行中或認為這些資料還有
65
更多的研究價值時,並不想將其分享給其他人。
「學者間有跨國性的串聯,申請一個特別實驗的觀測計畫,……例如 針對東沙島附近有非常密集的觀測和調查,……可能是一個月,create 出一筆很特殊的資料,……我們的認定是說好不容易得到的資料怎麼 能隨便給別人呢。……所以我們在形成這樣的團隊時,大家會互相約 定,團隊之內是彼此信任的,會分享資料,但團隊之外,頂多就是說 明計畫內容,……為了保護大家投資的心血,所以會有默契,讓資料 有 3 到 5 年的保護期,這段時間資料不能給別人,……大家要 sign 一 個文件,要參與的話就要同意這個協議。」 (F:10-19)
受訪者 L 認為在分子生物學領域中,將蛋白質或基因之結構在資料庫中註 冊後就等於是公開分享其研究成果,而且要越快越好,因此不一定會等到研究完 成,而是會搶先上傳部份成果,但並不代表研究者們會毫無保留的分享其正在進 行中的研究,還是會視情況而有所保留。
「希望有快速的取得和適當的保護,……這是人性啦,還是會想有點 保留,……國外那些 data center 是要花很多錢去維護的,……但最後 的結果是好的,因為讓資料是彼此競爭多於保護,……不過對我們個 人而言,我們還是會希望有點保護,至少在某個期限之內。」 (L:
42-45)
三、資料處理的程度會影響分享意願
資料產生後,可能需要先經過篩選和校正後才能使用,因此受訪者認為資料 被處理的程度和資料的品質都會影響他們分享的意願,也是他們不願意分享給不 認識的研究者的原因之一;尤其是自行產出觀察型資料和實驗型資料的 8 位受訪 者,認為資料的品質對他們而言很重要,不希望因為分享品質不佳的資料而受到 其他研究者質疑。受訪者 F 認為完全不經處理的資料其品質是尚待檢驗的,因此 資料若要分享,一定要跟對方說清楚這些資料目前的處理狀況。
「資料收回來要考慮一些過程中雜訊、誤差的問題,……先想到的問 題是這資料的品質我安不安心,在資料的品質還沒有保證的時候,給 人家也只是害人家,……所以拿到資料後,都要花一段時間去確認資
66
料的品質,……不然資料錯誤的話,不管是自己用或別人用,都很糟 糕。」 ( F:20-23)
「以作科學的人來說,我資料要給你的話,就要告訴你這資料處理到 什麼程度,或是根本沒處理,……因為是你要拿去用的,所以自己要 注意一點。」 ( F:62)
受訪者 J 則認為最原始的資料不一定最有價值,很可能其他人根本不知該如 何使用,反而是將資料進行初步的整理或解讀之後,這些資料才會更容易被他人 所理解和使用。
「比如說做國土規劃的人,他會想要汙染資料,因為這對國土的規劃 是很重要的,……但他要用的資料其實不能太 row data,因為在專業 上他也無法去作判斷,……這樣的人可能會來找我,我知道他們的需 求後,我可以很快的提供給他一些真正有用的資料,……不一定是要 像學術研究的成果那樣精細的資料,……因為(汙染)不是他的專業,
而且資料太細或量很多,所以 row data 對他不見得真的有幫助。」 (J:
55-61)
受訪者 I 的研究資料來自於台灣附近海域中感測器所錄下的聲音,原始檔案 可能錄製了很常時間,檔案很大而且真正有意義的聲音不一定多,因此一定要經 過程式的篩選才能截取出有用的片段,因此受訪者 I 認為分享原始檔不一定有意 義或價值。
「其實氣象局有幾個 sensor 是放在西海岸那邊,會錄下很多聲音,……
但我覺得應該不會有人想聽原本的錄音吧,錄很長的話,會很多雜訊 在裡面阿,可能也有很多空白或背景噪音,……其他人來用的話,或 許聽不出什麼重點吧,我們自己用的資料也是需要很多過濾或處理,
甚至寫程式去跑等等。」 (I:42-44)
四、研究團隊的態度將決定資料分享的對象或程度
參與過研究計畫的受訪者皆表示資料的分享與否並非一人能決定,有 7 位受 訪者有相關經驗,尤其是分享的對象和分享到什麼程度等細節,常要經過討論才 能有共同的決定。受訪者 A 參與在大型的考古調查計畫當中,有好幾個計畫主
67
持人,因此即使本身對資料的分享抱持開放的態度,仍然需要和其他計畫主持人 討論或告知,並非個人可以決定之事。
「考古團隊中的同學是美國人,……後來他去哈佛大學教書,……再 找了很多其他人,北大的老師、成都考古所、我們以前的指導老師……,
我們一群人從 2004 年到去年,在成都平原進行了很長時間的調 查。……後來就發現一個很大的問題,因為我們單計畫主持人就 6、7 個單位,內部的資料分享就很辛苦。……基本上團隊內都很開放,如 果是外面的人來要資料,那就會問一下其他人,...就算是禮貌性的 也要告知一下。」 (A:21-33)
五、資料的所有權造成無法分享
部份受訪者認為資料是否分享給別人並非他們能夠決定,而是應該由出資或 委託的單位來判斷,尤其是使用政府機關之資料和接受政府委託計畫的 7 位受訪 者,皆認為分享應和資料來源或出資單位討論,甚至是由這些單位來決定。受訪 者 B 就表示若有其他研究者向他們索取資料,則他們會請對方直接和出資或委 託單位聯絡並取得同意,或是請他們直接向擁有該資料的單位索取。
「我們是受委託者,職訓局是委託者,……如果在契約的內容有說要 保守相關的機密,當然在資料的使用上會很小心,……其他人要來索 取這個資料的話,就請他直接去問委託單位,反正我最後會把資料都 給委託單位,委託單位同意的話,如果在資料的使用上出了什麼問題,
「我們是受委託者,職訓局是委託者,……如果在契約的內容有說要 保守相關的機密,當然在資料的使用上會很小心,……其他人要來索 取這個資料的話,就請他直接去問委託單位,反正我最後會把資料都 給委託單位,委託單位同意的話,如果在資料的使用上出了什麼問題,