• 沒有找到結果。

伍、資料計算與大數據意涵

2. 資料的可操作性(operability)

數位資料除了在保存、傳輸、取用等面向上打破了傳統的時空限制之

所不包的語料庫,都可以被設定為操作對象。各類表單紀錄的結構化資料 則是提供了便捷的資料操作框架,讓資料使用更容易擴大。認識並理解各 種數位資料操作概念與技術,有助於人文社會研究數位取徑的開發。

3. 資料的可連結性(linkability)

隨著人類資料的大幅成長,各種資料之間也將產生在主題、對象或概 念上的連結,而能提供更完整的意義與樣貌。資料之間可能存在顯而易見 的關聯,也可能隱藏著微妙的關聯,無論是主觀的認定,或是客觀的檢驗,

都可以透過資料的計算分析過程,進行主導性的建立或是探索性的辨識,

而取得資訊的連結與整合,協助研究人員建構出更完整的脈絡資訊與知識 體系。

4. 資料的可呈現性(representability)

資料的數位性質在各式計算方法的操作下,可以產生高度彈性的資料 觀察能力,在各種分析工具的參數設定下,資料的維度與面向可以被輕易 的選擇、調控與投射,而可以多視角的呈現資料內容的豐富樣貌。當資料 量遠超過一般人有限的資料消化與認知能力時,資料的彈性呈現能力,可 以提供宏觀的全貌描繪,快速取得統整性資訊或浮現出顯著資訊,也可以 聚焦到特定對象或區塊,進行細微的爬梳檢視。另外,資料視覺化技術更 以多元圖像呈現資訊意涵,展現出更有力的資訊傳遞效果。

5. 資料的可檢驗性(inspectability)

資料的數位型態讓資料便於公布流通,可以讓不同研究團隊之間就相 同的議題、相同的方法,對各自的實作分析結果,相互或前後驗證;也可 以用不同的方法,比較結果的差異,測試方法的優劣;或是探討不同的議 題,開發不同的發現;或是累積整合為更大的研究成果。資料就如同實驗 室中的材料,可以反覆操作測試,實驗過程與結果都可以被複製檢驗,而 提升研究成果的客觀性與正確性。

6. 資料的高價值性(value) 取、資料計算時間等。Gandomi & Haider(2015)認為一般是以超過 1 tera-bytes(TB),也就是 1024 giga-bytes(GB)的資料量為大數據的門檻。

若以一般相機或手機拍攝大約為 2 mega-bytes(MB)的照片為基準,則必 須累計超過 524,288 張以上的照片資料量,才進入大數據的技術門檻。

Beaver et al.(2010)的研究指出 Facebook 儲存的照片資料規模已經達到 20 peta-bytes(PB)(20 x 1024 TB),而且每星期使用者上傳的照片資料 量約為 60 TB。因此,所謂大數據資料規模的技術門檻,並非絕對客觀不

社會領域的人工蒐集採樣方法範疇,其資料量也遠超過人腦的認知能力與

相關文件