第三章 研究設計
第三節 資料處理
本研究以臺灣音樂群像資料庫人物為標的,其中最早的音樂家從日治時期的 張福興為始,日治時期的音樂家所接受的音樂基礎訓練及學習範疇多以西方古典 音樂為依歸,從此資料庫中呈現,1934 年發起的「鄉土訪問巡迴音樂會」,由東 京臺灣同鄉會推動當時留日的臺灣音樂家,組成鄉土訪問團在臺灣各地進行巡迴 演出,臺灣音樂的發展就此萌芽,歷經第一代留日音樂家、穿插隨著國民政府遷 臺之大陸音樂家,共同培育出在臺灣接受音樂教育的第二代音樂家,在此之後音 樂種子逐漸開花結果,許多今日的音樂院校、音樂展演樂團和協會組織等,皆仰 賴前幾代音樂人物所奠定之基礎。因此,透過篩選臺灣音樂群像資料庫的人物資 料,將臺灣音樂史篳路藍縷、開疆闢土的人物進行網絡分析。
此資料庫為典藏目的而產生的網站,其數位資料並非以數位人文研究為前提,
因此並無像CBDB、TBDB 等資料庫能直接將資料匯入社會網絡分析軟體,進而 提供視覺化之功能,而是必須從音樂家大事年表文本資料整理及轉換成社會網絡 分析的格式,透過文本探勘整理人物大事紀,羅列人物生平經歷的各種動詞屬性,
從中擷取出事件權威詞、建立權威詞屬性及規則,再利用權威詞篩選出有牽涉的 大事紀,最後將涉及權威詞的事件對應人物而產出矩陣,並將對應結果匯入社會 網絡分析軟體,以便進行下一階段分析。
一、 擷取權威詞
原資料庫生平大事紀表單如下(表3-3),記載年代、年齡及月份和發生的事 件內容,以許常惠大事紀表單1969 年的事件為例,左方兩欄為年代和事件發生 年齡,第三欄為詳細月份日期及事件內容資訊。
表3-3、原群像資料庫大事紀
將上述動詞置入大事紀查找動詞的左右字串,查找出其中組織及活動權威詞,
若大事紀有出現此動詞即以1 顯示(見表 3-6 前三列),若大事紀無此動詞則以0 顯示(見表3-6 第四列)。繼續以上述 1969 年第一列大事紀為例,綠色欄為查找 之動詞「任」,。左邊的值為「4 月 20 日,與第三」、右邊的值為「妻子何子莊 女士結婚」,左右兩邊詞彙皆無出現權威詞可擷取,逐列往下第二列大事紀,同 樣以動詞「任」進行查找,左邊的值為「8 月,升」、右邊的值為「國立藝專音 樂科教授」,擷取右邊的「國立藝專」為權威詞,並檢查該條大事紀尚有權威詞
「實踐家專」一併擷取,同樣方式擷取第三列左邊的值「中國現代音樂研究會」, 從人物M016 的 1969 年大事紀,陸續擷取「國立藝專」、「實踐家專」、「中國現 代音樂研究會」。
表3-6、將動詞的左右字串列出,1 有值 0 無值
二、 建立權威詞規則
根據胡歐蘭(1995)在圖書館學與資訊科學大辭典中對於權威檔的釋義,權 威詞的種類,依權威紀錄控制款目之性質,可分為名稱權威檔、主題權威檔和集 叢權威檔,其中名稱權威檔包括人名、團體名稱、地理名稱及畫一題名。參考其 團體及會議名稱建置方式,由於這類名稱常因各項外部因素變更而具別稱、簡稱、
舊名等名稱,需建立權威紀錄闡明其沿革與關係,以求標目一致。
製作參照表列舉權威詞之同意簡稱、別稱、舊名,呈現時空變遷演進過程的
對應出的人物,像是表3-7「國立臺灣交響樂團」,其前身歷經多次變革,過去名 稱從「臺灣省警備總司令部交響樂團」、「臺灣省教育廳交響樂團」、「臺灣省立交 響樂團」等。其餘簡稱和別稱僅列出名稱但之後不列入計算,像是「省交」,如 此能大幅減少權威詞數量,同一權威詞也不致於重複出現太多次。此次合併整理 出480 個權威詞,依地區分類為臺灣、大陸、亞洲、歐美,依類型分為學校、劇 團、樂團、活動、單位、組織,地區等類型,此即權威詞之地區和類型屬性。
表3-7、權威詞規則
表3-8、權威詞屬性內容
權威詞屬性 內容
地區屬性 臺灣、大陸、亞洲、歐美
類型屬性 學校、劇團、樂團、活動、單位、組織,地區
三、 對應大事紀
參考(Union List of Artist Names, ULAN)的事件欄位結構,紀錄關鍵事件、
活動的狀態,或者人的生活或公司機構的歷史,日期和地點資訊是必備資訊,除 了記載時空的欄位外,Event 欄位是紀錄事件的類型屬性(見表 3-9)。透過前述 整理出的權威詞,對應出含有權威詞大事紀,再參照 ULAN 的事件欄位結構,
將原本大事紀的描述分為人物、事件屬性、時間、地點和權威詞等欄位(見表 3-10),「事件補充」欄位為事件屬性欄位的次分類,將屬性內容加以細分類型(見 表3-11)。
表3-9、ULAN 事件欄位結構
表3-10、人物事件與權威表
表3-11、事件屬性內容
事件屬性 事件補充
學歷 入學、畢業
經歷 任教、擔任、拜師、入團
榮譽 入獎、入圍、入選
演出 作曲、指揮、指導、演出
活動 主辦、成立、採集、出版、發表、國際交流、評審委員、
音樂會、慶祝會、會議、講座、學術研究、音樂節目
四、 建置資料矩陣
社會網絡資料矩陣最基本的就是「個案-隸屬」關係矩陣,欄表示行動者,
列所隸屬的項,亦即以二模發生矩陣轉成一模鄰接矩陣,建構出在社會網絡分析 中用的鄰接矩陣(榮泰生, 2013)。透過此節資料整理的歷程,目的在於將傳統資 料結構整理成二模(two-mode)的「人物與權威詞」隸屬矩陣資料,以及以權威 詞為共現之一模(one-mode)「人物與人物」矩陣以利下一步社會網絡分析。
表3-12、人物與權威詞二模矩陣(上)、人物與人物一模矩陣(下)
在許多社會結構中,上述所整理之關聯(incidence)資料特別重要,因為它 是多層次的,行動者取得連結是因為他們在相同時間、地點或是組織中同時出現,
亦即他們在事件中發生關聯或是隸屬於相同結構,而這樣的資料也顯示因為行動 者的共同出現而構成關聯,那是探尋行動者與結構,也是宏觀與微觀視角連結的 窗口(陳世榮,2013)。
五、 建立人物領域專長屬性
根據資料庫原有人物分類(表3-1、3-2),建立人物領域專長屬性,為配合 藝術音樂僅有一層的分類,傳統音樂僅著錄至第一層分類。
表3-13、人物領域屬性
六、 選擇閾值
若是資料為多值(valued),需轉變為二值(bi-partite)資料,以利後續網絡 分析。其方法是將矩陣二元化,用一個臨界點對各個格值進行「閾值切割」,在 切割過程中,研究者要決定切割值,高於此層次的值都用1 來表示,等於或低於 該值的格值都用0 來代替,但是這樣做會損失一些訊息,這種切開資料矩陣的過 程是非常重要的技術(榮泰生,2013)。參考 Small、林頌堅、柯逸淩、歐怡安的 閾值判斷方式,透過改變切割點,觀察相互連結的最大節點數量的變化,尋找最 大的改變切割點,以發生最大改變的前一級閾值作為臨界點(Small, 2009;林頌 堅,2010;柯逸凌,2013;歐怡安,2015)。本研究將依循上述方式,從原始無 切割資料,逐步遞增切割門檻,觀察所影響的節點連結數量變化,以連線遽降的