• 沒有找到結果。

個人知識重整-以記憶模型與標籤技術為基礎

N/A
N/A
Protected

Academic year: 2021

Share "個人知識重整-以記憶模型與標籤技術為基礎"

Copied!
56
0
0

加載中.... (立即查看全文)

全文

(1)國立交通大學 多媒體工程研究所 碩 士 論 文. 個人知識重整–以記憶模型與標籤技術為基礎 Reorganizing Personal Knowledge Based on Memory Models and Tagging Technology. 研 究 生:林依文 指導教授:孫春在. 教授. 中 華 民 國 九 十 六 年 六 月.

(2) 個人知識重整–以記憶模型與標籤技術為基礎 Reorganizing Personal Knowledge Based on Memory Models and Tagging Technology. 研 究 生:林依文. Student:I-Wen Lin. 指導教授:孫春在. Advisor:Chuen-Tsai Sun. 國 立 交 通 大 學 多 媒 體 工 程 研 究 所 碩 士 論 文. A Thesis Submitted to Institute of Multimedia Engineering College of Computer Science National Chiao Tung University in partial Fulfillment of the Requirements for the Degree of Master in. Computer Science June 2007 Hsinchu, Taiwan, Republic of China. 中華民國九十六年六月.

(3) 個人知識重整–以記憶模型與標籤技術為基礎  學生:林依文   .  .  .  .  .  .  .  . 指導教授:孫春在    教授 . 國立交通大學多媒體工程所 . 中文摘要  資料夾為自從電腦開始使用以來,就一直擔任著整理資訊的工具,但是資料夾本身 有其限制及缺點,例如:樹狀結構所產生的問題、階層優先度問題等,導致有時候無法 有效地尋找到所需的資訊,造成人們的困擾。現有的檔案搜尋系統,如 Google Desktop  Search,限於關鍵字與資訊內容可能不太相關的問題,也無法完全解決這個問題。由於 標籤網路為平面式網路結構無階層性問題,以及是由使用者對資訊的認知所下的標籤, 所以可以避免檔案搜尋系統關鍵字相關度的問題,所以我們將採取此結構來做為解決方 案。  本論文以在網際網路上發展迅速的標籤(Tag)分類法,針對個人組織整理其所擁有資 訊的方面,來設計出一個個人知識重整系統,以認知心理學的記憶模型和記憶歷程的理 論為基礎,期望能改善資料夾和檔案搜尋系統現有的問題,以及進而能幫助人類做記憶 中知識的重整。針對高中三年級的學生,藉由採用個人知識重整系統和傳統資料夾分類 二種方式來做實驗,第一階段請二班各別使用二種方式來整理圖檔,隔週之後,第二階 段請學生使用當初建立結構的系統來找尋指定的目標圖片,於建立與搜尋的過程中以電 腦程式記錄下使用者的動作。比較二者搜尋到目標檔案的效率、各自結構建立的風格、 二種結構的搜尋風格差異,以及個人與整體間是否存在某些認知的共識。  研究結果發現使用個人知識重整系統比資料夾在搜尋目標檔案時,時間上較為快速, 步驟數較多。使用者大部分為圖片加上 2~3 個標籤。個人所建立的標籤網路,在某些 部分會和團體共同認可的結構相同。      關鍵字:  標籤、認知心理學    i   .

(4) Reorganizing Personal Knowledge    Based on Memory Models and Tagging Technology    Student: I‐Wen Lin   .  .              .          . Advisors: Dr. Chuen‐Tsai Sun . Institute of Multimedia Engineering  National Chiao Tung University . Abstract  Since the first version of Window operation system was developed in 19XX, a  categorization approach “folder” have served as an important information tool to  organize data. However, the hierarchical structure of folder has its limitations and  weaknesses for organization data, e.g. problem of tree structure and hierarchical  priority…etc. The drawback of folder categorization may make people difficult to  effectively search for demanded information. Besides, the existing file searching system  like Google Desktop Search limited by keyword may not reflect the context of content, so  it needs a more effective and efficient approaches to help people search in organized  knowledge structure even unorganized data pool. In this study, I focus on re‐organizing  knowledge by tagging approach to help data search and organization. Because tagging  network is structured as plane network, it has no hierarchical problem. And due to  tagging procedure is established based on user’s cognition, users can avoid content  relation problem resulted from keyword search.    This thesis uses tagging technology to design a personal knowledge re‐organizing  system which is based on memory models and memory recording processes of cognitive  psychology. The proposed tagging system aims to improve original files searching system  based on folder structure, and thus can help people record, store, and re‐organize  knowledge in user’s personal biological memory. Several experiments were run in senior  high school for evaluating the proposed tagging system by comparing the traditional  hierarchical folder system. Two phases experiments including pretest and posttest show  that using tagging system to re‐organize personal knowledge is more efficient, effective,  and intuitive than traditional approach. Moreover, by visualizing how user records and . ii   .

(5) organizes his/her knowledge, the tagging network structure organized by different user  can show user’s personal memory style which can be viewed as a useful tools to observe  how people organize their personal knowledge.      Keyword:    Tag, Cognitive Psychology   .  . iii   .

(6) 誌謝  本論文能夠順利地完成,首先要感謝我的指導教授孫春在教授,獨特的思考方式帶 領我們用不同的角度去切入問題,以其豐富的經驗與知識和對於新領域的接納,讓學生 可以有各式各樣的研究,也才能有本論文的出世。其次,感謝口試委員張智星教授、胡 毓志教授以及陳穎平教授針對本論文之指正與建議,使本論文得以更加完整。  我也萬分感謝研究室的學長姊們:吉隆學長指導我研究的方向,在一次又一次的討 論中,確定了論文的骨架。佩嵐學姊給予我關於教學實驗的意見,讓對於教學實驗較陌 生的我能規劃出不失的實驗方法。建勳學長全力輔助幫忙系統的實作,能成功實作出系 統都要感謝學長對於理論和實作關係的指點。右敏學姊和朝淵學長幫忙協調實驗班級狀 況,讓實驗能夠順利完成。  另外還要感謝實驗室的同學們:宗元在論文理論上提供的觀點,正宏在口試前協助 投影片的修正,岳暄、文翊…等一起努力的伙伴們,還有學弟妹們的關心,謝謝你們!  最後,要感謝的就是我的家人,感謝爸爸、媽媽民主開放的作風,讓我選擇有興趣 的領域學習,一直在背後默默地、溫暖地支持著我,煩惱時陪我一同擔憂,沒有你們我 也許走不到這裡,謝謝!        林依文. 謹於 . 交通大學  中華民國九十六年六月   .  . iv   .

(7) 目錄  中文摘要 ..................................................................................................................................... i  Abstract ....................................................................................................................................... ii  誌謝 ........................................................................................................................................... iv  目錄 ............................................................................................................................................ v  圖目錄 ...................................................................................................................................... vii  表目錄 ....................................................................................................................................... ix  一、 . 緒論 ............................................................................................................................ 1 . 1.1 . 研究動機 ................................................................................................................ 1 . 1.2 . 研究問題 ................................................................................................................ 3 . 1.3 . 研究重要性 ............................................................................................................ 4 . 二、 . 文獻探討 .................................................................................................................... 5 . 2.1 . 背景探討 ................................................................................................................ 5 . 2.2 . 標籤(Tag)技術 ........................................................................................................ 6 . 2.3 . 記憶 ...................................................................................................................... 10 . 三、 . 2.3.1 . 記憶模型 .................................................................................................. 10 . 2.3.2 . 記憶歷程 .................................................................................................. 12 . 系統架構與設計 ...................................................................................................... 15 . 3.1 . 核心概念 .............................................................................................................. 15 . 3.2 . 系統概念架構 ...................................................................................................... 16 . 3.3 . 實作內容 .............................................................................................................. 16 . 四、 . 3.3.1 . 使用者介面 .............................................................................................. 17 . 3.3.2 . 資料庫設計 .............................................................................................. 19 . 3.3.3 . 資訊內容的選擇 ...................................................................................... 19 . 3.3.4 . 系統功能計算 .......................................................................................... 20 . 實驗方法與結果分析 .............................................................................................. 21 . 4.1 . 研究對象 .............................................................................................................. 21 . 4.2 . 研究工具 .............................................................................................................. 21  4.2.1 . 記錄結構建立及搜尋的過程 .................................................................. 21 . 4.2.2 . 背景調查問卷 .......................................................................................... 21  v .  .

(8) 4.3 . 實驗流程 .............................................................................................................. 21  4.3.1 . 4.4 . 五、 . 搜尋任務說明 .......................................................................................... 23 . 實驗結果與分析 .................................................................................................. 23  4.4.1 . 系統使用狀況 .......................................................................................... 23 . 4.4.2 . 搜尋效率 .................................................................................................. 24 . 4.4.3 . 結構建立風格 .......................................................................................... 26 . 4.4.4 . 搜尋風格 .................................................................................................. 33 . 4.4.5 . 個人與群體差異 ...................................................................................... 34 . 結論 .......................................................................................................................... 38 . 參考文獻 .................................................................................................................................. 39  附錄  A. . 實驗中搜尋任務的詳細說明 .............................................................................. 41 . 附錄  B. . 系統介面的操作方法 .......................................................................................... 43 .    .  . vi   .

(9) 圖目錄  圖  2.1.1 . 個人網站架構範例............................................................................................. 6 . 圖  2.2.1 . 二分網路(bipartite network) .............................................................................. 7 . 圖  2.2.2 . 資訊內容(Content)  和  標籤(Tag)  的二分網路 ............................................... 8 . 圖  2.2.3 . 書目管理網站 CiteULike .................................................................................... 9 . 圖  2.3.1 . 記憶的三段儲存模型....................................................................................... 10 . 圖  2.3.2 . 工作記憶的示意圖........................................................................................... 11 . 圖  3.2.1 . 三段儲存模型與記憶歷程的基本操作........................................................... 16 . 圖  3.2.2 . 概念架構........................................................................................................... 16 . 圖  3.3.1 . 實作架構圖....................................................................................................... 17 . 圖  3.3.2 . 系統介面........................................................................................................... 18 . 圖  3.3.3 . 資料庫架構圖................................................................................................... 19 . 圖  4.4.1 . 每張圖片平均擁有標籤數的分佈圖,橫軸代表每張圖片擁有的標籤數,縱. 軸代表擁有特定標籤數的圖片平均有幾張,結果的高峰點顯示一張圖片有 3 個標 籤的情形最多 ................................................................................................................. 24  圖  4.4.2 . 搜尋目標圖片所需的時間圖........................................................................... 25 . 圖  4.4.3 . 搜尋目標圖片所需的步數圖........................................................................... 26 . 圖  4.4.4 . 資料夾結構....................................................................................................... 27 . 圖  4.4.5 . 連結度高的標籤網路,此為某一受測者所建立的標籤網路,大部分的節點. 皆連結在一起,代表對於不同圖片間有相同的標籤,一張圖片含有多個標籤 ..... 28  圖  4.4.6 . 單點散佈的標籤網路,此為某一受測者所建立的標籤網路,大部分的節點. 之間無相連,代表此受測者大部分圖片只下一個標籤 ............................................. 29  圖  4.4.7 . 區塊分隔的標籤網路,此為某一受測者所建立的標籤網路,節點相連成一. 個個的區塊,區塊與區塊間無相連,代表此受測者不同圖片間很少下相同的標籤  . 30 . 圖  4.4.8 . 使用比率與使用範圍的分佈圖....................................................................... 31 . 圖  4.4.9 . 特定圖片........................................................................................................... 32 . 圖  4.4.10 . 特定圖片的資料夾名稱使用統計................................................................... 32 . 圖  4.4.11 . 特定圖片的標籤名稱使用統計....................................................................... 33 . 圖  4.4.12 . 資料夾搜尋範例............................................................................................... 33  vii .  .

(10) 圖  4.4.13 . 搜尋標籤範例-步驟 1 ................................................................................... 34 . 圖  4.4.14 . 搜尋標籤範例-步驟 2 ................................................................................... 34 . 圖  4.4.15 . 群體共識標籤網路........................................................................................... 35 . 圖  4.4.16 . 共通標籤在個人標籤網路上的位置(範例 1) ................................................. 36 . 圖  4.4.17 . 共通標籤在個人標籤網路上的位置(範例 2) ................................................. 37 .    .  . viii   .

(11) 表目錄  表  2.3.1 . 三個不同的處理層次....................................................................................... 11 . 表  4.4.1 . 搜尋時間效率比較表....................................................................................... 25 . 表  4.4.2 . 搜尋步數比較表............................................................................................... 26 .  . ix   .

(12) 一、 緒論  1.1. 研究動機  自從二○○五年 Time O’Reilly 提出「What Is Web2.0」之後,Web2.0 的觀念,提. 供了使用者一個重新審視與檢索線上資料或連結的新方法,從原本單純由服務提供者主 動提供知識且使用者被動地接受與搜尋知識,轉變服務提供者提供平台,讓使用者主動 地在網路上發表、分享、蒐集、與整理知識。Web2.0 的服務種類繁多,因此,一大批 應用在線上各種多媒體與知識的專業網站應運而生,包含部落格(blog)、社會性書籤 (Social Bookmarking)、線上圖片共享網站(Photo sharing website)等。以網路書籤 (或稱為社會性書籤)而言,它是一種超連結的收藏和分享的服務,使用者可以通過它 來收集、分類感興趣的網路資訊,例如新聞、圖片、影片、網頁等。同時,也能方便地 與其他人分享自己的個人收藏,並從其他使用者收藏中進行資訊的採集。代表性的網站 為 del.icio.us1、reddit2,中文則有 HEMiDEMi 黑米共享書籤3…等。網路相簿或稱為照 片共享網站提供使用者發佈並與其他使用者分享數位相片的平台,此服務也可以提供作 為網誌圖片的存放空間,所以受到許多部落格作者的喜愛。代表的網站如 Flickr4與 Google Picasa Web Album5等。上述的網站有一個共同的特色,就是其提供使用者以標 籤(Tag)作為分類的工具之一。  自 Internet 興起以來,為了方便使用者能夠連結與記錄網站的網址,而不需背誦長 長的 URL 網址,以 IE 與 FireFox 兩大瀏覽器而言,均提供書籤(Bookmark)的功能讓讓 使用者能夠記錄、保存、或整理網址,當使用者下次想走訪該網站,只需要找到相對應 的書籤就可連到網站。在微軟的瀏覽器 Internet Explorer 裡,此機制被稱呼為我的最愛 (My Favorite)在使用者工具列中提供使用者快速存取。隨著 Web2.0 的發展,網路使用 者在網路上增加內容機會大增,網路上可獲取的資訊、知識日益增多,使用者所保存的 「我的最愛」或「書籤」亦隨著日益增多。使用者不僅要面對網路上龐大的資訊量,尚 要面對整理重組自己所保存或感興趣的「我的最愛」,以方便日後找尋。目前現行的瀏 覽器中(包含 FireFox, IE) ,均以樹狀階層化的方式在歸類書籤。此種方法為傳統生物分                                                         1.   Del.icio.us: http://del.icio.us/    reddit: http://www.reddit.com/  3   黑米共享書籤: http://www.hemidemi.com/  4   Flickr: http://www.flickr.com/  5   Google Image: http://picasaweb.google.com/  2. 1   .

(13) 類學(界、門、綱、目、科、屬、種)、傳統的圖書館圖書分類、以及目前作業系統中 的檔案分類系統(包含微軟視窗作業系統系列、蘋果電腦的 MaxOS、與 Linux 等)所採 用,在此階層化的架構中,使用上使用者會從最上層的分類開始往下找細的分類,直到 找到所要的書籤為止,是一種 Top‐Down 的方式,上層的分類多半具有一般化的特性, 而下層分類則具有特殊化的特性。一般來說,為了使書籤避免繁多雜亂,通常只會加入 一個網站最上層的首頁當作書籤,但當你想找某一篇特定文章而不知出自於哪個網站的 時候,反而會難以找尋。因為網路關鍵字搜尋技術的發達,此時會乾脆放棄使用自己建 立整理的書籤,使用搜尋引擎來直接找,這樣就失去了當初花費時間整理的意義。  直到後來網路上社會性書籤服務興起,使得使用者可以在收藏連結的時候,寫下一 些備註,以便供自己或其他使用者日後參考或檢索,最有特色的一點就是可以對連結非 階層式地加上使用者所慣用的關鍵字以區辯一個連結的內容描述(Content Description) 或概念(Concept),一般的做法是給連結加上不同的標籤(Tag)。  標籤(Tag)是一個 被關連到或被指派到某個資訊的關鍵字,資訊可以是一張圖片、一篇文章或是一段影片。 標籤通常是非很正式的且隨個人的觀感而被它的創造者或使用者所定義,所以它可以很 有彈性地被使用。沒有人規定它該怎麼使用,所以每個人可以針對他對這項資訊的了解, 來為資訊貼標籤,並作為整理資訊的工具。這裡所提到的「社會性」書籤則特別著重其 可分享在不同使用間的特長,意即不同使用者之間,彼此可分享他們相同標籤的連結, 這種社會性的分類機制被稱為分眾分類法(Folksonomy)。此種分類方式為一平面化的 網路架構,沒有階層之分,由於標籤是使用者慣用的自行定義,雖然不夠嚴謹,但使用 上顯得方便、靈活。分眾分類法為資訊標標籤,是為了想要讓資訊的本體更容易、更快 速地被找到,從某個資訊開始看到誰下了這個標籤,他還下了那些其他的標籤,用這種 方法去找尋其他使用者傾向使用哪些標籤,並對其他內容下有意義的標籤。  社會性標籤似乎成功地從分享與自我整理的角度解決了使用者在整理網路上鉅量 資訊的問題。然而,就目前使用者所賴以上網、收集資訊、生產資訊的個人電腦的作業 系統而言,有如上述書籤的歷史一般,自從人類使用電腦以來,一直都依靠著階層式檔 案系統,以視覺化資料夾來整理檔案。因為階層化的歸類方式,具有一般性與特殊性的 考量,最上層的分類過度一般化(General) ,而最下層的分類則容易過度特殊化(Specific) , 成為階層化的儲存方法具有如同歸類網路上最愛連結時的缺點。以找尋一篇論文為例, 例如以社會網路分析找尋生物基因網路中的基調,該篇論文橫跨了資訊科學與社會學的 社會網路分析和分子生物學等二種領域,使用者在歸類時若把它放入其中一種領域的資 料夾中,那麼在另一種領域的資料夾裡就看不見它的存在,不論是放入哪個資料夾,都 會導致資訊的喪失,以及限制了日後找尋的方式。使用者可能考慮複製兩份檔案在兩個 2   .

(14) 資料夾中,然而則會有檔案重複的問題;或者當使用者對文字類型檔案加以註解,則必 須對兩份檔案加以同步化。不僅文字檔案,其他多媒體資料的分類,如以圖片為例,亦 會遇到如此的問題。例如給定一張 Wii Sport 裡在玩網球遊戲的螢幕畫面,有的人會把 它放到網球的資料夾,有的人會放到遊戲的資料夾,假設今天放到網球的資料夾中,之 後想找遊戲的圖片就找不到了。反之亦然,所以整理時的思考方式會限制找尋時的思考 方式。  近年來,除了在 Windows 本身所提供的檔案搜尋功能,或像是 Mac OS X 內建的 Spotlight 搜尋功能,以及 Google Desktop Search 以強大的搜尋引擎幫助個人在自己的 電腦中搜尋資料,微軟最新推出的作業系統 Windows Vista 裡也有內建相似的功能。讓 使用者可以不用辛苦的整理檔案,只要打幾個關鍵字即可搜尋到自己所需要的資訊。在 網路上盛行的搜尋引擎,如今也逆傳回個人電腦,不過如同使用網路上的搜尋引擎來搜 索東西一樣,使用者在下關鍵字以找尋檔案的時候,針對所要找的資訊,關鍵字難以定 義與回想,並且所找尋到的結果,呈現方法不具有結構性和關聯性,系統在將與該關鍵 字依照相似度排列後,即以表列(List)的方法呈現,使用者所見會受到系統預設相似 度搜尋演算法所影響,不盡然為使用者所需要的結果。在前述搜尋論文的例子中,若使 用 Google Desktop Search 之類的搜尋引擎,可利用論文標題或內文所擁有的關鍵字來做 搜尋,但是關鍵字找到的論文未必就是所想找的,跟論文內容本身和關鍵字的相關度有 關。再以前述圖片搜尋為例,搜尋引擎目前對圖片的尋找比文字類的檔案困難,因為圖 片中不存在關鍵字無法搜尋,只能依靠檔名的搜尋,若檔名都是一堆流水號的話,可能 就很難找到了。基於上述的情況,我們渴望有其他的方式來幫助人們整理檔案,以彌補 上述二種方法的不足。  為了要幫助人們整理及找尋電腦裡堆積的檔案,我們需要先了解人類記憶的過程。 就像在儲存檔案時可以想像成在記憶一件事物,大腦裡保存著所有記憶,到要用到時再 去回想起來,也就是平時電腦裡儲存著檔案,需要時再將檔案尋找出來。所以我們先研 究認知心理學(cognitive psychology),它關心的是人們對訊息如何知覺、學習、記憶和 思考,從裡面挑出記憶模型6的部分理論,做為系統的主要核心概念。以認知心理學為 基礎貼近人們的思考模式,以期能真正改善以及幫助人們做資料的尋找和再利用。 . 1.2. 研究問題  基於上述的動機,本研究欲探討的問題分別如下: .                                                         6.   詳細於 2.3.1 節做說明  3 .  .

(15) 一、以認知心理學中的記憶模型為基礎的標籤(Tag)系統,是否比原本的資料夾結構, 更能幫助人們找尋、提取曾經儲存過的檔案?  二、使用資料夾與標籤系統在找尋所需檔案時,各自擁有哪些特色?  三、以資料夾與標籤系統建立出來的架構,各自擁有何風格?以及是否存在某種關 連,對其用不同系統的結果會造成何種影響。 . 1.3. 研究重要性  電腦做為人類社會越見重要而普遍的資訊處理與儲存媒介。如何快速有效的管理、. 搜尋、索引電腦中的大量個人資訊,成為電腦系統做為人類重要外部記憶媒介以及解決 日常問題的常用工具時所需要面對的共通重要課題。這種需求反應在各種新型人機介面 (Human Computer Interface)的設計上。本篇論文將目前在現階段 Web2.0 服務中大量被 使用的標籤系統設計引入於個人電腦的環境,並且與傳統個人知識重整時常見的資料夾 系統進行比較。    本論文的重要性在於以下幾點:  z. 引進認知心理學的理論來解釋,標籤為何能比資料夾更有效地整理及提取資訊。並 且比較探討兩者在實際應用時的不同點。 . z. 設計結合記憶模型、記憶歷程和標籤網路結構為基礎設計個人化環境時適用的系統, 並藉由實驗來驗證標籤與認知結合的系統能幫助人們做記憶的反芻與提取。   .  . 4   .

(16) 二、 文獻探討  2.1. 背景探討  人們使用階層式架構,除了之前提過的檔案資料夾系統外,其實從很早以前就開始,. 直到今日仍廣泛的使用中。以下舉幾個例子說明。  一、圖書館的藏書分類:像是整理中文書的「中國圖書分類法」,此分類法目前在 台灣用得相當普遍,無論公共圖書館、大學圖書館、中小學圖書館,甚至專門 圖書館,採用此法整理圖書資料者比比皆是。它分為 000 總類、100 哲學類、 200 宗教類、300 自然科學類、400 應用科學類、500 社會科學類、600‐700 史地類、800 語文類、900 美術類,以下各種類再繼讀細分,是一個很標準的 樹狀結構。  二、生物學:地球上的生物都依據一套物種分類規則來進行分類,此規則中訂出生 物分類的七大層級,從高到低依序為界(Kingdom)、門(Phylum)、綱(Class)、 目(Order)、科(Family)、屬(Genus)、種(Species),階層越高代表所包含的生物 種類越多,較低的階層包含的種類就較少,但彼此之間的構造特徵卻較相似。 而這七大層級之間的關係簡單來說為,界擁有許多門,門擁有許多綱,綱擁有 許多目,目擁有許多科,科擁有許多屬,屬擁有許多種,種是最基本單位。是 一種由上到下的階層式結構。但不是所有的物種都可以順利的分類,像是鴨嘴 獸的分類,由於牠是哺乳動物又會產卵,曾造成生物學家的爭論,最後終於在 哺乳綱、原獸亞綱、單孔目找到一個位置,成為哺乳動物中唯一個不是胎生的 動物。  三、網站架構:在建立設計一個網站時,需要事先做好規劃,以吸引人氣和留住瀏 覽的人潮。對於網頁的配置,為了能讓瀏覽的人有順暢的瀏覽經驗,以及減少 到達瀏覽者想看頁面的連結數,所需的連結層數(次數)愈多將會影響瀏覽者的 觀看的意願,所以一般而言,會先規劃個網站地圖,圖  2.1.1 為個人網站的設. 5   .

(17) 計架構: .   圖  2.1.1 . 個人網站架構範例 . 可以看得出它本質上仍是一個樹狀階層式架構。 . 2.2. 標籤(Tag)技術  人類在看到一篇文章時,可以很快地將其歸類在所屬的領域裡,例如:經濟、政治. 或運動。Florian Wolf, Tomaso Poggio 和 Pawan Sinha 提到說其實只需幾個字詞,以這些 字詞來為文章分類,就可以近似原本文章分類的精確度[1],也就是我們可以把文章濃縮 成幾個字詞。因為標籤本身也就是字詞的一種,如果把字詞替換成標籤,就代表著對文 章下幾個標籤後,我們就可以用這些標籤來對文章做分類。  而透過標籤技術,要如何去組織資訊內容呢?在下標籤的同時,對於每個標籤會對 應到一個或多個資訊內容上,每個資訊內容也會對應到一個或多個標籤上,彼此間無任 何方向性,我們可以利用這些關連來做進一步的利用,以下將做更詳細的說明。  從六個人的小世界(SIX DEGREES)此書中的理論可知,標籤和資訊內容本身為所謂 的關聯網路(Affiliation Network),當二個標籤共同標示於同一個檔案上,就被認為是「相 關連的」。關連網路永遠由二種節點所組成,最好的表示方法為二分網路(bipartite  network),所有節點可被分為二群,同一群內的節點彼此不相連。如圖  2.2.1 的上方, 數字編號的為一群,英文字母編號的一群。若將二分圖展開來,拿掉其中一群的節點, 將可得到剩下那群節點的直接連結圖。如圖  2.2.1 的下方,拿掉數字的節點展開後,可 得到字母的連結圖。 . 6   .

(18)   圖  2.2.1 . 二分網路(bipartite network) .   若將資訊內容(Content)  和標籤(Tag)繪製成二分網路,就會像錯誤!  找不到參照來 源。一般,可被分為二個單元網路,一個是資訊內容的網路(Contents Network),而另 一個則為標籤網路(Tags Network)。. 7   .

(19) 資訊內容網路. 資訊內容. 標籤. 標籤網路.   圖  2.2.2 . 資訊內容(Content)  和  標籤(Tag)  的二分網路 .   藉由資訊內容的網路,我們可以用資訊找資訊,像是今天拿到一篇論文,可由此網 路找出與它相關的論文。藉由標籤網路,可以用標籤找相關標籤下的資訊,從一種領域 找到另一種可能相關的領域,例如假設在「遊戲」這個標籤下,有一張 Wii Sport 打網 球的圖,圖片擁有二個標籤:遊戲、網球,那麼由標籤網路可找到「網球」這個相關的 標籤,進而去尋找其他打真實網球的圖。  CiteULike7是一個可整理書目引文資料的網站,如圖  2.2.3。它延續了幾個 del.icio.us 特色:以個人標籤為主的分類組織、可以瀏覽其他人分享的資料,並且提供了匯出匯入 的功能,可以跟研究者的書目管理軟體配合使用。CiteULike 能讓使用者訂閱特定期刊 的書目資訊,使用者可以從訂閱資訊中選擇是否要加入自己的書目資料庫。他跟一般書 目管理軟體不同的地方是,當初步探索特定主題文獻時,可以透過其他人的書目資訊, 類似滾雪球的方式,找出許多相關文獻。在滾雪球的過程中,可以發現引用收錄次數較 高的文獻,則這篇文獻相對可能較為重要。另外, 可以學習其他收錄者用何種標籤描述 這篇文獻,可以幫助檢索者進一步擴張或是限制自己的檢索策略。提供 RSS,可以訂閱                                                         7.   CiteULike: http://www.citeulike.org/  8 .  .

(20) 特定主題或特定人物的書目資訊,能第一時間取得最新資訊。提供社群功能,可以協同 管理或編製特定書目。他將標籤做了一個很好的應用,研究者只要收集記錄自己找到的 論文,就可以從此為出發點,得到大量其他人整理的資料。 .   圖  2.2.3 . 書目管理網站 CiteULike .    .  . 9   .

(21) 2.3. 記憶 憶 . 2.3.1. 記憶 憶模型 . 人類籍由記 記憶(memo ory)來保存 存及提取過去 去的經驗,以便未來的 的使用。在 在認知心理 學的 的研究上,不同的認知心 不 心理學家對 對於記憶有不 不同的詮釋 釋方式。不同 同詮釋方法上 上的差異, 主要 要是因為所用 用來了解記 記憶的比喻((metaphor))的不同所導 導致[2]。隨 隨著新研究的 的發現,後 後 人會 會對其比喻提 提出修正,或是直接提 提出一個新 新模型。  傳統且被人 人廣泛接受 受的記憶三段 段儲存模型 型(three‐store model o of memory),是 Richard Atkinson 和 Richaard Shiffrin n 於 1968 年所提出[3] 年 。他們將記 記憶視為三個 個儲存庫:  (1) 感覺儲 儲存(Senso ory store):儲存非常短 短暫且數量 量有限的訊息 息。  (2) 短期儲 儲存(Short‐‐term storee):可以將 將訊息儲存較 較長的時間 間,但容量仍 仍有限。  (3) 長期儲 儲存(Long‐term store):有非常大 大的容量,能長久儲存 存訊息,甚 甚至無限期 地儲存 存。  他們以不同 同名稱來區 區別結構和儲 儲存在結構 構中的訊息,稱結構為 為儲存庫(sto ore),稱儲 儲 存在 在結構中的訊 訊息為記憶 憶。後來的認 認知心理學 學家稱三段儲 儲存系統為 為感覺記憶、短期記憶 憶 和長 長期記憶。如 如同前面提 提到記憶的比 比喻,Atkinson 和 Sh hiffrin 並不 不認為三個儲 儲存庫擁有 有 獨特 特的生理結構 構,而是一 一種假設性結 結構(hypotthetical con nstructs),它指的是本 本身無法被 被 直接 接測量或觀察 察的概念,但是可以幫 幫助我們容 容易去了解記 記憶如何運 運作的心智模 模型。 Atkin nson 和 Shiffrin 後來的 的研究將記 記憶的三段儲 儲存模型化 化為圖  2.3.1 呈現,來 來說明儲存 結構 構的系統,強 強調被動的 的儲存庫來存 存放記憶[4 4]。 .   圖  2.3.1 . 記憶的 的三段儲存模型 型 . 10  .

(22) 另一種假設,處理層次架構(levels‐of‐processing framework)是由 Craik 和 Lockhart 所提出的[5]。它與記憶的三段儲存模型不同,他們假設記憶並非由幾個儲存區所組成, 而是假設儲存沿著一個連續的向度(即收錄的深度),而有所變化。此研究假設在理論上 有無限數量的處理層次(LOP),它用來收錄項目,而層次與層次之間並沒有分界線,並 強調處理是儲存的關鍵,訊息被儲存的層次大部分取決於它被收錄的方式。Brown 和 Craik 後來的研究顯示,一般而言處理的層次越深,項目會被提取出來的機率也越高[6]。 Craik 和 Tulving 以一系列的實驗來支持這個觀點[7]。他們先將一串字給受測者看,然 後在每一個字前面加上一個問題,依問題的變化來引發三個不同層次的處理,依淺到深 的順序排列,分別為:物理的、聽覺的、語意的,如表  2.3.1 所示。實驗的結果呈現, 問題引發的處理層次越深,回憶的表現會比較好。  表  2.3.1 . 三個不同的處理層次 .   工作記憶(working memory)被定義為長期記憶的一部分,且包含了短期記憶。它是 由一些心理學家從不同角度來看短期記憶與長期記憶[8‐11]。工作記憶只保留長期記憶 中近期被活化的部分,且在短期記憶儲存內外移動被活化的部分,如圖  2.3.2。其實我 們可以把它視為一個加工廠,加工完後的資訊送到長期記憶中,標標籤的動作可比喻成 加工的動作。 . 收錄 短期儲存. encoding 工作記憶. 長期儲存. short‐term  long‐term  Working memory 提取 store store retrieval 圖  2.3.2 . 工作記憶的示意圖 . 在古典知識論中,就知識結構分成二種類別:  11   .  .

(23) (1) 陳述性知識(declarative knowledge):可被陳述的事實  (2) 程序性知識(procedural knowledge):可被執行的程序  由於儲存在電腦裡的資料,皆屬於陳述性知識,所以將以陳述性知識為主軸來設計 系統架構。  在 1983 年 Anderson 提出的 ACT‐R 的模型中,包含了陳述性知識的網路表徵部分 [12]。他的陳述性網路,像語意網路一樣,概念儲存在網路上各個節點,節點可分為活 動和不活動的二種狀態,活動的節點也可以說是被激發的狀態。主要有二個原因會造成 節點被激發,一種是直接地由感官或外界刺激來被激發,另一種則是間接地從已激發的 節點的活動來使鄰近的節點也被激發。若是當節點不斷地激發鄰近的節點時,活動節點 的範圍就會開始拓展開來,直到達到有限的活動節點數,此稱為擴散性激發(spreading  activation),在網路中沿著一組節點而散開。對於系統中的資訊,我們將以網路為其架 構,以標籤做為節點,把檔案同時存在二個標籤的關係,畫為二個節點中間的連線,將 節點的擴散激發化為標籤和相關(相鄰)標籤的激發。 . 2.3.2. 記憶歷程 . 認知心理學家一般指的記憶主要歷程包含三種基本的運作:  (1) 收錄(encoding):指如何將一個物理的、感覺的輸入,轉換為可以放入記憶中 的一種表徵。  (2) 儲存(storage):指如何將已收錄的訊息保留在記憶中。  (3) 提取(retrieval):指如何取得已儲存在記憶中的訊息。  每一個運作分別代表記憶歷程中的一個階段[6, 13, 14]  。三種運作通常被視為有順 序性的過程:首先先接收訊息,接著將它保留一段時間,後來再取出來使用。John  Bransford 和 Marcia Johnson 請他們的實驗受測者閱讀一段文章,說明較為抽象,在嘗 試收錄文章時,會發現難以收錄,以致於儲存和提取也變得困難。可是如果給予受測者 這段文字一個標題,大部分的人會表現得比較好。語言的標籤幫助我們收錄並記住原本 難以理解的文章[15]。 「標籤」原本就是一個語言上的字詞,以此實驗的結果,我們可 預期加標籤會幫助電腦中檔案的收錄。  由於我們想將訊息長期保存後,還能再次地提取出來,所以接下來將把焦點鎖定在 長期記憶的方面。  大部分儲存在長期記憶裡的訊息似乎主要是以語意的方式收錄,也就是說以字的意 義來收錄。一些不同類型的實驗結果[16, 17]可以當作證據,證明語意的收錄方式被做 使用於長期記憶中。例如 Grossman 和 Eagle 的實驗[16],要求受測者記下 41 個不同的 12   .

(24) 單字,結束後五分鐘時,請受測者從清單中勾選剛才看過的單字。清單中含有非剛才記 憶的單字,其中 9 個混淆字與原本的 41 個字有語意上的關連,還有 9 個混淆字與原本 的沒有關連。最後受測者錯認了較多的同義字,對於較無關連的字錯認較少,顯示語意 混淆的可能性較大,可推測主要是以語意方式收錄。事實上標籤本身就是一個字,也就 是說以標籤來收錄儲存可相當於以語意來收錄。  訊息由短期記憶轉移到長期記憶需要一個不同的歷程,名稱為固化(consolidation)。 它的方法是在新訊息和我們已經知道或了解的訊息間建立連結或聯想,藉由將新訊息合 併到儲存訊息的既有基模中來建立連結,達成轉移的目的。若將基模比喻成系統內的網 路結構,那麼在加標籤的過程中,會依資訊內容和標籤的關係,自動建立連結。  記憶的失敗主要是來自提取失敗而非儲存失敗,由 Endel Tulving 和 Zena Pearlstone 的實驗結果所得[18]。他們的實驗中,受測者會先聽到類別名稱,例如「文具類」,接 著會聽到該類別的字彙,如:鉛筆、尺、原子筆、橡皮擦…。之後分成二組,一組採自 由回憶,請受測者儘可能回憶出剛才出現過的字彙;另一組採線索回憶,給予受測者類 別名,請他回憶該類別的所有字彙。最後的結果得到,平均來說線索回憶較自由回憶好 很多,若只讓受測者自由回憶,可能會得到人不能儲存很多字的結論,但此結果證明了 記憶的失敗主要是來自提取失敗而非儲存失敗。  Gordon Bower 和他同事(Bower, Clark, Lesgold, & Winzenz)的研究顯示分類如何戲 劇性地影響提取[19]。接受階層性呈現的受測者回憶出 65%的字,而接受隨機順序呈現 的受測者只回憶出 19%。顯示有結構性的分類記憶,比單純隨機記憶更能幫助未來的提 取,與 Tulving 和 Pearlstone 的結果相呼應。所以我們想要藉由新設計出來的系統,比 傳統資料夾結構更能幫助人們對記憶的提取。  有時候我們在提取訊息時會出現困難,有記憶過的訊息不一定想得起來。以下說明 二個名詞:  (1) 可獲得性(availability):訊息有儲存在長期記憶中  (2) 可及性(accessibility):我們觸及可獲得訊息的程度  記憶的表現須視記住訊息的可及性而定,希望藉由這個系統能幫助人們使用電腦做 為長期記憶區,提高可及性趨近於可獲得性。  2001 年 Nielsen 提到再認(recognition)比回憶(recall)來得好[20],傳統資料夾系統 總是要使用者做回憶出檔案置放的位置,而標籤總是要使用者作再認,不斷地再認現在 所看到標籤,看是否有關聯。以使用性上來說,標籤會比較好。  收錄特定性(encoding specificity)由 Tulving 和 Thomson 於 1973 年所提出[21]。收 錄特定性主要在說回憶什麼決定收錄什麼,因為之前的研究者各種提取實驗的結果都顯 13   .

(25) 示,訊息如何被收錄對於如何被提取以及提取得多好有強烈的影響。Watkins 和 Tulving 的實驗[22]漂亮地證實了收錄特定性。他們讓受測者記憶 24 組配對單字,一個是原本 要記憶的單字,另一個是和單字有關的刺激字,例如:寒冷-雪,雪作為寒冷的刺激字。 接著請受測者圈出曾看到的單字,平均再認出 60%的單字,然後給予 24 個刺激字,請 受測者將記得的單字背出來,結果回憶出 73%的單字。就一般來說再認通常都會比回憶 來得簡單,因為只要說有沒有過這個字就好,比起要記誦出曾出現過的字容易。但這個 結果反而是回憶比再認好,刺激字比原來單字本身對單字來說是更好的線索,因為當初 是以配對的方式來記憶的,突顯收錄方式深深地影響將來提取的成功。  由於資料夾結構的特性限定了資訊收錄的方式,一次只能被分配到其中一個資料夾 底下,意味著只能以一種類別來收錄,最多就是轉換到另一個類別。但是標籤本身的特 性就可以為同一個資訊標上許多的標籤,可在不同時間為資訊決定要收錄的類別,累積 各種不同的收錄方式。所以在收錄時的多樣性,可幫助提高提取成功的可能。  若個人產生自己的提取線索時,這個線索會比其他人所產生的更強而有力。此結果 由 Greenwald 和 Banaji 所發表[23]。Timo Mantyla 的實驗可證實這點[24]。他給予受測 者一串目標字的列表,請他們為每個字產生另一個字,也就是線索,然後只給他們線索 字的列表,請他們回憶出目標字,結果發現他們幾乎可以無誤地記得 500 和 600 字的 列表。所以我們讓使用者自行建立自己的標籤,也預期能比網路上他人建立的標籤來得 更有提高提取的效果。     .  . 14   .

(26) 三、 系統架構與設計  3.1. 核心概念  根據上一章所談到的認知心理學的理論,以及使用標籤來做為主要的工具,來設計. 一個系統,做為一個新的整理工具,以期能達到知識重整的效果。以下各點分別說明一 個概念:  1.. 將標「標籤」視為一種收錄的過程。  由於就收錄本身的意義來說,就是將外界的輸入轉化為記憶的一種表徵,所以我們 可以把標籤本身當做一種表徵,那麼標標籤的動作就成為一種收錄的過程。 . 2.. 將有標過標籤的資訊視為長期記憶。  之前提到長期記憶的訊息主要是以語意的方式收錄,標籤本身就是一個字,當你以 標籤來為資訊做收錄時,等於是以語意來收錄。在三段記憶的模型當中,經過收錄 後的訊息將會儲存在長期記憶中,所以經過標「標籤」的資訊也就成為長期記的一 部分。 . 3.. 系統儲存使用標籤網路架構。  標籤網路可視為陳述性網路,因為同樣是語意所構成的。將標籤視為節點,與資訊 內容的節點畫為二分圖(bipartite graph),隱藏資訊內容的節點,可得到標籤網路。 節點與節點中間的連線,即為同時擁有二端節點標籤的資訊。 . 4.. 選擇標籤將提示其相關的標籤,可視為激發過程,並反過來刺激感官。  當使用一個標籤時,將激發其鄰近的相關標籤並將其呈現出來,讓使用者可從畫面 中得知這些相關標籤,近而造成人類的感官刺激,引起腦內陳述性網路節點激發。 . 5.. 頁面中可供處理的檔案視為工作記憶,為長期記憶的一部分。  讓使用者可對頁面中資訊下標籤的地方為加工區,是工作記憶的一種比喻。 . 6.. 頁面中檔案的順序依建立標籤的先後排序,相當於記憶中近期被活化的部分。  對於人們來說,最近記憶的東西在回憶上較為清晰,也就是說近期才對它做收錄的 動作,以及被活化,會在系統頁面中排在較前面的位置上。 . 15   .

(27) 3.2. 系統 統概念架 架構  原本記憶的 的三段儲存 存模型再加上 上記憶歷程 程的基本操作 作,我們可 可以得到圖  3.2.1 的認 認. 知模 模型。 . 圖  3.2.1 . 三段儲 儲存模型與記憶 憶歷程的基本 本操作 .   根據核心概 概念來對上 上述認知模型 型做整合,可以設計出 出本論文使 使用系統的概 概念架構, 如圖 圖  3.2.2。由 由於感覺儲存 存依舊是依 依靠人類的部 部分,所以 以不做任何更 更動,但不 不屬於系統 內的 的結構。 . 圖  3.2.2 . 3.3. 概念架 架構 . 實作 作內容  本研究以 3.2 3 節的概念 念架構為基 基礎,以此 此來發展實際 際的系統。建立系統的 的主要語言 言. 為 Py ython,因為 為 Python 對於網頁後 後端的處理 理功能強大,對於架構 構整個系統有 有所幫助。 圖  3.3.1 3 繪出系 系統實作的架 架構圖,先 先於儲存裝 裝置上置放所 所有實驗用 用的圖片,以 以及架設資 資 料庫 庫用以儲存標 標籤和檔案 案的資訊。中 中間的大方 方塊是系統中 中心部位,其中一個單 單位負責圖 圖 片的 的讀取,一個 個單位處理 理從資料庫讀 讀出來的資 資料,建立出 出檔案及標 標籤的關連。 。其中一個 個 最重 重要的單位,負責計算 算指定標籤的 的相關標籤 籤、標籤使用 用率的排序 序,和選擇某 某固定標籤 籤 時計 計算有關檔案 案的排序,詳細的說明 明在後面章 章節會再提到 到。最後當 當使用者操作 作時,我們 們 配合 合前面計算出 出來的結果 果和讀取的圖 圖片作畫面 面上的呈現,使用者介 介面以網頁的 的方式讓人 人 16  .

(28) 瀏覽,以及提供簡便的操作過程,完整的使用者介面將在下一節來做說明。 . 作業系統的讀寫 圖片. 相關標籤計算 標籤排名. 使用者 介面. 檔案排序 使用者 標籤與檔案的關連 讀/寫 資料庫 圖  3.3.1 . 3.3.1.  . 實作架構圖 . 使用者介面 . 圖  3.3.2 為實作出來的系統介面圖,右方邊欄為使用者所建立的所有標籤,左上方 的是標籤網路由目前標籤所得到的相關標籤。與目前標籤最相關的,也就是說與目前標 籤一起同時存在於相同資訊數愈多,就愈相關,會置於相關標籤的愈前面。 . 17   .

(29) 標籤網路. 所有標籤.   圖  3.3.2 . 系統介面 .   介面說明  z. 圖片資料 .   z. z. 從上到下,各行為:  1.. 檔案名稱 . 2.. 擁有的標籤 . 3.. 編輯標籤的方塊 . 4.. 確認按鈕 . 標籤邊欄 . „.   新增:將選取的檔案全部加上此標籤  18 .  .

(30) z. 邊欄下 下方  „. 全 全選按鈕:為 為選取所有圖 圖片。但是 是當你已有選 選取時,會 會變成是反 反向選擇。.   詳細的使用 用方法於附 附錄二說明。 . 3.3.2. 資料 料庫設計  . 本研究使用 用 MySQL 來做為資料 來 料庫,資料庫 庫中主要存 存放三個表格 格,分別為 為標籤與檔 案的 的關係(Tag‐F File Relatio on)、檔案資 資訊(File)及 及標籤資訊 訊(Tag),如圖 圖  3.3.3 資料庫架構 資 圖所 所示。首先,為每一個 個檔案記錄其 其編號(Filee id)和儲放 放於系統中的 的路徑(Filee path),每 每 一個 個標籤有編號 號(Tag id)、 、標籤名稱((Tag name))和標籤被使 使用的次數 數(Used)。當 當使用者為 為 某一 一檔案加上一 一個標籤時 時,會建立一 一筆標籤與 與檔案的關係 係(Tag‐File Relation),由於不限 限 定一 一個檔案可以 以有幾個標 標籤或一個標 標籤可以標 標多少個檔案 案,所以標 標籤與檔案的 的關係對於 於 檔案 案或標籤都是 是多對一的 的關係。標籤 籤與檔案的 的關係裡存放 放編號(Relation id)、對應的檔 案(F File id)、對 對應的標籤(T Tag id)及最 最後修改這個 個關連的時 時間(Accesss time)。 .   圖  3.3.3 . 資料庫 庫架構圖 .   建立起資料 料庫後,在 在系統標籤與 與檔案關連 連讀/寫的這 這個單元內,使用 SQL L 語法來對 表格 格做合併及查 查詢的動作 作,取出目前 前所需的資 資料提供給系 系統使用,以便後續的 的計算及呈 呈 現。 . 3.3.3. 資訊 訊內容的選 選擇 . 本研究使用 用圖片來做 做為實驗時所 所用的資訊 訊內容,系統 統本身可支援 援所有的檔 檔案,例如: 影片 片、音樂、圖 圖片、文件 件…等的檔案 案,由於為了 了簡化實驗 驗的流程,以及降低後 後續分析的 的 複雜 雜度,我們選 選擇了圖片 片當做為後來 來實驗的內 內容,原因有 有下列二點 點:  1.. 選擇圖片當 當資訊內容 容不會影響搜 搜尋的方式 式或結果。因 因為在系統 統中要做搜尋 尋的動作, 19.  .

(31) 不會因為圖片有縮圖而與文字檔有差異,原因在於使用者於系統中不論是哪種格式 的檔案,皆利用標籤本身及其關連標籤來做搜尋,並非由縮圖來做判斷、搜尋,所 以以圖片為內容不會使結果有所偏頗。  2.. 圖片本身除了檔名之外,並不包含任何文字,所以在使用現有的搜尋系統,例如: 作業系統內建的搜尋、Google Desktop Search…等,使用關鍵字為搜尋基礎的系統 難以找到使用者所需要目標,若本研究的系統可以對圖片這類型的檔案做出不錯的 成果,相信可以解決目前系統遇到的問題。    系統使用 Python 提供的 API 來讀入圖片,處理作業系統做 I/O 的問題,並秀出於. 使用者介面中。 . 3.3.4. 系統功能計算 . 此為本研究最主要的部分,實作出之前討論的概念設計,分為三個部分:相關標籤 計算、標籤排名、檔案排序,以下以各個小節詳細說明實作部分。  3.3.4.1. 相關標籤計算 . 同一個檔案上,若有標上二個以上的標籤,就認定他們互為相關標籤。二個標籤同 時標記一個檔案時,則將此對標籤關係度加一,同時出現於愈多檔案上,則此二標籤關 係度愈高。當使用者選定 A 標籤時,系統介面將會列出 A 標籤的所有相關標籤,依照與 A 標籤的關係度愈高,則在相關標籤排愈前面(也就是愈左邊),如圖  3.3.2 左上方的虛 線框內。  3.3.4.2. 標籤排名 . 如同前面 3.3.2 節所說的,我們為每一個標籤記錄使用的次數,每當這個標籤被標 到某個檔案上一次,就將它的使用次數加一,使用次數愈多表示使用者愈常用到這個標 籤,依常用度來為標籤排名。在系統介面(圖  3.3.2)的右下方,將排序好的標籤放於此 處,方面使用者操作。  3.3.4.3. 檔案排序 . 當使用者選定標籤後會在目前標籤欄目上顯示出來,介面下方會秀出所有使用此標 籤的檔案,而順序的先後依這個檔案最後標上此標籤的時間來排序,愈晚標上此標籤的 檔案表示近期才對其做處理和反芻,對記憶理論來說還位於短期記憶內,所以將之排於.  . 愈上方,加速使用者存取。 . 20   .

(32) 四、 實驗方法與結果分析  4.1. 研究對象  研究對象為磐石高中三年級的學生,參與本次研究的有二個班級,使用資料夾的學. 生有 27,使用個人知識重整系統的學生有 37 人。第一階段完成實驗的有效樣本數,資 料夾組有 21 人,新系統組有 37 人。第二階段完成實驗及問卷的有效樣本數,資料夾組 有 17 人,新系統組有 32 人。 . 4.2. 研究工具  在研究工具上我們使用三種工具,最主要的工具是第三章所提到的個人知識重整系. 統,其他二個工具一個是在使用資料夾做實驗時,記錄使用者動作的小程式(4.2.1 節), 以及最後做實驗者背景調查的問卷。以下將對剩下二種工具進行說明。 . 4.2.1. 記錄結構建立及搜尋的過程 . 在實驗者使用原作業系統的資料夾來整理檔案時,為避免因電腦效能造成螢幕錄影 的失敗,所以採用一個自己寫的小程式,記錄實驗者資料夾的建立、資料夾名稱的變動、 檔案的搬移,以及進出資料夾的記錄。  個人知識重整系統中會在使用者建立標籤、使用標籤,以及使用關連圖片時,自動 記錄下這些歷程。 . 4.2.2. 背景調查問卷 . 主要詢問實驗者的背景,包括使用網路的習慣,常瀏覽的網站,以及是否有使用過 網路上標籤的經驗。問卷詳細內容置放於附錄中。 . 4.3. 實驗流程 . 1.. 選兩個組成相近的班級,一班使用一種方式來做。 . 2.. 給予實驗者 60 張圖片,圖片內容將平均分佈於各類別。 . 3.. 請實驗者使用作業系統內建的資料夾系統,使用 Windows XP 的縮圖模式,為圖片 做分類整理。以程式記錄過程的方式,記下實驗者建立資料夾或搬移檔案的次序。 . 4.. 請實驗者使用個人知識重整系統,為圖片做分類整理。系統內會自動記錄下實驗者 21 .  .

(33) 為檔案標上 上標籤的順 順序。  5.. 請實驗者從 從建立的資 資料夾中找出 出某張特定 定的圖,不會 會明確的指 指出哪張圖,但會給予 予 較模糊的提 提示。例如 如:圖的右邊 邊有許多紅 紅色的花。. 6.. 同上,但是 是請實驗者 者用標籤系統 統來找。 . 7.. 以程式記錄 錄的方式,記下實驗者 者尋找圖片 片的過程。.   z. 資料夾分類 類組 . 課堂說 說明. 圖檔整 整理. ‧約10分 分鐘 ‧講解資 資料夾整理 理檔案的操作 作, 以及將 將進行的任務 任務. ‧約255分鐘 ‧使用 用資料夾為圖 圖檔做整理 理 (建立 立資料夾、移 移動檔案… …等). 特定圖 圖片找尋 尋 經過二天以 經 以上,. ‧約5分 分鐘 ‧在所 所建立的資料 料夾裡找尋 尋特 定檔案 案. 進入 入實驗第 第二階段. 用途圖 圖片找尋 尋. 問卷調 調查. ‧約10分 分鐘 ‧說明一 一種用途,讓學生在所 所 建立的 的資料夾裡找 裡找尋其認為 為 符合的 的檔案. ‧約100分鐘 ‧簡單 單詢問認為其 其符合的原 原因, 並調查 查一點使用 用電腦網路的 的 經驗  . z. 標籤分類組 組 . 22  .

(34) 課堂說 說明. 圖檔整 整理. • 約15分 分鐘 • 講解個 個人知識重整 整系統介面 面 及操作 作,以及將進 進行的任務 務. • 約25分 分鐘 • 使用個 個人知識重 重整系統為圖 圖 檔做整 整理(標上標 標籤). 特定圖 圖片找尋 尋 經過二 二天以上 上,進入實 實 驗 驗第二階 階段. • 約15分 分鐘 • 使用個 個人知識重 重整系統找尋 尋 特定檔 檔案. 用途圖 圖片找尋 尋. 問卷調 調查. • 約15分 分鐘 • 說明一 一種用途,使 使學生操作 作 個人知 知識重整系統 統來找尋其 其 認為符 符合的檔案. • 約10分 分鐘 • 簡單詢 詢問認為其 其符合的原因 因, 並調查 查一點使用 用電腦網路的 的 經驗  . 4.3.1. 搜尋 尋任務說明 明 . 請使用者從 從已分類完 完成的結構當 當中,尋找 找指定的圖片 片。  詳細題目請 請參考附錄 錄 A。 . 4.4. 實驗 驗結果與 與分析  在這一節中 中,我們將 將會分析比較 較二種方式 式搜尋到目標 標檔案的效 效率、各自結 結構建立的 的. 風格 格、二種結構 構的搜尋風 風格差異,以 以及個人與 與整體間是否 否存在某些 些認知的共識 識。一開始 始 將說 說明系統的使 使用狀況,做為實驗結 結果的背景 景介紹。 . 4.4.1. 系統 統使用狀況 況 . 為了證明系 系統的各項 項功能及特性 性,有被使 使用者所運用 用,所以我 我們將使用下 下列統計資 資 料來 來說明。  23  .

(35) 下標籤的情形  由圖  4.4.1 我們可以看到,大部分的使用者對每張圖片會加 3 個左右的標籤,證明 有發揮標籤的特性–對單一資訊可用多個標籤來描述它。  16 14 圖 12 片 10 數 8 張. 4. ). (. 6 2 0 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 圖片擁有的標籤數  . 圖  4.4.1 . 每張圖片平均擁有標籤數的分佈圖,橫軸代表每張圖片擁有的標籤數,縱軸代表擁有特定標籤. 數的圖片平均有幾張,結果的高峰點顯示一張圖片有 3 個標籤的情形最多 . 功能使用率  „. 使用相關圖片的人有  21 人,占標籤組有效樣本中的  65.6% . „. 使用相關標籤的有  7 人,占標籤組有效樣本中的 21.8% . 4.4.2. 搜尋效率 . 針對使用二種方式來找尋目標圖片的時間以及步數,我們可以來做一個比較,證明 使用哪種方式可以有效率地找到想要的資訊。  使用時間  由圖  4.4.2 我們可以看出使用標籤的系統可以比資料夾系統更快速地找到所想找的 圖片,證明個人知識重整系統的確較能幫助人們做尋找。證實藉由類似人腦中陳述性網 路的節點激發所設計出來的系統,確實可以幫助人們做有效率的搜尋。 . 24   .

(36) 資料夾 350. 299. 300. 所 需 250 時 200 間 150 ( 秒. 標籤. 203. 196 138. 100. 70. 9 59. 1 120. 102. ). 50 0 假的貓 貓. 吃東 東西的小動 動物. 小 小船. 皮卡 卡丘. 搜尋 尋目標圖片 圖  4.4.2 . 搜尋目 目標圖片所需的 的時間圖 .   將上述圖表 表轉換成表 表格,可以看 看到標籤的 的所需時間最 最少可縮減 減為資料夾的 的六成或減 減 少更 更多。  假的 的貓 吃東西 西的小動物 物. 小船. 皮卡丘 有 有效樣本數 數. 資料 料夾所需時間 間(s). 138.45. 299.00. 195.56. 203.09. 17. 標籤 籤所需時間(s). 59.003. 70.23. 101.73. 119.67. 32. 標籤 籤/資料夾時間 間比 42.664% 表  4.4.1 . 2 23.49%. 52.02% 58.92%. 搜尋時 時間效率比較表 表 . 使用 用步數  若將進入一 一個資料夾 夾算做一步,將使用一 一個標籤也算 算做一步,我們可以得 得到對於每 每 個搜 搜尋任務所需 需的步數,結果統計於 於圖  4.4.3。我們可以 以看到使用標 標籤系統所 所需的步數 大部 部分比資料夾 夾來得多,由於標籤可 可對圖片做 做較特殊化的 的描述,所 所以每個標籤 籤所標記的 的 圖片 片較少,需使 使用較多的 的標籤來找到 到檔案。但 但即使步數上 上較多,在 在整體的搜尋 尋時間上還 還 是領 領先資料夾。 . 25  .

(37) 資料夾. 標籤. 10 所 需 步 數. 8. 步. 2. 9.0 . 6. 4.8 . 4. 6.3 . 5.4  4.1 . 4.0 . 3..8 . 1.7 . 0 假的貓. 吃東西 西的小動物 物. 小船 船. 皮卡丘. 尋找目 目標圖片   圖  4.4.3 . 搜尋目 目標圖片所需的 的步數圖 .   將上述圖表 表轉換成表 表格,可以看 看到標籤的 的所需步數平 平均而言比 比資料夾來得 得多。  假的 的貓 吃東西 西的小動物 物. 小船. 皮卡丘. 有效樣本 本數. 資料 料夾所需步 步數. 4.8. 3.8. 4.0. 1.7. 17. 標 標籤所需步數 數. 4.1. 5.4. 9.0. 6.3. 32. 標籤 籤/資料夾步數 數比 86.993% 表  4.4.2 . 143.81%. 225.00% % 375.56%. 搜尋步 步數比較表 . 4.4.3. 結構 構建立風格 格 . 4.4.3 3.1. 結構 構分析 . 以下就二種 種方式來觀 觀察其結構:  資料 料夾結構  大部分的使 使用者結構 構,都像下面 面圖  4.4.4 一樣,深度 度為 1~2 層 層的樹狀結構 構。Test 為實 實驗時的根目 目錄,底下 下為使用者所 所建立的子 子目錄。 . 26  .

(38)   圖  4.4.4 . 資料夾結構 . 標籤結構  標籤的結構就因個人風格不同,而產生出不小的差異,以下就某幾大類的結構提出 說明:   .  . 27   .

(39) (1) 連結度高的網路  原本零散的觀念透過某些共通的標籤將各個小網路連起來,從任一節點開始可以到 達大部分的節點,呈現大部分相連的狀況,如圖  4.4.5。 .   圖  4.4.5 . 連結度高的標籤網路,此為某一受測者所建立的標籤網路,大部分的節點皆連結在一起,代表. 對於不同圖片間有相同的標籤,一張圖片含有多個標籤 .  .  . 28   .

(40) (2) 單點散佈的網路  存在著一個一個節點,彼此沒有連結,散佈在網路中。此狀況出現在使用者把標籤 運用成類似資料夾的用法時,對每一張圖片只下一個標籤來分類,所以不存在著標籤間 的關係,如圖  4.4.6。 .   圖  4.4.6 . 單點散佈的標籤網路,此為某一受測者所建立的標籤網路,大部分的節點之間無相連,代表此. 受測者大部分圖片只下一個標籤 .  .  . 29   .

(41) (3) 區塊分佈的網路  當使用者對於單張圖片下多個標籤,但是不同圖片間不含有相同的標籤時,就會出 現區塊分隔的情況,如圖  4.4.7。 .   圖  4.4.7 . 區塊分隔的標籤網路,此為某一受測者所建立的標籤網路,節點相連成一個個的區塊,區塊與. 區塊間無相連,代表此受測者不同圖片間很少下相同的標籤 . 4.4.3.2. 結構統計資料 . 以下對於使用者建立結構的統計資料做說明:  資料夾和標籤的使用比率和使用範圍  首先說明圖  4.4.8 的二個座標軸: . 30   .

(42) z. 使用比率- -指的是多 多少百分比的 的使用者有 有使用此標籤 籤或資料夾 夾 . z. 使用範圍- -平均使用 用多少個標籤 籤在檔案(圖 圖片)上面, ,或是平均 均一個資料夾 夾包含幾個 個 檔案。  發現不論資 資料夾或標籤 籤都存在有 有高使用比率 率的例子,像是圖右上 上角的「動 動 我們可以發. 物」資料夾有 88.24%的使 8 使用者有建 建立,和圖左 左上角的標 標籤「風車」 」有 94.59% %的使用者 者 有使 使用此標籤,代表二種 種方法都存在 在認知的共 共識或偏好的 的分類。二 二種方式的分 分佈從高到 到 低的 的使用比率都 都有。但是 是很明顯地, ,幾乎每個標 標籤平均只 只會加到 4 個以下的圖 圖片上面, 說明 明標籤描述較 較精確的部 部分。大部分 分每個資料 料夾都包含 3 張以上的 的圖片,因為 為使用者傾 傾 向用 用較一般化的 的概念去建 建立資料夾,好包含多 多項待整理的 的圖片。 . 使 使用比率 率與使用 用範圍的 的分佈. 風 風車  100% 使 用 比 率 %. 動物 . 90% 80% 70%. ( 60% 50% 標籤. 40%. 資料夾. 30% 20% 10% 0% 0. 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13 3. 14. 15. ). 多 少 比 例 的 人 使 用 此 關 鍵 字. 使用範圍 (把此關鍵字 字用在多少檔案 案上).   圖  4.4.8 . 使用比 比率與使用範圍 圍的分佈圖. 特定 定圖片在二種 種方法上的 的差異  例如說下圖 圖  4.4.9,我 我們將分析 析其資料夾與 與標籤所使 使用詞彙的差 差別。 . 31  .

(43)   圖  4.4.9 . 特定圖 圖片 . 在資料夾使 使用的名稱 稱上面,由於 於一張圖片 片只能存在於 於一個資料 料夾中,所以 以統計其所 所 在的 的資料夾,我 我們可以畫 畫出圖  4.4.1 10。大部分 分的人傾向使 使用較概觀 觀的詞彙-動 動物來分類 類 這張 張圖,有少部 部分人會直 直接使用此圖 圖片的主題 題「企鵝」來 來建立一個 個新的資料夾 夾,另外還 還 有少 少數使用鳥和 和大自然來 來分類的。 4.5% %. 4.5%. 9.1% %. 動物 企鵝 鳥 大自然 81.8%.   圖  4.4.10  特定圖 圖片的資料夾名 名稱使用統計 計 . 在標籤的名 名稱上,因為 為標籤可以 以對一張圖片 片下多個標 標籤,所以我 我們以長條圖 圖來說明, 見圖 圖  4.4.11。我 我們可以看 看到標籤「企 企鵝」遙遙 遙領先其他標 標籤,使用 用者傾向使用 用直接描述 述 圖片 片主題的方法 法來為圖片 片下標籤,反 反觀剛才在 在資料夾名稱 稱使用最多 多的「動物」 」,反而只 有 10.8%使用者 者會用它,因為它是個 個比較一般 般化概括的詞 詞彙,不符 符合使用者在 在挑選標籤 籤 描述 述時的直覺描 描述。 . 32  .

(44) 80% 使 用 標 籤 的 人 數 比 率. 70%. %. 10%. 70 0.3%. 60% 50% 37.8%. 40%. 27.0%. 30%. 1.6% 21. 20%. 13.5%. (. 10.8%. 8.1%. 5.4%. ) 0% 企 企鵝. 南極. 雪地. 雪. 可愛. 動物. 小 小企鵝. 冷. 標籤.   圖  4.4.11  特定圖 圖片的標籤名稱 稱使用統計. 4.4.4. 搜尋 尋風格 . 資料 料夾搜尋  我們舉一個 個例子來說 說明,像下圖 圖  4.4.12 是使用者所 是 所建立出來的 的資料夾結 結構,他在 尋找 找「吃東西的 的小動物」時,先找了 了「人」、 「車」 「 、「花」 」、「食物」、「飛機」的 的資料夾, 找不 不到後又反覆 覆回去找「 「食物」、「飛 飛機」還是 是找不到,接 接著進入「 「動物」底 底下的「狗」 」 和「鳥」都找不 不到後,回 回到「動物」 」的資料夾 夾才找到目標 標的圖片。大部分其他 他的使用也 也 大致 致上是類似的 的過程。 .   圖  4.4.12  資料夾 夾搜尋範例 . 標籤 籤搜尋  同樣舉一個 個例子來說 說明,尋找的 的圖片為「 「吃東西的小 小動物」,使 使用者先從 從「狗」這 個標 標籤來搜尋,在圖  4.4.13 上可以 以看到此標籤 籤,尋找連 連結狗這個節 節點旁的連 連接線段, 也就 就是含有「狗 狗」這個標 標籤的圖片,結果找不 不到要的圖,點選一、二張標籤「狗」的圖 圖 片的 的相關圖片時 時,同時激 激發該圖片其 其他的標籤 籤,進行內容 容找內容的 的搜尋,還是 是找不到。 . 33  .

數據

表  2.3.1  三個不同的處理層次....................................................................................... 11  表  4.4.1  搜尋時間效率比較表....................................................................................... 25  表  4.4.2  搜尋步數比較表.................
圖  4.   少更 資料 標籤 標籤 表  4. 使用 個搜 大部 圖片 是領 所需時間(秒) 4.2  搜尋目 將上述圖表更多。 料夾所需時間籤所需時間( 籤/資料夾時間4.1 搜尋時用步數 若將進入一搜尋任務所需部分比資料夾片較少,需使領先資料夾050100150200250300350所需時間(秒) 目標圖片所需的表轉換成表假的間(s)138s) 59.0間比  42.6時間效率比較表一個資料夾需的步數,夾來得多,使用較多的。 13859假的貓 的時間圖  表格,可以看 的貓  吃東西.45 03
圖  4.   資料 標 標籤 表  4. 4.4. 4.4.3 資料 為實 所需步數步 4.3  搜尋目 將上述圖表料夾所需步 標籤所需步數 籤/資料夾步數4.2 搜尋步3 結構3.1 結構以下就二種料夾結構 大部分的使實驗時的根目0246810所需步數步 目標圖片所需的表轉換成表假的步數 4.數 4.數比  86.9步數比較表  構建立風格構分析 種方式來觀使用者結構目錄,底下4.8 4.1 假的貓 的步數圖  表格,可以看 的貓  吃東西8 1 93% 1格 觀察其結構構,都像下面下為使用者所3.吃東
圖  4. 在的 這張 有少 圖  4. 見圖 圖片 有 1 描述 4.9  特定圖 在資料夾使的資料夾,我張圖,有少部少數使用鳥和4.10  特定圖在標籤的名 圖  4.4.11。我片主題的方法0.8%使用者述時的直覺描9.1%4.5% 圖片  使用的名稱我們可以畫部分人會直和大自然來 圖片的資料夾名名稱上,因為我們可以看法來為圖片者會用它, 描述。 %% 4.5%   稱上面,由於畫出圖  4.4.1 直接使用此圖來分類的。名稱使用統計為標籤可以看到標籤「企 片下標籤,反因為它是個81.8% 於一張圖片
+4

參考文獻

相關文件

流通性 流通性、 、 、基礎性 、 基礎性 基礎性、 基礎性 、 、 、重要性 重要性 重要性

3.結論-(1)記憶的歷程分為短期記 憶、長期記憶(2)短期記憶經選擇 與複習成為長期記憶(3)短期記憶

使用人工智慧框架基礎(Frame-based)的架構,這些努力的結果即為後來發展的 DAML+OIL。DAML+OIL 是 Web Resource 中可以用來描述語意的 Ontology 標 記語言,它是以 W3C

從視覺藝術學習發展出來的相關 技能與能力,可以應用於日常生 活與工作上 (藝術為表現世界的知

在基礎教育階段,學生通過視覺藝術評賞、視覺藝 術創作和視覺藝術知識 三個學習範疇

文化溯尋(知識基礎) 九龍城 歷史淵源 4課節 文化稽考(知識基礎) 九龍城 地文誌、地域考 4課節 文化內韻(知識基礎) 九龍城 特色意義

 培養具有檔案學基礎知識與文化知識,掌握現代資訊技術的基 本技能,能在檔案館、國家機關和企事業單位的檔案機構、資

電腦內部是使⽤用位元 (Bit) 這個基本單位來表⽰示資料 並儲存於記憶單元 (記憶體) 或輔助記憶單元 (硬碟) 中。.. 每個位元只可以表⽰示