• 沒有找到結果。

智慧型手機的使用者行為模式分析 - 政大學術集成

N/A
N/A
Protected

Academic year: 2021

Share "智慧型手機的使用者行為模式分析 - 政大學術集成"

Copied!
77
0
0

加載中.... (立即查看全文)

全文

(1)國立政治大學資訊科學系 Department of Computer Science National Chengchi University. 碩士論文 Master’s Thesis. 立. 政 治 大. ‧ 國. 學. 智慧型手機的使用者行為模式分析. ‧. Behavior Analysis Based on Smart-phone User Logs. n. er. io. sit. y. Nat. al. v i n C研究生:許志毓 hengchi U 指導教授:廖文宏. 中華民國一○二年十一月 November 2013.

(2) 致謝 能夠完成這篇論文首先感謝身邊所有關心我的人,讓我有充分的 自主空間來思考有關論文的目標,終於在歷經了許多次修改後完成。 其中特別感謝廖文宏老師兩年間總是不厭其煩的給予我指導,總 是讓我受益良多,不論在學術、思考或是做人的哲學上,廖老師都是 一位受人尊敬的長輩,此外感謝鄭宇君老師與紀明德老師兩位口委,. 政 治 大. 提供我許多寶貴的意見,讓我的論文更加完整。. 立. 感謝 VIPL 的每一位同學,感謝嘉瑜、致翔總能給予我很好的建. ‧ 國. 學. 議、甚至陪我一起去單車環島、爬山,如果沒有你們將不會有這些寶. ‧. 貴的經驗,感謝明慶無私的為 Lab 分擔了許多的事務,減輕大家的負. Nat. io. sit. y. 擔,感謝冠智、政明、建堡、正和學長在我剛上研究所感到徬徨的時. er. 候給我一盞明燈,感謝苡甄、苡萱、婷雅、育如、家禎學妹在我論文. al. n. v i n Ch 危急時刻給予我關懷與鼓勵,特別感謝柏銘、仁和學長給我明確的方 engchi U. 向,讓我可以不遲疑地往畢業的路邁進,感謝 Xmind 的蕙盈、曉青、 俊輝、宜婷總是為計畫貢獻付出,感謝網球社的朋友總是陪我打球運 動,感謝奕誠讓我能有 lab 之外的休息處,最後感謝社資中心的大家, 總是滿懷著笑容為我加油打氣,如果沒有大家平時的容忍與幫助,我 想我需要花更多時間完成論文。謝謝所有在背後支持我的人。 志毓 於台北 2013 年仲秋 1.

(3) 智慧型手機的使用者行為模式分析. 摘要. 通訊技術的演化與智慧型手機的普及,改變了人際溝通的方 式與手機的應用情境,在此變動快速的行動運算時代,欲研 究探討使用者的行為模式,必須建立一個包含硬體、軟體與 治. 政. 大. 立 使用者社群的實驗平台,以量化的數據補強質性的觀察,因. ‧ 國. 學. 此,本論文將以現有之平台為基礎,強化其功能與易用性,. ‧. 方便其他研究者觀察資料的概況,並擷取符合某些條件之資. Nat. io. sit. y. 料,此外,我們採用 3-gram 之應用程式序列,作為行為模. er. 式(behavior pattern)之特徵定義,配合不同的應用程式被使. al. n. v i n Ch 用之頻率,在相似度比較上進行不同比重的加權,根據實驗 engchi U 結果,可大致對使用者進行初步的分類,亦可利用此指標, 針對已分類過的使用者更進一步探討之間的歧異程度。. 關鍵字: 行為模式、使用習慣、特徵相似度、序列比對. 2.

(4) Pattern Analysis of Smart phone User Behaviors. Abstract. The rapid evolution of information technology and prevalence of smart-phones have changed the way people communicate. To effectively observe and investigate user behavior in this new era of mobile. 政 治 大. computing, an experimental platform that consists of hardware devices,. 立. software applications and user groups is essential. In this thesis, we. ‧ 國. 學. enhance and extend the functions of a user log collection and analysis system to facilitate quick overview of the recorded data and allow. ‧. flexible query/extraction of desired data segments for further processing.. sit. y. Nat. In addition, we employ 3-gram app log sequence as the main feature to. er. io. characterize user behavior. A similarity measure that takes into account. n. a the relative app usage frequency has been defined tov compare and classify users and their usage. i l C n h eExperimental patterns. n g c h i U results. indicate that this. measure can effectively distinguish users of different traits given enough time period of observation.. Keywords: behavior pattern, app usage, feature similarity, sequence matching. 3.

(5) 目錄 1.. 引言 ................................................................................................................. 6. 2.. 相關研究 ....................................................................................................... 11. 3.. 資料蒐集平台介紹 ....................................................................................... 14 3.1. User ............................................................................................................... 16. 3.2. Log Collector Service ..................................................................................... 16. 3.2.1.. Service dataflow........................................................................................ 17. 3.2.2.. Log Table in Remote Database ................................................................. 18. 3.2.3.. Log Collector Service Limited .................................................................... 19. 3.3.1.. 3.3.3.. 立. Log Charting Service.................................................................................. 20. 學. 3.3.2.. 政 治 大. Log Monitor Platform .................................................................................... 20. ‧ 國. 3.3. Log Query and List Website ...................................................................... 21 Log Real-time Monitor .............................................................................. 23. ‧. 研究方法 ....................................................................................................... 24. Nat. y. 4.. 4.2.. 定義使用者特殊的行為模式作為特徵 ....................................................... 30. n. al. er. sit. 取標準差變異數來代表資料的特徵 ........................................................... 28. io. 4.1.. i n U. v. 實驗結果與討論 ........................................................................................... 43. 5.. Ch. engchi. 5.1. Log Charting Service ...................................................................................... 43. 5.2. Log Query Service .......................................................................................... 46. 5.3. Log Real-time Monitor .................................................................................. 48. 5.4. 特徵分析 ....................................................................................................... 53. 6.. 結論 ............................................................................................................... 70. 7.. 參考文獻 ....................................................................................................... 72. 0.

(6) 圖目錄 圖 1-1 OUR MOBILE PLANET 統計台灣地區的智慧型手機普及率 ..... 6 圖 3-1 伺服器、手機、使用者、軟體的架構 ........................................ 14 圖 3-2 Android SDK 所提供的 logcat ....................................................... 17 圖 3-3:User 產生的 Log 會先存在 Mobile DB 中,之後再透過 3G/WiFi 將資料傳送到遠端的 Database 上,研究者之後可以針對這些 Log 進行查詢.............................................................................................. 18 圖 3-4 資料庫中的欄位 ............................................................................. 19. 政 治 大 圖 3-6 以月為單位的全體使用者的 log 分布圖 ...................................... 21 立 圖 3-5 所有使用者在一天內所產生的 log 分布圖 .................................. 20. ‧ 國. 學. 圖 3-7 某位使用者的 Entertainment 類型的應用程式分佈..................... 21 圖 3-8 Monitoring System 的登入畫面 ..................................................... 22. ‧. 圖 3-9 研究者查詢 log 的畫面 .................................................................. 22. sit. y. Nat. 圖 3-10 研究者查詢某一使用者某段時間內 log 的地理位置 ................ 22. al. er. io. 圖 3-11 Real-time Log Monitor 研究者可以藉由觀察即時產生的 Log 資. v. n. 料,以得到特定操作序列所產生的行為模式.................................. 23. Ch. engchi. i n U. 圖 4-1 某位使用者的應用程式使用類型分佈 ......................................... 26 圖 4-2 在一段時間內搜尋事先定義的行為模式 .................................... 27 圖 4-3. User12 的 Social 類別的每天的 Log 數量分佈 ........................ 28. 圖 4-4. User10 的 facebook 每天使用量 ................................................. 29. 圖 4-5. User6 的 facebook 每天的使用量 ............................................... 30. 圖 4-6 對於使用者日常生活 log 編號的流程圖 ..................................... 33 圖 4-7 連續兩個 log 當作特徵示意圖 ..................................................... 34 圖 4-8 以三筆 log 資料為行為模式的單位,統計出所有模式的個別出 現的次數.............................................................................................. 38 1.

(7) 圖 4-9 將 Training Data 與 Test Data 中有相同的行為模式,另外提出來 做加權處理.......................................................................................... 40 圖 4-10 計算 Training data 與 Test data 中不同的行為模式 .................... 40 圖 4-11 計算 Training data 與 Test data 中相同的行為模式 ................... 41 圖 4-12 特徵相似度的計算步驟 .............................................................. 42 圖 5-1 User1 所使用的 3 種通訊 app 的數量 ........................................... 47 圖 5-2 User2 所使用的 3 種通訊 app 的數量 ........................................... 47 圖 5-3 四位使用者的免費簡訊程式使用量 ............................................. 47. 政 治 大 圖 5-5 Left:手動輸入號碼步驟以及對應產生的 Log 流程圖 Right:手動 立 圖 5-4 Real-time Log Monitor .................................................................... 48. 輸入號碼手機畫面.............................................................................. 49. ‧ 國. 學. 圖 5-6 Left:經由通訊錄進行通話的步驟以其對應產生的 Log 流程圖. ‧. Right:手機通訊錄畫面........................................................................ 50. y. Nat. 圖 5-7 經由通話記錄進行通話的步驟以其對應產生的 Log 流程圖 Right:. er. io. sit. 手機通話記錄畫面.............................................................................. 50 圖 5-8 經由我的最愛進行通話的步驟以其對應產生的 Log 流程圖 Right:. al. n. v i n 我的最愛聯絡人畫面.......................................................................... 51 Ch engchi U. 圖 5-9 經由 widget 進行通話的步驟以其對應產生的 Log 流程圖 Right: widget 畫面 .......................................................................................... 51 圖 5-10 User 5,6,7,9,10~15 與其餘使用者比較直方圖 .......................... 58 圖 5-11 User10 前半資料作為 Training Data 與其餘使用者後半資料作為 Test Data 比較直方圖 ......................................................................... 61 圖 5-12 前半資料為 Training Data 與最近 2 個月資料作為 Test Data 比 較直方圖.............................................................................................. 65. 2.

(8) 圖 5-13 User10 前半資料為 Training Data 與所有使用者後半資料作為 Test Data .............................................................................................. 66 圖 5-14 User11 前半的資料為 Training Data,所有使用者的最近 2 個月 資料為 Test Data ................................................................................. 67. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 3. i n U. v.

(9) 表目錄 表格 4-1 左: User10 全部時間的標準差 中: User10 前半時間的標準差 右: User10 後半時間的標準差 ......................................................... 29 表格 4-2 左: User6 全部時間的標準差 中: User6 前半時間的標準差 右: User6 後半時間的標準差 ................................................................... 30 表格 4-3 將使用者使用過的應用程式按照次數排列 ............................ 31 表格 4-4 對所有使用者用過的應用程式作編號 .................................... 31 表格 4-5 User10 真實的 user log 串流 ...................................................... 32. 政 治 大 表格 4-7 user10立 出現次數較多的行為模式............................................. 37. 表格 4-6 將 User10 原始的 UserLog 資料流編碼 ................................... 32. user10 前十名的行為模式由多排序到少............................... 37. 表格 4-9. user15 前十名的行為模式由多排序到少............................... 38. ‧. ‧ 國. 學. 表格 4-8. 表格 4-10 (N=5 的計算例子) .................................................................... 39. sit. y. Nat. 表格 5-1 Usage comparison for the three apps ........................................... 46. n. al. er. io. 表格 5-2 撥出模式步驟,觸發的 Application、Activity、Log 數量比較. v. .............................................................................................................. 52. Ch. engchi. i n U. 表格 5-3 User10 全部資料出現次數較多的行為模式 ............................ 54 表格 5-4. User10 前半部分的資料 ......................................................... 54. 表格 5-5. 左:User10 全部特徵之前五名的前項除後項 中:User10 前. 半特徵之前五名的前項除後項. 右:User10 後半特徵之前五名的. 前項除後項.......................................................................................... 55 表格 5-6 User11 出現次數較多的行為模式 ............................................ 55 表格 5-7 左:User11 全部特徵之前五名的前項除後項 中:User11 前半 特徵之前五名的前項除後項. 右:User11 後半特徵之前五名的前. 項除後項.............................................................................................. 56 4.

(10) 表格 5-8. User5,6,7,9,10~15 的前半資料作為 Training Data 與其他部分. 使用者的後半資料作為 Test Data 的相似度 .................................... 57 表格 5-9 User7 的 Training Data 與 Test Data .......................................... 59 表格 5-10 User7 的 Training Data 與 User9 的 Test Data ......................... 59 表格 5-11 User9 等化過後的 Test Data ..................................................... 60 表格 5-12 User10 的 Training Data 與 User5 的 Test Data ....................... 62 表格 5-13 取前 5%使用次數最多的 app 以前半資料與後半資料的相似 度(user5~15) ........................................................................................ 63. 政 治 大 度(user16~25) ...................................................................................... 64 立. 表格 5-14 取前 5%使用次數最多的 app 以前半資料與後半資料的相似. User5,6,7,9~15 的最近 2 個月 Data 作為 Test Data,Training. 學. ‧ 國. 表格 5-15. Data 為所有使用者前半的資料 Data ............................................... 65. ‧. 表格 5-16 User10 前半的資料為 Training Data 與其最近 2 個月資料為. io. sit. User11 前半的資料為 Training Data 與其最近 2 個月資料為. er. 表格 5-17. y. Nat. Test Data .............................................................................................. 67. Test Data .............................................................................................. 68. n. al. Ch. engchi. 5. i n U. v.

(11) 1.. 引言. 在科技進步的現代,手機快速的發展,通訊建設的進步,讓智慧型手機的應 用程式成為趨勢。近幾年來,有越來越多的人開始使用智慧型手機,圖 1-1 為 OUR MOBILE PLANET 統計台灣地區從 2011-2013 年的智慧型手機普及率,截 至 2013 年,已經超過五成。. 台灣地區智慧型手機普及率 60 50. 立. 30. 2012. 2013. 年份. n. al. er. io. sit. 2011. y. Nat. 0. ‧. 10. 學. 20. ‧ 國. %. 40. 政 治 大. i n U. v. 圖 1-1 OUR MOBILE PLANET 統計台灣地區的智慧型手機普及率. Ch. engchi. 隨著智慧型手機應用程式種類和數量的增加,使用的模式也隨之改變,從僅 僅是一個聲音通訊的裝置,轉變為具備相當運算能力的小型電腦,搭配豐富的周 邊與感測裝置,提供多元化的服務。舉例來說,絕大多數的智慧型手機都配置可 以提供高度體驗遊戲、影片、聲音、照相體驗的高解析度螢幕;無線網路服務如 存取網頁、地圖定位和手機上的社群網路;衛星定位系統服務提供了手機導航、 配合無線網路而可以更為精準的定位服務,例如照相時記錄當時場景的經緯度、 facebook 打卡時用經緯度來推薦使用者目前所處的場所、行車導航軟體也用位置 6.

(12) 來計算使用者目前的行車時速來提出超速警告;重力感應器或稱作線性加速度計, 可以提供速度和位移的資訊,例如跑步記數應用程式,利用跑步中使用者雙腳離 地的向上加速度和落下的加速度與平常的幅度不同來判斷使用者的跑步數字、行 車紀錄器應用程式會利用車子發生事故產生的衝擊所引發的巨量加速度改變來 自動儲存事故發生時間點附近所錄到的影像;陀螺儀可以提供方位角的資訊,像 是全景照相軟體,利用陀螺儀和影像處理的技術將不同方向看出去的圖片無縫綴 接、地圖上使用者改變行進方向的資訊,甚至一些我們平常不會注意的光感應器 和距離感應器,光感應器偵測環境的光強度來調節螢幕的亮度是普遍的應用,而. 政 治 大 小的應用,或是隨者環境的不同有著更自動化更人性化的調整,這些感應器在新 立. 距離感應可以感測手機前方是否有物體遮蔽,像是將手機放進包包會增加鈴聲大. 時代的智慧型手機上已經成為必備元件。. ‧ 國. 學. 同樣地,也有越來越多新型態的服務因為智慧型手機的優勢而選擇在此平台. ‧. 上開發,例如可以讀取使用者聯絡人資訊的算命應用程式,算出哪個聯絡人與使. y. Nat. 用者的可能互動;廣告公司利用智慧型手機下載應用程式的方式來達到廣告的目. er. io. sit. 的,再以回饋有價點數的方式來吸引使用者去幫忙下載應用程式,廣告主所投資 的廣告費也間接的讓被廣告者受益;利用相機鏡頭拍攝的物體,在螢幕上產生的. al. n. v i n 擴增實境的應用程式,讓使用者將有趣的遊戲與生活的環境結合,發展出特別的 Ch engchi U. 互動;用手指敲打桌面或其他平面當作鍵盤打字,其原理是利用手機的加速度計, 配合桌面的震動,估算震動源頭的距離和方向,可以大致掌握使用者敲擊的虛擬 鍵盤。 Google 在 2007 年號召成立開放手持設備聯盟(Open Handset Alliance),並 推出 Android 行動運算平台,隨著這個平台發布的時間愈來愈長,Google 也不斷 更新 Android 的版本及增加可用的 API,大量的手機硬體、軟體資訊,可以透過 API 方便的取得,也成為目前智慧型手機開發的主流之一,Android 主要是以 java 為主的程式碼,開發上的門檻比 iOS 的智慧型手機低,若想開發一個實驗平台來 7.

(13) 收集使用者應用程式的操作行為,使用 Android 將可以呈現較為普遍的手機使用 情況。 目前有許多研究方法可以進行使用者行為研究,傳統的使用者行為研究通常 設計在一個受控制的實驗環境,使用者會被引導著完成一個特定的任務,研究者 再去檢驗使用者的行為,實驗過程中大多會錄影,而當使用者進行一個特定的行 為時,為了更容易的判斷特定行為背後的動機,會將過程中相對應的關鍵事件標 記出來。問卷調查是用來收集使用者的背景資訊和實驗過程中對系統主觀的評論。 這種實驗設計的缺點是,使用者被指定執行的任務必須要事先清楚的定義,而且. 政 治 大. 這些任務通常都需要在時間限制內完成,因為有人在旁監看,連帶產生不必要的 壓力。. 立. 傳統的使用者行為模式研究方法,無法進行長期的使用者模式觀察,因此我. ‧ 國. 學. 們必須設計一套新的方案,來了解使用者在一段長時間內的行為和偏好。舉例來. ‧. 說,我們很難要求使用者在實驗室來讓研究者觀察生活中所需要使用的程式。一. y. Nat. 般人的生活中常有許多突發事件,可能外出迷路,需要使用地圖或是導航類型的. er. io. sit. 軟體,也可能經由朋友推薦安裝了某個應用程式,這些事件在實驗室裡發生顯得 不自然,也違背使用者本身的意願,最好的方式就是讓使用者自由的使用手機,. n. al. Ch. 才能記錄到最貼近日常生活的資料。. engchi. i n U. v. 單一智慧型手機應用程式,可能需要很多個不同的功能單元才能完成使用者 的要求。例如相片分享,可能需要衛星定位來取得地理資訊,再上傳到社群網路; 又如撥號行為,使用者可以手動輸入電話號碼、或從聯絡人清單中撥出、或從來 電歷史清單中直接回撥或是從我的最愛的清單中撥出,雖然這些行為都是為了打 電話,但是根據不同的撥號方式,表現出來的行為模式會有不同的意義,研究上 述行為模式,將可有效改善智慧型手機和其應用程式的設計。 基於上述緣由,本論文以[1]所建置的實驗平台為基礎,提供更為完備的資料 蒐集與分析功能,與以往填寫問卷取得使用者資料的方式不同,在不打擾使用者 8.

(14) 與不須使用者有意識建立 log 的情形下,記錄和分析在一段長時間內所有使用者 的真實日常生活之智慧型手機應用程式的操作行為。收集的資料會定期的上傳到 伺服器,用[1]已建立的基礎工具讓研究者看到上傳的資料的概況,並提供查詢 介面,方便特定範圍或屬性的資料擷取。 現行的智慧型手機有許多系統,我們選用 Android 平台,因為 Android 使用 開放免費代碼,有比較多的文件可參考,擴充性佳,亦容易客製化。我們開發了 一個能夠在背景執行的使用者記錄收集服務,它能有規律的紀錄和上傳使用者操 作應用程式的細節到資料庫,提供研究人員進行後續的處理與分析。. 政 治 大 傳紀錄的監控軟體等功能,協助研究使用者之行為模式。利用分析圖表的工具, 立. 關於分析的工具,本研究開發圖表呈現、使用者手機記錄查詢和即時監看上. 我們可以從大量的資料中看出其分佈趨勢,例如我們可以對 XY 軸用不同的單位. ‧ 國. 學. 去觀察是否有些特定的事件發生在特定的時間、地點,用圖表的方式表現出一段. ‧. 時間的應用程式使用量,觀察該應用程式的活躍程度。紀錄查詢工具可以針對某. y. Nat. 一個使用者在一段時間內的操作行為作查詢,並且可以匯出 CSV 檔以供研究者. er. io. sit. 保留查詢過的資料,主要是可以讓研究者無須接觸資料庫的內容,保護資料庫, 也簡化複雜的資料庫查詢的語句,用簡單的圖形化介面、下拉式選單、就可以自. n. al. Ch. 己輕鬆查詢資料,可以讓更多領域的人參與。. engchi. i n U. v. 即時監看上傳紀錄可以讓研究者在電腦前面操作手機,模擬使用者使用手機 的情況,並觀察這些行為將會產生哪些紀錄序列,可以定義這些行為所產生的記 錄資料,如果資料庫中出現相似的記錄序列,判斷為使用者有可能進行過本研究 定義過的行為,藉由分析使用者的記錄序列,可以精準的判斷使用者在手機上的 行為模式(behavior pattern)。 具體而言,本研究的主要目的為建置一個蒐集使用者紀錄(user log)的實驗平 台,提供研究者觀察已上傳資料的大致趨勢,並便利的取得欲研究之資料;此外,. 9.

(15) 並根據蒐集的資料,定義與行為模式相關的事件序列,進一步利用相似度指標, 分析與比較使用者行為間的相關性。. 本論文的主要貢獻如下: 一. 發展新形態的資料收集方法: 提供不同於以往的 log 紀錄與觀察方式,在不干擾使用者的情況下收集資料, 藉由質化與量化的觀察對照,省去更多的資料整理及建檔時間。 二. 廣泛提供各類資料分析:. 政 治 大 提取資料,降低後續分析的困難。 立. 在[1]的基礎上,方便研究者以各種特殊需求取得欲研究之資料,可以客製化. 三. 定義事件序列以計算不同使用者之間的行為模式相似度:. ‧ 國. 學. 將使用者紀錄中最常出現的數個應用程式序列做為特徵,對所有應用程式按. ‧. 照使用頻率做排序,依據不同的順序在相似度的比對上給予不同加權比重,. er. io. sit. y. Nat. 計算不同時期使用者間特徵的相似度,可以作為分群的基準。. 本論文的架構如下述,第二章將討論相關研究,提出參考的文獻,並從中思. al. n. v i n 考可以應用實驗平台的想法。第三章實驗平台介紹中,會講解如何建置收集資料 Ch engchi U 的工具,以及記錄了哪些資料,為了分析大量的資料而開發的工具及其可應用的. 範疇。第四章研究方法中,會提出用上述的工具程式觀察到的現象,以及定義出 一連串的行為模式,進而定義使用者特徵,並且運用特徵計算出不同使用者之間 的相似度。第五章實驗結果與討論中會將平台工具產生的結果圖形與研究方法中 的數據呈現出來,並輔以討論。第六章總結本論文發展的工具與提出未來可能改 進的方向。. 10.

(16) 2.. 相關研究. 為了可以更容易的對使用者操作應用程式的行為模式進行分析,本研究將針 對如何蒐集資料、蒐集何種資料,與此資料應該具有哪些屬性等議題進行討論, 而在本章相關研究部分,則就過去文獻與研究做一整體的回顧,讓我們迅速掌握 問題的重點。 Eagle 等學者在[2]中使用藍牙裝置收集一段長時間的地理位置資訊分析,來. 政 治 大 上特定的操作記錄,像是地理位置,時間等等。使用者的使用模式會記錄成 log 立. 獲得更多的使用者行為資訊。我們可以經由在背景執行的 user-log 程式收集手機. 資料的形式,這些資料包含使用者每天的活動,例如:傳簡訊、打電話、照相、. ‧ 國. 學. 玩遊戲或是使用其他社群軟體,目前要完成的是提供一個整合硬體軟體和使用者. ‧. 管理的平台,這樣一來不同背景領域的研究者,可以合作開發出跨領域的題目。. y. Nat. 在[3]裡,Pramudiono 等研究者利用一個叫做 Mobile Info Search(MIS) 的 log. er. io. sit. 工具提供 location aware search,有了地理資訊可以讓研究者做更深入的分析。 Baeza-Yates 在[4]中,記錄了網路搜尋關鍵字的 log,用這些 log 在使用者查詢的. al. n. v i n 時候提供建議,來增加搜尋引擎查詢的效率。而我們搜尋所有使用者在手機上的 Ch engchi U 應用程式操作行為,可以設想可能相關的紀錄作為建議去搜尋。. 網路遊戲社群是另一個可以收集大量 log 的地方,Ducheneaut 等學者在[5] 中使用資料庫儲存角色資料,如角色 ID 和地理位置,這些資訊是從用戶端的界 面收集的,經由分析角色和團體的關係,可以從社群網路的角度研究線上社交的 演進,他們開發了一個工具,Social Dashboard,可以即時監看團體的活動。這樣 的概念和我們工具中一個即時監看 log 資料的工具很像,可以讓研究者有效率的 觀看目前資料收集的狀態,相信這對我們的研究實驗進度會帶來許多好處。. 11.

(17) Kort 等學者在[6]所提出結合 log 資料,輔助質化觀察的概念,與本論文強調 的重點不謀而合,同時我們可以對收集來的 log 的品質分析,觀察 log 資料是否 連續且定期的上傳。Hilbert 等學者在[7]中提出了一個自動分析使用模式的架構, 包括多功能的搜尋、傳送事件串流、視覺化、量化等等。我們的平台也實做了這 個架構的多個部分,例如圖形視覺化、統計圖表、log 搜尋服務和使用者行為即 時 log 監看系統。 Naaman 等學者將研究焦點集中於相片的瀏覽[8],他們以觀看照片的應用程 式 Zufer 作為取得使用者操作模式的平台,當中定義了,Task time、Down time. 政 治 大 例如:跟朋友分享照片;Down time 為最後觀看某個聯絡人照片的時間到目前的時 立 以及 killing time,其中 Task time 為使用者在應用程式上完成一個任務的時間,. 間;Killing time 為 Zufer 在記憶體內停留的時間。相同地,我們也對應用程式的. ‧ 國. 學. 啟用次數,使用時間來對使用者的行為模式下精確的定義。. ‧. Lee 等學者從手機日曆中取得使用者註記當作紀錄[9],分析是否為人名、地. y. Nat. 址、時間、或是電話,對這些去做分類,並讓某部分成為可以應用的內容,相似. er. io. sit. 的來說我們也需要對應用程式作分類,像是遊戲類、工具類、社交類別等等。 Baeza-Yates 等學者在[10]中研究的是 Web mining 主題, 他們對所有查詢的. al. n. v i n 關鍵字,以出現的次數不同來給予不同的比重,對於搜尋引擎搜尋出來的相關結 Ch engchi U. 果,使用者點擊也會增加此結果的搜尋比重 Ranking 如果用在 Log 行為模式的 比對上,某一種行為模式若是常常出現,代表這是一個連串且有目的行為。 在本論文中,我們參考 Eagle [2]記錄了使用者啟動程式時的地理位置,根據 Hilbert [7]的架構發開了分析工具,其中 Real time log monitor 是源於 Ducheneaut [5]的想法,而查詢 log 平台是實踐了 Baeza-Yates [4]的方法,也為了 log 的品質 開發出提醒使用者上傳 log 的機制,相對應 Kort 在[6]提出的概念來確保 log 的 品質,研究應用程式的生命週期的概念和 Naaman 的主題[8]相關,想要對於各 種 log 做分類和 Lee 在[9]所分析行事曆內容相仿,用 Ranking 的方式對一連串的 12.

(18) log 作出較好辨識出是否為連續的行為跟 Baeza-Yates 在[10]中的網頁 Ranking 的 方法有關係。. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 13. i n U. v.

(19) 3.. 資料蒐集平台介紹. 本研究的目的是想要瞭解使用者在智慧型手機上的行為,在智慧型手機這個 新型態的工具出現後,對人與人之間的社交關係、相處模式等造成的改變與影響, 舉例而言,我們可以統計某一應用程式被使用的次數與時間,觀察出該使用者的 學習曲線,以及各類應用程式隨時間的消長。 為此,需要盡可能蒐集使用者在手機上的各種使用情況資料,包括使用了何 種應用程式,在何時、何處被使用,本研究招募了每期 20 名左右的使用者,一. 政 治 大. 期三個月,每三個月會定期開一次使用者會議,來讓新加入的使用者簽約或是想. 立. 退出的使用者解約,以一筆 log 為單位計算,目前共累積 200 多萬筆資料。. ‧ 國. 學. 一個完整的實驗平台包含了以下要素:人、硬體與軟體[1],如圖 3-1,受試者 使用手機產生 log,log 從手機上傳至伺服器,若 log 無法正常上傳,則伺服器會. ‧. 寄信通知使用者。. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v. 圖 3-1 伺服器、手機、使用者、軟體的架構. 在 3.1 節會介紹使用者招募的方式以及為何以此方式招募,本研究所蒐集的 是使用者使用應用程式產生的 log 資料,因此使用者是哪個年齡、族群、男女、 身分,對本研究來說非常的重要,例如: 上班族可能較常會使用行事曆、定時提 14.

(20) 醒等軟體;業務員可能較常開啟通訊錄、連絡人等管理應用程式;家庭主婦可能 會安裝金融、股票、基金等看盤軟體;學生可能會較常使用課表、記帳等記錄軟 體,而細分男性、女性及年齡層也都會有不同的習慣,因而影響了各自下載的應 用程式,例如二十幾歲女性的智慧型手機裡常常會使用ㄧ些美化相片或圖片合成 的軟體,而男性的手機則會較常使用地圖、導航等類型的應用程式,因為使用者 來源對於 log 資料的分析是如此的重要,關於使用者的來源會於 3.1 節介紹。 在 3.2 節 Log Collector Service 會說明本研究如何從使用者的手機,在不會造 成困擾下蒐集該使用者的 log 資料,有別於傳統的問卷,需要將使用者聚集到一. 政 治 大 在,不論提供如何舒適的作答環境,受測者在工作人員與其他受測者間都會有不 立 個地點,在有限的時間與空間內完成作答,而且旁邊會有工作人員的監視壓力存. 自然的心情,即使去除這些因素,使用者經過思考過後留下的答案也未必是真實. ‧ 國. 學. 的使用情況,如此的問卷答案,不管在生理上或心理上對於作答留下資料的使用. ‧. 者都造成某些程度的壓力,而本研究克服了大部分的困難,讓使用者不限時間、. y. Nat. 地點、空間,甚至不用自己費心留下資料,在平常使用的過程中所產生的 log 就. er. io. sit. 會被記錄,雖然也有可能使用者知道自己的 log 資料會被記錄而不會像平時一樣 的使用應用程式,但是已經將不自然的因素減少到最低,以期望符合受測者日常. al. n. v i n 生活使用應用程式的習慣。關於如何蒐集資料的細節會在 3.2 節中介紹。 Ch engchi U. 在 3.3 節 Log Monitor Platform 中,會介紹本研究如何觀察蒐集的 log 資料與. 如何藉由統計進一步的分析,例如將所有使用者應用程式被使用的時間分成 24 小時,統計每一小時被使用之應用程式數量。可以看出大多數人使用應用程式的 高峰集中的時間點,也可以從 log 資料的經緯度觀察使用者使用應用程式的地點, 來瞭解使用者的習性,另外,從使用者使用應用程式的模式也可以發現使用者的 習慣,例如習慣用 line 傳照片給朋友,就會出現使用 line 接著使用相簿的行為模 式,在 3.3 節中將介紹各種本研究觀察 log 資料的方法與實作工具。. 15.

(21) 3.1 User 本研究需要收集一定量的 log 資訊,所以需要有大量的智慧型手機用戶,因 此募集約 20 位參與測試者。希望可以在使用者行為模式中找到受試者之間互動 的資訊,所以募集對象為本身已有一定互動的人為主要招募對象,目前是以政大 理學院與傳播學院的學生作為主要招募對象,因為校內的學生方便管理,較不會 出現失去消息的情況,因此作為資料收集的來源。本實驗並不侷限於對智慧型手 機有一定熟練度的使用者,目的是為了更符合ㄧ般的情況,故不在使用者對於手 機的熟悉度上作挑選,另一方面也可以通過應用程式使用的次數觀察該使用者學. 政 治 大 隱私方面,本研究在 log 資料存入資料庫的時候都有先對每一個使用者作過編號, 立 習的情況,也希望藉由受試者之間的互相學習交流來增加使用經驗。在使用者的. 研究者在資料庫中只會看到使用者編號,而不會看見使用者的個人資料,以此來. ‧ 國. 學. 保護使用者的隱私。. ‧. 3.2 Log Collector Service. io. er. 發出可以背景執行不間斷的記錄手機上的行為的程式。. sit. y. Nat. 要分析使用者的行為模式,需要取得其在手機上的操作紀錄,因此本研究開. 由於 Android 平台上的程式開發便利,本研究可以很快的透過 Android SDK. al. n. v i n 快速的在手機平台上開發專屬的 C hUser Log CollectorUService,收集使用者在日常 engchi. 生活中使用智慧型手機所出現的行為資訊紀錄,另外也可以透過 SDK 中所提供 的 API 方便的取得其他我們想記錄的項目資料,例如透過 Location Manager 取得. 位置資訊等,然而在 SDK 中出現沒有提供可以取得系統與其他應用程式的詳細 資料的情形,所以在此部分藉由 Android SDK 提供的 logcat 工具,logcat 記錄了 Android 手機內部的所有硬體軟體資源執行的記錄,包括出現甚麼錯誤、警告、 正常的程式執行到哪個 Activity,幾點幾分被執行都會有記錄,透過 logcat 應用 程式可以取得 Android 內部各種應用程式所產生的 log (如圖 3-2)。. 16.

(22) 。 圖 3-2 Android SDK 所提供的 logcat. 3.2.1. Service dataflow 此處提出使用者處於無網路的環境資料無法上傳的解決方法。一般操作會存. 政 治 大. 在手機端資料庫,因為要收集的 log 必須上傳到伺服器,而使用者不是隨時隨地. 立. 有網路,甚至使用者可能處於無法上網的區域,為了防止使用者因為無法上網而. ‧ 國. 學. 不能上傳資料到資料庫,經由 Log Collector Service 所取得的 Log 資料將先預存 在 Android 預設的 SQLite 中,直到使用者處於可以將資料傳輸到網路的區域,. ‧. 此時再將手機中 SQLite 中的 Log 資料寫入到真正儲存資料的資料庫中(如圖 3-3)。. y. Nat. sit. 透過記錄使用者開啟的應用程式產生的 log 資料,可以詳細記錄使用者的操作行. n. al. er. io. 為,將資料已透過網路的方式傳送到遠端的資料庫中,使用者不需將設備交回即. i n U. v. 可收集手機中儲存的 Log 資訊,透過這種方式可以不中斷實驗以及不打擾使用. Ch. engchi. 者日常生活,如此一來就可以收集到更貼近使用者平日使用手機應用程式的操作 行為。. 17.

(23) 圖 3-3:User 產生的 Log 會先存在 Mobile DB 中,之後再透過 3G/WiFi 將資料傳送到遠端的 Database 上,研究者之後可以針對這些 Log 進行查詢. 3.2.2. Log Table in Remote Database. 政 治 大 目的是讓研究者可以從記錄中獲得更多的資訊。 立. 為了有系統的記錄使用者的操作行為,本研究對每一筆的資料定義其屬性,. ‧ 國. 學. 在現階段的使用者 Log 記錄中儲存了使用者操作手機產生的各式操作行為, 其中 ID_User 記錄了使用者登入到 Android Market/Google Play 所使用的帳號,. ‧. ID_Machine 紀錄受試者所使用的 Android 手機的 IMEI 碼(即為手機的序號),. sit. y. Nat. Name_App 欄位記錄了使用者啟動的應用程式名稱,而 Name_Activity 欄位記錄. al. er. io. 了使用者對應用程式的操作行為,其中對於網頁瀏覽或是其他的應用額外產生的. v. n. 資訊例如:網址,會記錄在 ExternalData 欄位中,最後 Latitude , Longitude 欄位則. Ch. engchi. 記錄了使用者的位置資訊。(如圖 3-4). 18. i n U.

(24) 圖 3-4 資料庫中的欄位. 政 治 大. 3.2.3. Log Collector Service Limited. 立. 在目前程式的實作方法上仍然有一些限制,因此本研究採取批次上傳的機制. ‧ 國. 學. 來防止過度的電源消耗。. 透過即時將資訊傳送到遠端資料庫可以進一步做到即時的分析,然而如果進. ‧. 行即時傳輸的模式往往會造成手機的耗電量大幅上升,影響到使用者的行為模式. y. Nat. sit. 以及造成不適感,另外記錄使用者的地理位置一般要透過網路,若要拿到更精準. n. al. er. io. 的經緯度座標則使用者必須願意開放 GPS 的使用權限來取得,而使用 GPS 定位. i n U. v. 會造成電力的大幅度消耗,基於本實驗想要記錄的是使用者平常習慣的操作行為,. Ch. engchi. 盡可能不去改變使用者習慣。本實驗所採用的半即時資料傳輸模式架構可以調整 資料上傳的頻率,來盡量降低裝置的耗電量,然而在需要 GPS 定位時所造成的 耗電量現階段仍無法改善。 受限於半即時資料傳輸模式,資料並非即時傳到遠端的伺服器上,如果使用 者上有資料未上傳就將手機回復原廠設定,將導致手機上的資料庫清除,相關實 驗數據也就隨之消失。. 19.

(25) 3.3 Log Monitor Platform 研究者透過 Log Collector Service 所收集到的 Log 資訊來做為分析智慧型手 機使用者操作行為的依據,然而不同的研究對於所收集到的資料可能著重於不同 的地方,有些研究者可能想要分析拍照與地點的關係,有些可能著重於社交行為 的改變,此外由於資料是不斷更新的,因此研究者每天能取得的資料都是不同的, 需要設計讓研究者可以快速取得或瀏覽使用者記錄的方式。在本研究中以 Web Service 來達成目的。. 3.3.1. Log Charting Service. 政 治 大 庫所儲存的 Log 資料可能無法讓研究者對使用者行為模式有初步的了解,所以 立 經由 Log Collector Service 所收集的資料是很大量的,對於研究者而言資料. 在 Monitor Platform 上提供結合 Google Chart 的使用者資料檢索,研究者就可以. ‧ 國. 學. 從資料庫統計的資料了解使用者的操作行為關資訊,這些資訊包括使用者使用的. ‧. 應用程式的類型或是使用的時機,使用的頻率等資訊,例如某一位使用者在一天. y. Nat. 中對於手機的依賴度,或是使用者常執行哪一類的應用程式等。提供這些資訊能. er. io. sit. 使研究者快速的找到具有顯著差異的應用程式,或是使用者大量使用的應用程式 等,並且對於新推出或是熱門的應用程式也可以有一個概括的認識。針對統計出. al. n. v i n 來的圖表,研究者也可以取得相對應的 3-5、圖 3-6、圖 3-7) 。 C h CVS 檔案。(如圖 engchi U. 圖 3-5 所有使用者在一天內所產生的 log 分布圖. 20.

(26) 圖 3-6 以月為單位的全體使用者的 log 分布圖. 立. 政 治 大. ‧ 國. 學. 圖 3-7 某位使用者的 Entertainment 類型的應用程式分佈. ‧. 3.3.2. Log Query and List Website. sit. y. Nat. 對於研究者而言,行為模式的分析只有概括的 log 統計資料是不足夠的,大. al. er. io. 多數的研究都會針對特定使用族群,特定時間點或特定的操作行為模式有興趣. v. n. (如圖 3-8、圖 3-9),Monitor Platform 也提供研究者在資料庫中進行查詢詳細資. Ch. engchi. i n U. 訊,研究者可以針對特定使用者或某一時間點,取得相對應的 log 記錄列表(如 圖 3-10),這些紀錄可以提供研究者做進一步的研究。. 21.

(27) 圖 3-8 Monitoring System 的登入畫面. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. al. sit. y. Nat. 圖 3-9 研究者查詢 log 的畫面. Ch. engchi. i n U. v. 圖 3-10 研究者查詢某一使用者某段時間內 log 的地理位置. 22.

(28) 3.3.3. Log Real-time Monitor 大部分行為模式的解析往往並不能依靠單一 log 記錄,因為一個完整的行為 不只會產生單獨一條 log 記錄,此外對於研究者而言,如果對各種的應用程式不 熟悉,也可能無法理解單一 log 所代表的意義,雖然研究者可以藉由 Monitor Platform 上的列表來取得行為模式,然而 Log Collector Service (如圖 3-11)並非完 全即時,研究者也可能無法回想當時所使用的應用程式,所以另外提供一個可以 即時同步顯示的介面是必要的。使用時,資料在此不會存到資料庫而是直接傳輸 到另一個 Message Service,並立刻呈現在網頁上,研究者可以快速的得到特定行. 政 治 大. 為模式所產生的 Log List,了解並建立特定行為將有助於之後的行為分析。. 立. ‧. ‧ 國. 學 sit. y. Nat. io. n. al. 序列所產生的行為模式. Ch. engchi. er. 圖 3-11 Real-time Log Monitor 研究者可以藉由觀察即時產生的 Log 資料,以得到特定操作. i n U. v. 本章從使用者的來源、log 資料如何蒐集以及資料如何觀察與分析,在介紹 了各種工具後,回到本研究的目的,為了瞭解使用者行為模式,將資料視覺化的 工具用不同角度的圖表呈現,有個人、有群體、有用應用程式類別去區分、也有 以標示著地理位置的地圖,從中找到每個使用者與其他人的不同,以定義使用者 的特徵。. 23.

(29) 4.. 研究方法. 本章將使用多面向的方式去分析各種使用者行為模式及應用程式被使用的 方式,例如:以單一使用者所使用全部類型的應用程式來分析其最常使用的應用 程式類型、將使用者每天使用應用程式的數量列出來後,不同的人之間也會有不 同的平均數量或是分析每一個應用程式被啟動的地點,可以觀察出某些應用程式 比較會在特定地點被使用。 用眾多不同角度的觀點及工具產生的圖形,發掘差異大的部分,再進一步探 究是何種原因造成樣本呈現不同特性,例如:主要使用的應用程式類別不相同、. 政 治 大. 在基本的使用量上有差距,當中可能說明重度與輕度智慧型手機使用者的相異程. 立. 度、使用少數量的應用程式但是卻有大量資料之單一功能的重度使用者。. ‧ 國. 學. 將所蒐集的資料視覺化、圖表化,可以產生出豐富的研究議題,本研究將對 這些議題做概括的使用者之間的相似度比較,並將造成差異的因素量化。一般對. ‧. 於大量資料的做法,是分析每筆資料之間的關聯性,例如搜尋資料中的關鍵字加. y. Nat. sit. 以分類、或是賦予資料屬性,然而在本研究中收集的資料每一筆都是一個應用程. n. al. er. io. 式在某個時間、地點被使用過的紀錄,這些資料在儲存的時候已經有資料屬性,. i n U. v. 如使用者編號、時間、應用程式名稱、地點等屬性,因為收集資料的方式與收集. Ch. engchi. 到的資料型態與目前做大量資料分析的對象不同,以往可能是針對某瀏覽器搜尋 的關鍵字或是對於很多篇文章的分類,但本研究的資料是使用者使用應用程式的 紀錄,所以需要嘗試不一樣的分析方式,既然以往的資料分析很大一部分專注在 資料的分群,本研究也希望可以在收到的 log 資料上計算不同使用者間的相似程 度,既然每一筆資料代表的是使用應用程式的紀錄,那麼當這些紀錄不斷的重複 出現是否代表使用者有使用此應用程式的習慣?單一程式可能很多人使用像是 facebook、Line 等等的社交軟體,是大多數的使用者都會使用,而若要找出不同 的使用者之間的差異,只知道單一的習慣是不夠的,因為大多數的人都有使用社 24.

(30) 群軟體的習慣,但是如果出現很多次相同的應用程式使用序列,例如使用了 facebook 後使用了 Line,之後又使用相簿應用程式,只要類似這樣的序列在使用 者的 log 中出現的次數足夠,可以視為使用者的行為模式,也因為出現的次數很 多,本研究將此序列視為使用者的習慣,在之後的計算中會以這些習慣當成使用 者的特徵來使用,而連續看三個應用程式為 3-gram 的概念,是因為觀察使用者 目前使用的程式與其前一個與後一個所使用的程式的想法,當然連續看兩個應用 程式也是可行的方法,但是這樣使用者間的歧異度會降低,而連續看四筆紀錄會 讓使用者在行為模式上更有區別度,不過由於個別序列出現頻率過低,本研究認. 政 治 大 在特徵的計算方面,本研究取前 N 名次數最多的行為模式作為納入計算的 立. 為不適合做為使用者特徵的指標。. 特徵(N=10),因為取固定數量的特徵在不同使用者間比較才公平,且取到越後面. ‧ 國. 學. 的特徵可以代表該行為模式為使用者習慣的強度越小,故以此方式來做為取特徵. ‧. 的標準。. y. Nat. 在 4.1 節取標準差變異數來代表資料的特徵中,會介紹如何以使用者每天產. er. io. sit. 生的 log 數量為單位取變異數來定義使用者的特徵,因為大多的使用者在使用應 用程式的數量差就會有差距,因此將兩個不同的使用者的 log 數量直接拿來比較. al. n. v i n 會有不小的誤差,透過標準差可以當作使用者間使用應用程式數量差距的指標。 Ch engchi U 在 4.2 節定義使用者特殊的行為模式作為特徵中會介紹,如何以單一使用者的使 用應用程式的習慣作為相似度的依據,根據計算出來的習慣產生出與其他使用者 相似度的數值,根據這些數值,研究者們可以將使用者分群,找出更適合作為研 究對象的子集合。. 25.

(31) 藉由前面章節提及的資料與工具,如 Log Charting Service(圖 4-1)可以了解 使用者最常使用的應用程式,以及其他應用程式使用量所佔的比例,這些比例的 標準差可以代表該使用者的行為特徵。. 立. 政 治 大. 圖 4-1 某位使用者的應用程式使用類型分佈. ‧ 國. 學. 利用 Log Query and List Website 工具(圖 3-10)可以了解使用者在甚麼時間、. ‧. 甚麼地理位置使用過哪一個應用程式,在經由一連串 log 的訓練後,可藉由不規. y. Nat. 則的應用程式使用時間、地點找出使用者與平常相異的應用程式使用模式。. er. io. sit. 使用 Log Real-time Monitor,可以即時觀看手機操作時所產生的應用程式 Log, 研究者可針對一連串的應用程式操作模式,事先定義出想要尋找的使用模式,再. al. n. v i n 透過本工具(如圖 4-2),在某段時間區間內搜尋特定多個應用程式照順序出現的 Ch engchi U. 次數,藉此尋找使用者是否有出現研究者定義的操作模式,對特殊的行為模式作 精確的搜尋,亦可將出現此行為模式的次數視為特徵之一。. 26.

(32) 立. 政 治 大. ‧ 國. 學. 圖 4-2 在一段時間內搜尋事先定義的行為模式. ‧. 承接以上提出的工具,接下來將單純透過受試者所使用的應用程式的次數、. y. Nat. 順序,來賦予資料庫中不同的使用者特徵,有了可以代表使用者的特徵後,便可. er. io. sit. 以從多位使用者中找出應用程式行為模式最接近的使用者;若是以辨別使用者個 人使用情況的角度來看,本研究可以發現使用者使用應用程式習慣的改變。. al. n. v i n 目前只有使用應用程式之間的順序來定義使用者習慣,更進一步可以對於每 Ch engchi U. 筆 log 產生的時間作分析,像是瀏覽網頁的行為模式是否大多出現在白天,因為 白天使用者需要上課而只能用手機上網,或是使用 facebook 行為的時間分佈在 上午、下午、晚上、半夜,都可以用更貼近使用者生活的角度去進一步解釋這樣 的行為模式分佈之原因。 下面的章節會介紹如何在龐大的 user log 資料中,使用上述的視覺化、查詢 工具幫助分析使用者行為,以各種 log 紀錄的資訊,諸如時間、地點、被使用的 次數、乃至於手機螢幕的開關的種種訊息找出使用者特徵來代表使用者的智慧型 手機操作模式,以便於作各種案例的研究。 27.

(33) 4.1. 取標準差變異數來代表資料的特徵. 圖 4-3. 學. ‧ 國. 立. 政 治 大. User12 的 Social 類別的每天的 Log 數量分佈. ‧. 對於數以百萬筆的 user log 資料,本研究在前面章節的實驗平台已經介紹了. y. Nat. 一些將資料視覺化的工具,而本節為了更深入的探討個別使用者之間的差異,只. er. io. sit. 對單一的使用者的資料作視覺化來更容易瞭解他們操作智慧型手機的習慣,如圖 4-3,為了確保標準差與變異數可以描述資料的特徵,本研究將使用者參與計畫. al. n. v i n 全部時間的資料取標準差與變異數,在將此時間分成前半和後半,如今假設使用 Ch engchi U 者都正常使用,那麼計算出來的數據前期和後期會很接近。. 28.

(34) 立. 政 治 大 User10 的 facebook 每天使用量. 學. ‧ 國. 圖 4-4. STD. 18.7129. 17.5007. 19.9282. ‧. Nat. y. 表格 4-1 左: User10 全部時間的標準差 中: User10 前半時間的標準差 右: User10 後半時間. sit. 的標準差. n. al. er. io. 如圖 4-4,因為 facebook 是所有應用程式中,最常被使用的社交軟體,資料. i n U. v. 也較為完整,本研究先對 facebook 作使用者行為的分析,由圖 4-4 可以知道這. Ch. engchi. 是一個活躍的使用者,幾乎每天都有使用智慧型手機上 facebook 的習慣,從表 格 4-1 可以得知,同一個人在不同時期,用手機上 facebook 的次數會不一樣, 但是每天 app 被使用次數的標準差會很接近。. 29.

(35) 圖 4-5. STD. 31.8401. 學. ‧ 國. 立. 政 治 大. User6 的 facebook 每天的使用量. 35.581. 4.8674. 表格 4-2 左: User6 全部時間的標準差 中: User6 前半時間的標準差 右: User6 後半時間的. ‧. 標準差. y. Nat. sit. 圖 4-5 顯示,user6 每天的使用曲線在 2012/9 後,每天使用的次數與頻率跟. n. al. er. io. 2012/9 之前的完全不同,從標準差如表格 4-2 上來看也是如此,因此可以推測 user6 的使用習慣有了很大的改變。. Ch. engchi. i n U. v. 4.2. 定義使用者特殊的行為模式作為特徵 本節將以使用者使用手機應用程式的順序模式來當作特徵,作法是先將一個 使用者使用過的全部應用程式,按照次數由多到少排序如表格 4-3, Name_App 執行的應用程式. COUNT( 'Name_App' ). com.htc.launcher. 14980. com.android.browser. 12038. com.google.android.gm. 4564 30.

(36) com.android.settings. 4184. com.facebook.katana. 3444. com.android.phone. 2851. jp.naver.line.android. 2782. …. …. 表格 4-3 將使用者使用過的應用程式按照次數排列. 然後給予這些應用程式由小到大的編號,如表格 4-4, 編號. Name_App. 政 治 大. com.htc.launcher. 立. com.android.browser. 0 1 2. ‧ 國. 學. com.google.android.gm. 3. com.android.settings. ‧. 4. com.android.phone. 5. sit. y. Nat. com.facebook.katana. 6. io. al. n. …. er. jp.naver.line.android. Ch. engchi U. v… i n. 表格 4-4 對所有使用者用過的應用程式作編號. 將使用者每天的 user log 如表格 4-5 作成相對應的編碼,如表格 4-6,. MyTime. Name_App. 11-05-1219:30:27. com.htc.launcher. 11-05-1219:30:47. com.android.camera. 11-05-1219:31:15. com.htc.launcher. 11-05-1219:31:32. com.android.settings 31.

(37) 11-05-1219:31:34. com.android.settings. 11-05-1219:32:55. com.htc.launcher. 11-05-1219:32:59. tw.com.quickmark. 11-05-1219:33:01. com.htc.launcher. 11-05-1219:39:34. ymst.android.fxcamera. 11-05-1219:40:11. com.whatsapp. 11-05-1219:40:12. com.whatsapp. 表格 4-5 User10 真實的 user log 串流. 立. 政 治 大. 原始的 Log 資料流. 編號過後的資料流. 學. com.android.camera. 16. com.htc.launcher. 0. ‧ 國. com.htc.launcher. 0. ‧. y. Nat. com.android.settings. er. io. sit. 3. com.android.settings. n. al. com.htc.launcher. tw.com.quickmark. Ch. engchi. …. i n U. v. 3 0. 46 .... 表格 4-6 將 User10 原始的 UserLog 資料流編碼. 這樣可以讓比對的步驟更加簡單且快速,在此本研究所注重的是使用者的習 慣,因此應用程式的操作行為模式出現的次數才是本研究所認定的習慣,流程如 圖 4-6,. 32.

(38) 學 圖 4-6 對於使用者日常生活 log 編號的流程圖. ‧. ‧ 國. 立. 政 治 大. y. Nat. 在實作的方法上最直覺的想法是將所有的使用者使用過的 app 排序後再針. er. io. sit. 對每一個不同的使用者日常生活產生的 app 紀錄作編號,以連續出現的 n 個 (n-gram)應用程式為一組特徵,將所有出現的特徵次數加總,取前 N 個數量多的. n. al. Ch. 資料納入計算。(N=10),在此討論三種情況:. engchi. i n U. v. 連續 2 個 log 當作一筆特徵(如圖 4-7):. 以連續 2 筆 log 當作特徵將呈現應用程式切換的習慣,會讓使用者間行為模 式的歧異度降低,並無法有效代表穩定的行為徵候。. 33.

(39) 立. 政 治 大. ‧ 國. 學 圖 4-7 連續兩個 log 當作特徵示意圖. ‧. 連續 3 個 log 當作一筆特徵:. sit. y. Nat. 將呈現目前正在使用的應用程式與其前後一筆,使用者行為模式間的歧異度. al. er. io. 較取連續兩筆 log 為特徵來的明顯,且特別特徵的統計數量足夠。. n. 連續 4 個 log 當作一筆特徵:. Ch. engchi. i n U. v. 歧異度較連續 3 筆 log 為特徵明顯,但由於序列越長,每個個別特徵出現的 次數越少,造成統計數量不足,本研究認為不適合當作特徵來使用。 不過以 3-gram 的方法去計算每一種行為模式出現的次數,會因為所有可能 出現的行為模式的排列組合過多造成記憶體不足的情況,進一步舉例說明,一個 使用者平均使用過的 app 數量大約為 100 到 200 之間,該使用者所有可能出現之 行為模式的組合有 200 的三次方種,全部使用者使用過的 app 數量大約為 1500 個,那所有可能出現的行為模式種類為 1500 的三次方種,如此龐大的數字會造 成記憶體的不足,因此在實作上本研究採取先對個人的行為模式次數進行累加, 再對應到所有使用者的應用程式編號。 34.

(40) 累加結果如表格 4-7 由此資料可推測該使用者為重度的手機瀏覽器使用者, 跟瀏覽器有相關的操作模式筆數為 4663,而次多的操作模式為設定手機與 facebook 相關的操作有 1600 筆左右,相較之下,瀏覽器相關的操作模式出現的 次數是其他應用程式的 3 倍之多,再其次才是使用 line 的操作模式,本研究會統 計這些模式出現的比例,將當作使用應用程式習慣的特徵。 編碼. 實際模式. 次數. com.android.browser 1,1,1. 立. ‧ 國. com.android.settings. com.htc.launcher. y. sit. com.android.settings. n. al. com.android.settings. i n C com.facebook.katana hengchi U com.facebook.katana. 1629. er. io 4,4,4. 1645. ‧. com.htc.launcher. Nat. 0,3,3. com.android.settings. 4663. 學. 3,3,0. 政 治 大 com.android.browser com.android.browser. v. 1627. com.facebook.katana com.android.browser 1,1,0. com.android.browser. 1421. com.htc.launcher com.htc.launcher 0,1,1. com.android.browser com.android.browser 35. 1403.

(41) com.htc.launcher 0,1,0. com.android.browser. 1231. com.htc.launcher jp.naver.line.android 6,6,6. jp.naver.line.android. 999. jp.naver.line.android com.htc.launcher 0,2,2. 857. com.google.android.gm. 政 治 大 立com.google.android.gm com.google.android.gm. ‧ 國. com.htc.launcher. com.android.htcdialer. sit. y. 664. com.android.phone. n. al. com.htc.launcher. C jp.naver.line.android hengchi. er. io 0,6,6. 842. ‧. com.htc.launcher. Nat. 0,9,5. com.google.android.gm. 學. 2,2,0. i n U. v. 523. jp.naver.line.android com.htc.launcher 0,4,4. com.facebook.katana. 489. com.facebook.katana com.android.browser 1,0,1. com.htc.launcher. 478. com.android.browser 2,0,1. com.google.android.gm 36. 465.

(42) com.htc.launcher com.android.browser com.android.browser 1,0,2. com.htc.launcher. 418. com.google.android.gm com.android.browser com.htc.launcher. 1,0,3. 406. com.android.settings. 政 治 大 本研究在此取特徵的方法是將該使用者出現最多的前十名之行為模式由多 立 表格 4-7 user10 出現次數較多的行為模式. ‧ 國. 學. 到少排序如表格 4-8、表格 4-9。 編碼. 次數. 5534. 9,9,9. 1085. ‧. 1,1,1. sit. y. Nat. 942. io. al. er. 2,2,2. n. 42,42,42 4,4,4. Ch. engchi U. v ni. 633 394. 58,58,58. 337. 5,5,0. 209. 5,5,5. 205. 78,78,78. 182. 36,1,1. 177. 表格 4-8. user10 前十名的行為模式由多排序到少. 37.

(43) 編碼. 次數. 0,10,5. 800. 10,5,0. 688. 5,5,0. 238. 1,1,1. 226. 11,11,0. 214. 15,15,15. 151. 75,75,0. 143. 92,92,92 11,0,10. 立. 政 治 大. 62. 表格 4-9. user15 前十名的行為模式由多排序到少. ‧. ‧ 國. 65. 學. 75,0,0. 68. 因為是取行為模式(behavior pattern)出現的次數做排序,在此定義一個行為模. sit. y. Nat. 式為該使用者的 log 資料中的出現三個比鄰 log 為行為模式單位,即為一個. io. n. al. er. 3-gram model,如圖 4-8 所示。. Ch. engchi. i n U. v. 圖 4-8 以三筆 log 資料為行為模式的單位,統計出所有模式的個別出現的次數 38.

(44) 因此有 log 資料才會產生各個行為模式的次數累積,資料量的數量是很重要 的關鍵。 在相似度的計算上,本研究將使用者的 log 資料分成兩個部分,Training Data 與 Test Data,分別對兩份資料取 3-gram 的特徵,取得個別的行為模式次數的前 十名,再將相同的行為模式從前十名中取出,剩餘的取個別名次的比值加總除以 二在加上相同的行為模式的個數乘二後除以 10 即為 Training Data 與 Test Data 的 相似度,計算方法如下,以 N=5(取前五名的行為模式)為例: (如表格 4-10、圖 4-9、 圖 4-10、圖 4-11) Training Data. 立. 10,9,10. 150. 9,10,9. 100. 8,200,45. 80. 0,3,9. 500 300. y. 250. n. al. 50. Ch. 11,50,20. engchi. sit. io. 6,6,6. 次數. 150. i n U. 表格 4-10 (N=5 的計算例子). 39. er. 8,200,45. 200. Nat. 2,2,2. 行為模式編號. ‧. 11,50,20. 次數. 學. 1,1,1. ‧ 國. 行為模式編號. Test Data 政 治 大. v. 100.

(45) 圖 4-9 將 Training Data 與 Test Data 中有相同的行為模式,另外提出來做加權處理. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v. 圖 4-10 計算 Training data 與 Test data 中不同的行為模式. 40.

(46) 政 治 大. 圖 4-11 計算 Training data 與 Test data 中相同的行為模式. 立. 利用上述方法計算得 =7.93,因為 N=5(取前 5 名的行為模式),7.93/5=1.586,. ‧ 國. 學. 此例的相似度為 1.586,一般來說超過 1 代表相似程度很高。 如此計算的方式是因為,在思考取得特徵的過程中,Training Data 與 Test Data. ‧. 並沒有顯著的相似行為模式,Training Data 的資料取樣的時間比 Test Data 更早,. y. Nat. sit. 隨著新的 app 的出現,舊的 app 式微,在一消一長的情況下往往在取得 Test Data. n. al. er. io. 的時間點,Training Data 常用的 app 可能已經不使用或少用了,在更多的情況下,. i n U. v. Test Data 中會出現同類型且代替掉原本 Training Data 曾經習慣使用的 app,因此. Ch. engchi. 本研究決定從數個最常被使用的應用程式行為模式的角度來當作該使用者的特 徵,換句話說,即原本最常使用的 app 在經過若干時間後,換成另一個 app,但 是啟動該類型 app 的行為模式次數與原本的 app 卻不會有太大的改變,當然這中 間的轉換可能有交替的時間,而造成兩個消長的 app 同時存在,但這也屬於使用 者特徵的ㄧ環,考慮這些因素,取得 Training Data 與 Test Data 的時間與資料筆 數成為很重要的關鍵,進一步可以再加入每一筆 log 的時間跟位置資訊來更加強 使用者特徵的強度,在一段時間、地點內有頻繁且重複的行為模式,可以更精確 的代表使用者特徵,例如經常在某天相似的時間與地點打電話或傳簡訊,可以視 41.

(47) 為很重要的使用者特徵,另外使用者本身對於應用程式的使用習慣也有不可忽略 的變數存在,在下一章節會討論各種實驗細節的參數調整,以達到可以藉由 log 資料辨識該使用者的目的。 如圖 4-12 所示, 總結說明本論文使用行為模式為特徵的相似度計算方法。. 立. 政 治 大. ‧ 國. 學. Nat. n. al. er. io. sit. y. ‧. 圖 4-12 特徵相似度的計算步驟. Ch. engchi. 42. i n U. v.

(48) 實驗結果與討論. 5.. 在此節會應用前面介紹的各種分析工具的使用情況以及我們觀察的初步結 果,各種不同的分析工具可以帶來不一的觀點,讓研究者可以以多個面向去檢視 使用者行為的記錄資料。在特徵分析的部分,會介紹實驗步驟,也會從使用者使 用應用程式的頻率與順序的實驗結果作討論,包括如何對應用程式名稱編碼,資 料流對應的編碼,以及從龐大的資料流中找出的使用模式次數的排序,並說明次 數代表的意義與特徵的取樣。在 5.1 節 Log Charting Service 中會針對資料視覺化 後的圖表說明意義且統計應用程式被開啟的時間可以做為該程式是何種類別應. 政 治 大. 用程式的指標之一。5.2 節 Log Query Service 中從不同的使用者中觀察以時間、. 立. 數量作圖的三個特定的應用程式,發現相一個的應用程式會有約略相同的使用趨. ‧ 國. 學. 勢,以不同時期的使用次數也可以作為某個應用程式被使用的特徵。5.3 節 Log Real-time Monitor 開始從使用者使用應用程式的順序來觀察行為模式,以 app 被. ‧. 使用的順序來定義行為。5.4 節特徵分析接續 5.3 節行為模式的定義,將使用者. y. Nat. n. a. er. io. 期的相似度比對。. sit. 最常出現的行為序列記錄下來,當作該使用者的特徵,進行不同使用者間不同時. l 5.1 Log Charting Service. Ch. engchi. i n U. v. 本實驗將針對一個有趣的議題來說明 Charting Service 帶來的好處。這個議題 是有關於使用者在何時會頻繁的使用應用程式。此處將以現今 Charting Service 中顯示的圖表做一個快速的說明。資料收集時間:2011/05 – 2011/11。. 43.

(49) 政 治 大. 立. ‧ 國. 學. 圖 5. 1 此圖說明不同應用程式每一日被執行的次數,由上而下分別代表”所有應用程. ‧. 式”、”Htc launcher”、”facebook Application”、”Line Application”。. y. Nat. io. sit. 如圖 5. 1,htc launcher 與所有被執行的應用程式的分佈具有一定的相關性,. n. al. er. 這是因為對於所有應用程式在被關閉回到智慧型手機的首頁時便是呼叫 launcher。. Ch. i n U. v. 另外 facebook Application 被執行的次數則是最多次的,充分的說明對於現今智慧. engchi. 型手機的使用者而言,在手機上進行 Social Network Service 是非常重要的一個 因素。Line App 則是近期非常熱門的一個應用程式,藉由 Charting Service 研究 者可以清楚的看到最新最熱門的 App 被使用的情形,可以對於使用者使用的 Application 的趨勢有一個瞭解。 以上雖然說明了不一樣的應用程式每天被執行的次數會有不同,然而對於使 用者而言,假日或上學日執行的應用程式應該不同,對於每一個時間點會執行的 應用程式應該也有很大的不同。. 44.

(50) 圖 5. 2 此圖說明不同應用程式每個 weekday , hour 被執行的次數, (Left: Clock app , Middle: Dialer App , Right: All App 。x 軸表示星期日到星期六,y 軸表示每日 0 時到 23 時). 政 治 大 Application 正如同實體時鐘的用法,使用者通常會在睡前設定時間,而在早上 立. 圖 5. 2 說明了不同類型的應用程式在使用上時間的不同,最左邊的 Clock. Clock Application 會發出聲音,這類的應用程式使用起來相較於其他類型的應用. ‧ 國. 學. 程式有顯著的不同,另外對於進行通話這樣的行為,使用者多在平日的下課時間,. ‧. 也就是平日的 17 點到 18 點左右會有最顯著的使用情形,此外相較於其他日子,. y. Nat. 星期五下課之後的使用次數也是最多的。比較此處作為說明的兩種 Application,. er. io. sit. 可以發現一個幾乎都是在早上使用,另一個則是下午使用,這說明了不同的應用 程式使用時機上的不同,然而可以發現對於使用者而言這些應用程式使用的時機. al. n. v i n 平日使用大於假日,是否存在假日較常被使用的應用程式,這也是另一個問題。 Ch engchi U. 對於不同類型的應用程式經由 Charting Service,研究者可以很清楚的看到各 自類型應用程式的差異度,這提供了研究者一個很方便的觀察以及可以快速的篩 選出自己感興趣的議題的應用程式,然而對於功能類似但不同的應用程式此是否 在執行的時機上也有明顯的不同,由於平台尚沒有提供對於各類應用程式較為精 準可信的分類,這將會是一個對於研究使用者行為上的問題。. 45.

(51) 5.2 Log Query Service 我們對於使用者如何決定應用程式的”命運”有興趣;使用者在哪裡使用?使用 的頻率高低?甚麼時候使用?使用多長的時間?使用者是否會在對應程式失去熱情 後刪除? 用本實驗平台收集的資料跟 Log Query Service,我們可以對應用程式的 生命週期有新的看法。 在本研究中,我們觀察了 12 個月期間內的 3 個通訊相關的應用程式操作紀 錄,第一個是免費傳簡訊的應用程式,而第二、三個是免費網路通話應用程式, 我們比較 12 個月來的搜集記錄並觀察這些應用程式使用的變化量。. 政 治 大 歡免費傳簡訊的應用程式,雖然免費簡訊程式的使用量忽高忽低,從實驗的開始 立 初步對收集資料的觀察來看,我們發現與免費網路通話程式比起來,使用者更喜. 到結束還是保持著長時間的持續使用量,最短的持續使用了 3 個月,而最長的已. ‧ 國. 學. 經超過 12 個月,平均的使用時間是 8 個月。相較之下,兩個網路通話程式在圖. ‧. 形統計上,都有中斷和較離散的部分,這些大多是連續使用不超過兩個月。準確. y. Nat. 的來說,第一個通話程式的平均生命週期為 1.67 個月,分佈在幾個小時到三個. n. al. er. io. 5-1。. sit. 月之間,而第二個通話應用程式的平均生命週期為 2.22 個月。比較表格如圖. Text App. C h(Per month) engchi Average logs. i v Life Cycle Average n U (Months). 476.41. 8+. Voice App 1. 31.28. 1.67. Voice App 2. 142.09. 2.22. 表格 5-1 Usage comparison for the three apps. 因為使用者下載應用程式的時間都不相同,很難對每個使用者定義絕對的應 用程式開始使用的時間點。然而,如果我們對個別使用者的使用情況作比較,我 們還是可以觀察出相似的下載和使用之序列如圖 5-1、圖 5-2. 46.

(52) Usage. 250 200 150 100 50 0. Text Voice 1 Voice 2. 100 80 60 40 20 0. Text. 政 治 大. 立. Voice 1 Voice 2. 學. ‧ 國. Usage. 圖 5-1 User1 所使用的 3 種通訊 app 的數量. 圖 5-2 User2 所使用的 3 種通訊 app 的數量. ‧. 觀察簡訊程式的使用量,我們可以看到雖然使用的曲線不完全重疊,但是在. y. Nat. sit er. al. n. Ch. engchi. i n U. v. User 1 User 2 User 3. 2011/11. 2011/10. 2011/09. 2011/08. 2011/07. 2011/06. 2011/05. 2011/04. 2011/03. 2011/02. 2011/01. 2010/12. User 4 2010/11. 400.00 350.00 300.00 250.00 200.00 150.00 100.00 50.00 0.00. io. Usage. 不同使用者中都呈現相似的趨勢。. 圖 5-3 四位使用者的免費簡訊程式使用量. 進行深入的探討,發現使用者 3 (也是圖 5-1)陳述使用應用程式有三個階段: 初期的體驗、然後逐漸的平衡程式的使用量、如果覺得應用程式合適,會將沒有 用到的應用程式刪除。以傳簡訊程式為例,在一開始的階段,使用者 3 覺得這個 47.

(53) 應用程式很有趣且吸引人,讓他頻繁的使用。然而使用者 3 沒有打字的習慣,使 用的頻率隨著新鮮感的降低而下降了,在夏天中不尋常的高頻率使用免費簡訊應 用程式是因為使用者 3 去旅遊,需要用較有效率且便宜的方式來聯絡家人、朋友。 當被問到有關其他兩個通話程式的使用情況時,使用者 3 表示因為他的聯絡人中 很少人使用這兩個軟體,所以沒有進一步設定,因為通話程式一段時間沒有使用, 使用者 3 覺得記憶體空間不足,就將沒用到的應用程式刪除。 在此案例中,我們觀察到雖然 3 個應用程式都是以免費通訊為目的,使用模 式和應用程式生命週期隨著應用的不同而有極大的差異,免費傳簡訊應用程式似. 政 治 大 Log Real-time Monitor 立. 乎是比較耐用的,其他兩個通話程式,只能引起使用者短期的興趣。. 5.3. 研究者如果要對智慧型手機使用者的使用行為進行分析,如果事先知道操作. ‧ 國. 學. 行為會產生出 Log Pattern,將會在分析上更清楚,經由 Log Real-time Monitor 的. ‧. 協助,研究者可以立刻從畫面上取得操作行為所產生的 Log List,對於使用者在. y. sit. io. n. al. er. 出操作行為。. Nat. 手機上進行了哪些必須的操作而其所產生的 Log List 將會更容易且清楚的定義. Ch. engchi. i n U. v. 圖 5-4 Real-time Log Monitor. 如標示出來的 Log 是跟通話有關的操作行為,經由 Log Monitor 研究者可以 觀察到 com.android.phone .InCallScreen 是使用者在進行語音通話必定會啟動的 Activity,然而對於進行語音通話的方式可能有很多種,如手動輸入號碼或是快 48.

(54) 速撥號等方式,對於經由不同方式達到同一行為的意圖,對於大部分的應用程式 應該會具有類似的情形,例如分享照片等。所以單獨的 Log 很明顯是不夠的, 可能必須結合前後數個 Logs,產生特定的 Pattern,才有足夠的資料做更進一步 的分析。例如使用者是經由聯絡人列表來進行語音通話,則在.InCallScreen 之前 必定先經由 com.android.htccontacts .ContactDetailLayerCarouselActivity ,也就是 說如果要經由語音通話則至少需要經過兩個 Activity 的啟動,結合這兩個 Activity 則可以定義操作行為會產生的 Pattern。 在此處將說明經由 Log Real-time Monitor 產生的 Log List 協助,所找到進行. 政 治 大. 語音通話所產生的操作行為模式。. 立. Enter phone number using keypad. 學 ‧. ‧ 國. . er. io. sit. y. Nat. al. n. v i n Ch 圖 5-5 Left:手動輸入號碼步驟以及對應產生的 U Right:手動輸入號碼手機畫面 e n g c Log h i流程圖 使用時機:當想要通話的對象不在聯絡人清單或是已經熟記該聯絡對象的號 碼,則使用者會藉由此一方法進行語音通話(如圖 5-5)。 . Contact List. 49.

(55) 圖 5-6 Left:經由通訊錄進行通話的步驟以其對應產生的 Log 流程圖 Right:手機通訊錄畫面. 使用時機:當聯絡對象已於先前存入連絡人清單,但對聯絡人電話不熟,或是. 政 治 大. 久未聯絡會經由此方式進行語音通話(如圖 5-6)。. 立. Call history. 學 ‧. ‧ 國. . er. io. sit. y. Nat. al. 圖 5-7 經由通話記錄進行通話的步驟以其對應產生的 Log 流程圖 Right:手機通話記錄畫面. n. v i n Ch 使用時機:當有來電未接或是最近有通話過的連絡人,要進行通話時使用者 engchi U. 可直接從 call history 撥打電話(如圖 5-7)。 . Favorite contact. 50.

數據

圖  5-13  User10 前半資料為 Training  Data 與所有使用者後半資料作為 Test Data .............................................................................................
圖  1-1 OUR MOBILE PLANET 統計台灣地區的智慧型手機普及率
圖  3-3:User 產生的 Log 會先存在 Mobile DB 中,之後再透過 3G/WiFi 將資料傳送到遠端的 Database 上,研究者之後可以針對這些 Log 進行查詢
圖  3-11 Real-time Log Monitor  研究者可以藉由觀察即時產生的 Log 資料,以得到特定操作 序列所產生的行為模式    本章從使用者的來源、log 資料如何蒐集以及資料如何觀察與分析,在介紹 了各種工具後,回到本研究的目的,為了瞭解使用者行為模式,將資料視覺化的 工具用不同角度的圖表呈現,有個人、有群體、有用應用程式類別去區分、也有 以標示著地理位置的地圖,從中找到每個使用者與其他人的不同,以定義使用者 的特徵。
+7

參考文獻

相關文件

事實 1: 很多家庭暴力因為社會對受害人的支持不足,而使受害人沒有勇氣公

資料探勘 ( Data Mining )

利用 Web Survey 來蒐集資料有許多的好處。許多研究者利用 Web Survey 進行研究的主要原因在於可以降低成本、即時的回覆。然而,Web Survey

I-STD 是在資料以漸進式增加的前提下進行資料探勘,在醫院的門診診斷紀 錄中,雖然每個月門診數量不盡相同但基本上仍有一固定總門診數量範疇,因此 由圖

解決方案:取出圖表說明並開啟原始的 PDF 檔供使用者瀏覽 利用資料庫語法來可得知圖表所在的位置,因此可使用 adobe acrobat 函式庫中的

為完成上述研究目的,本文將於第二章依序說明 IPTV 的介紹與現況,以及詳述 e-SERVAUAL

Table 本身可以轉變為 Element type。在文件中每一行的資料 都會產生一個 element , 假如這個模組的內容是 EMPTY 就將 columns 轉變成

粒子所具有之初始動量較大,因此,在流場改變時,粒子受到流場的