• 沒有找到結果。

第一章 緒論

隨著資訊相關產業的發展,雖然提升了許多民眾在生活上資訊化的便利,但是卻 也產生了新的問題:那就是數位落差(Digital Divide)。根據經濟合作發展組織 OECD 的定義,數位落差是指存在於個人、家戶、企業在不同社經背景或居住地理區位上,

另外國內外目前針對數位落差資料以資料倉儲(Data Warehousing )、線上分析處 理(On-Line Analytic Processing, OLAP)與資料探勘(Data Mining)等技術來進行分析與 歸納的研究尚不多。設定資料方塊體(Data Cube)仍需資訊技術人員撰寫資料庫程 式規範,傳統採問卷調查的研究者很難將分析理念由程式表達,因此需要一種資料處 理系統或機制,可以協助領域專家或資料分析者從專業角度直接去分析所感興趣的欄

2

在資料前處理階段,使用了資料淨化(cleaning) 處理、資料平滑(smoothing)、聚 集(aggregation)與正規化(normalization)等處理,並提出了問卷題目量化轉換 (Questionnaire Item Normalization and Measure Transformation, QINMT)演算法,

來將問卷中不同的題型答案資料轉為可適用於資料立方體中的量值形式。

(2). 資 料 倉 儲 之 建 置 階段:

本 研 究 提 出 了 多 維 度 概 念 階 層 知 識 擷 取 (Multiple Dimension Concept Hierarchy Knowledge Acquisition, MDCHKA) 演 算 法 , 來 擷 取 領 域 專 家 對 問 卷 中 的 概 念 階 層 知 識,其中量值概念階層知識,可以指 (drill-down)等 OLAP 基本查詢操作,即可進行資料立方體的線上分析。資料探勘 [8]分析部分,基於資料探勘輔助系統(Data Mining Assisted System,DMAS)的核心 技術基礎下[5],本研究完成了使用兩層式資料探勘方法之 DMAS 線上資料探勘 系統OLAM(On Line Analytical Mining, OLAM),這是結合了分群演算法

3

分析出學校資訊能力類別,然後再使用決策樹演算法針對資訊能力類別建立決策 樹,之後則可透過建立好之決策樹模型,進行預測查詢分析。透過此分析系統,

分 析 者 可 以 更 便 利 的 進 行 資 料 探 勘 分 析 。

除了上述的資料倉儲問卷分析架構之設計之外,關 於 實 作 部 分,我 們 參 考 由 曾 憲 雄 、 張 維 安 、 黃 國 禎 教 授 等 , 所 提 供 的 中 小 學 數 位 落 差 之 相 關 研 究 資 料 。 進 行 了 相 關 的 實 作 與 驗 證 , 由 於 這 些 相 關 資 料 的 協 助 使 本 論 文 的 研 究 內 容 更 加 充 實 完 整 。

綜合以上所述,本篇論文之主要研究貢獻如下:

z 提出一個可處理不同問卷題型量化問題之資料轉換演算法。

z 提出多維度概念階層知識擷取方法,以利建立資料立方體(Data Cube)。

z 結 合 現 有 線 上 分 析 處 理 OLAP 工 具 , 提 出 資 料 分 析 流 程 之 架 構 。 z 完 成 DMAS 線上資料探勘系統 (DMAS-OLAM)分 析 系 統,輔 助 分 析 者 更 容

易 進 行 資 料 分 析 。

1.3. 論文架構

本篇論文共分為七章,第一章為緒論,第二章為相關文獻探討,介紹現今問卷分 析方法相關的研究。第三章則說明我們提出的應用資料倉儲技術之問卷分析架構的設 計,第四章為資料前處理之步驟,以及將問卷填答資料及相關資料轉換成量值與維度 資料的前處理過程與演算法,在整理了資 料 維 度 與 量 值 後,也 說 明 如 何 將 之 建 置 成 資 料 倉 儲 中 資 料 立 方 體。第五章則是針對中小學數位學習落差資料立方體,

進行線上分析及資料探勘系統之分析方法。第六章為系統實作,介紹我們完成之分析 系統並呈現相關結果與分析,最後一章為本篇論文的結論與對未來研究的建議。

4

相關文件