• 沒有找到結果。

學校圖書館是學校實施教學的據點

N/A
N/A
Protected

Academic year: 2021

Share "學校圖書館是學校實施教學的據點"

Copied!
49
0
0

加載中.... (立即查看全文)

全文

(1)

第二章 文獻分析

第一節 學校圖書館的經營與服務

學校圖書館係指高中、高職、特殊學校、國中、國小等級學校的圖書館,

不與大專校院圖書館混淆,因此定名為中小學圖書館,又叫學校圖書館。由 於現代的教學方式偏向以學生為中心的學習、學生自習能力的提升以及個別 興趣能力的尊重和培養,因此大大地改變了中小學圖書館的利用功能,所以 現代化的「教學資源中心」的經營型態,成為充分而必要的趨勢,在這樣教 育改革的時期,建立學習社會的環境裡,中小學的圖書館是培養學生「如何 學習」關鍵能力的好資源[65]。

壹、學校圖書館的功能

一、學校圖書館設立的目的

學校圖書館在圖書館體系的發展,不若其他類型圖書館受到重視,甚至 在教育經費不充裕的情況下,有些學者認為學校圖書館的功能可由公共圖書 館取代之。1980年國際圖書館協會聯盟(IFLA)在馬尼拉召開學校圖書館 會議,會中討論並修訂由澳大利亞聯教組織國家委員會提出「學校圖書館宣 言」草案( Draft Manifesto on School Libraries),才受到世界各國決策機關 及學校重視並參照施行。該宣言於同年12月由聯合國教科文組織正式公布。

宣言中指出:「學校圖書館是國家圖書館事業的一種類型,它不但屬於整體 圖書館事業中有機組成的一部分,也是在中、小學學校中重要的組成單位,

是學校教育、教學必不可缺的基本設施和重要條件。」[40] 此份宣言,不 但肯定學校圖書館的定位,並可指出學校圖書館在經營上與其他圖書館不同 的特點:

1. 學校圖書館是附屬於學校組織體系的單位;

2. 學校圖書館主要服務對象是學校內的教師、職員與學生;

3. 學校圖書館是學校實施教學的據點。

由此可見,學校圖書館與教育之間的關係是相互依賴的,學校圖書館所 發揮的功能以教育功能所占的比例最大,幾乎可劃上等號,楊國賜更進一步 指出,在支援教學方面,圖書館提供教與學的資源及諮商服務,是帶動教學

(2)

正常化、學生主動學習的機制[11]。

王振鵠(民73)強調學校圖書館的功能是以學校本身的功能為依歸,學 校教育目標在於培養學生學習方法,及自我啟發、自我訓練和自我評價的精 神與具有運用資料解決問題的能力,具體的功能則有[4]:

1. 蒐集教學及個人閱讀研究所需的圖書資料, 以充實學生知能。

2. 指導學生為適應其個人興趣和課程上的需要選擇圖書資料。

3. 提高學生利用圖書和圖書館的能力, 並培養其自學習慣。

4. 鼓勵學生利用圖書館的資料, 從事自我教育。

5. 幫助學生利用圖書資料, 增廣其多方面的興趣。

6. 培養學生良好的公民道德習慣, 並增長其社會經驗。

我國學校圖書館之功能與任務,在高級中學圖書館設備標準原則之第2 條及第3條亦說明:高級中學圖書館之設立,應針對高級中學之教育目標,

藉圖書資料之採集、組織、保存與運用,以支援教學活動,培養學生自學技 能,輔導學生身心之發展,滿足青少年休閒之需要;高級中學圖書館之經營,

須與教學活動緊密結合,館藏之發展,尤應以符合課程及教學之需要為優先 考慮。從以上的說明可知我國學校圖書館設立之功能亦是以支援學校教學活 動與計畫為出發點。

另外在高級中學圖書館工作手冊也有提到學校圖書館應以「教學資源中 心」的角色自我期許,力求發揮下列五種功能[30]:

1. 提供教學資源的功能 2. 協助學習研究的功能 3. 輔導品格發展的功能 4. 安排知性休閒的功能 5. 促進終身學習的功能

綜合以上的觀點,學校圖書館的經營應是以教育為出發點,滿足教師教 學與學生需求為其中心工作,因此學校圖書館是一個幫助學生學習與自學的 場所,同時提供教育所需的相關資源。

(3)

二、學校圖書館的組織

高級中學圖書館有獨立之組織編制,圖書館工作人員主要可區分為[1]:

1. 圖書館主任:根據高級中學圖書館法及臺灣省立高級中等學校教師 兼任行政職務人員遴選要點之規定,高級中學應設圖書館主任一 位。

2. 管理人員:根據教育人員任用條例,得設管理人員若干員,但因高 中圖書館未設圖書專業職員編制,所以這裡的圖書館管理人員即為 學校職員的一部分,即為幹事,由校長派任。

3. 組長:根據省公報 84 年冬字 28 期中規定,當年度獲遴選為高中圖 書館重點學校者,或曾獲選為高中圖書館重點學校可增設一至二名 組長。另外在「完全中學試辦學校行政處理暫行要點」亦有規定,

完全中學圖書館可設讀者服務及技術服務組長各一位。

4. 工友:學校編制內人員調派,負責圖書館清潔維護及其他臨時事務 工作。

5. 其他相關人員:包括工讀生、學生義工及社會義工等。

在工作人員資格認定方面,高級中學圖書館設立及營運基準中規定圖書 館主任或圖書教師應由教師兼任,並規定圖書館主任或圖書教師應受過圖書 館專業知能訓練,其規定圖書館主任應有專業知能須符合以下條件之一者 [18]:

1. 國家公務人員高等考試暨普通考試圖書資訊管理類科(含圖書館類 科)及格;或相當高等考試暨普通考試之特種考試圖書資訊管理類 科(含圖書館類科)特考及格,並取得任用資格者。

2. 國內外大學校院圖書館本科系、所或相關學系、所畢業者。所稱本 科系、所或相關系、所,由各高級中學認定,如認定有困難者,得 送請主管教育行政機關認定之。

3. 國內外大學畢業,並曾修習圖書館專門科目(含在職進修專班、推 廣教育學分班)二十學分以上者,或參加經主管教育行政機關核准 或委託之圖書館、大學校院、圖書館專業團體辦理之圖書館專門科 目修習二十學分以上者。所稱專門科目學分,由各大學校院認定,

如認定有困難者,得送請主管教育行政機關認定之。

4. 國內外大學畢業,並有圖書館專門學科論著經公開出版及曾任公立

(4)

或經主管教育行政機關許可設立之私立圖書館三年以上之專業工 作經驗者。

5. 具有中等學校合格教師資格並持有圖書館科加科登記證明者。

三、學校圖書館服務項目

高級中學圖書館業務性質分項,其要項如下[18]:

1. 技術服務:包括採訪、編目等有關事項。

2. 讀者服務:包括典藏、閱覽、參考諮詢、資訊檢索、館際互借、文 獻傳遞、特殊讀者(視覺及聽覺障礙等)服務、利用教育等有關事 項。

3. 資訊服務:包括數位典藏服務、圖書資訊網路資料庫之建立及維護 等有關事項。

4. 行政服務:包括行政管理、推廣輔導、館際合作、設立及營運規劃

、館藏發展、館舍設備、人員配置、經費編列、業務評鑑等有關事 項。

高級中學圖書館應實施圖書館利用教育,以協助師生充實資訊素養、利 用圖書資訊、擴大學習領域、奠定終身學習能力。高級中學圖書館之利用教 育實施方式如下[18]:

1. 開設圖書館利用教育相關課程。

2. 支援其他學科及單元教學,實施協同教學。

3. 辦理有關圖書館利用教育之各種演講、研習、展覽、競賽等活動。

4. 輔導成立有關圖書館利用教育之社團。

根據以上所述,學校圖書館的功能是在協助教學,透過圖書館可以讓老師與 學生在教與學之間獲得相關的參考資訊,同時也提供學生自我學習自我成長的一 個空間,另外學校圖書館也間具有休閒的功能,讓老師與學生在教學之外可以從 事正當的休閒活動。

(5)

第二節 資料倉儲

壹、資料倉儲的定義

企業的經營要能成功且持續的成長,就必須要有優於他人的競爭力及競 爭優勢,拜資訊科技之賜,幾乎所有的企業皆已藉由部分或全面的電腦化來 提昇其產能、效能與服務品質等。隨著電腦化的普及,產生了大量的資料,

當一般的企業還停留在以交易為導向的資料庫來處理資料時,如何運用此大 量資料作有系統的彙整與分析,幫助企業的經營策略作調整,以節省成本、

增加獲利,提高企業的效能與競爭力,其中最佳的選擇就是「資料倉儲」 建置資料倉儲的主要目的在於整合異質性的資料,解決資料庫分散各處 的問題,以幫助資料分析,對於資料倉儲的定義,各學者以不同的角度解釋 如下表2-2-1:[45]、[49]、[51]

表2-2-1 學者對資料倉儲定義一覽表

文獻 資料倉儲的定義

W. H. Inmon,

(1996)

資料倉儲是—

¾ 主題導向的(subject oriented)。

¾ 整合性的(integrated)。

¾ 歷史性的(time variant)。

¾ 時間變異性的(Time-variant)

Han & Kamber

(2001)

資料倉儲是一種架構及工具,能夠有系統、有組織的了解 企業的業務執行,其所提供資料並可提供相關決策的制定。

資料倉儲是一種語意一致的資料儲存,他充當決策支援資 料模型的實體實作,存放著企業策略決策時所需要的資訊。

Kimball (2002) ¾ 資料倉儲不是一項產品,而是一種程序(Process)

¾ 資料倉儲應用與建置除了要有正確的資料來源外,並 需要產業知識的結合。

¾ 資料倉儲使各單位累積的資料容易被讀取與使用,單 位所提供資訊格式是一致的。

¾ 它提供一個合適且有彈性的資訊資源,當新資料加入 資料倉儲時原有查詢架構不需改變。

¾ 它提供另一種資訊資產的儲存方式。

¾ 它是圖書館經營策略制定時的資訊基礎架構。

資料來源:本研究整理

(6)

以下則就資料倉儲之父Inmon(1996)於「Building the Data Warehouse」書 中,對於資料倉儲四個特性與一般例行性交易系統提出說明:[46]

一、主題導向(Subject-oriented)

資料倉儲系統處理資料非日常操作交易資料,它為輔助決策者作資料分 析,所以它必需依某個主題或領域來建置。以保險業為例,一般交易操作系 統以壽險、健康險、意外險等產品為主題,而資料倉儲則以顧客資料、保險 費成本分析、理賠資料分析等為主題。

二、整合性(Integrated)

資料倉儲系統之資料來源為不同操作系統或異質資料庫,資料型態與定 義在其原有系統或資料庫中,可能有不一致的定義,但此資料在進入資料倉 儲前,必須先經由轉換、篩選或淨化過程,所以其資料具有整合性的特性。

例如,系統A 其男/女定義為M/F、系統B 其男/女定義為1/0、而系統C 其男 /女定義為X/Y,所以在彙整成資料倉儲時,必須重新定義為M/F。

三、資料的不變性(Nonvolatile)

資料倉儲系統與日常操作交易系統是獨立的,一般操作交易系統其資料 庫皆提供資料新增、修改、刪除、查詢等功能,而資料倉儲系統之資料庫僅 是資料載入與資料讀取分析功能,其新增、修改與刪除等異動功能,需在原 有操作系統之資料庫處理。所以資料倉儲的資料具有不變性的特質。

四、時間變異性(Time-variant)

一般操作交易系統(OLTP)之資料處理,為即時與日常性每日交易資 料,而資料倉儲系統處理資料為過去歷史與年度或季節性資料。並經由過去 歷史性資料累積,以時間因素為角度來分析,提供長期性資料趨勢與特性,

作為支援決策的依據。所以,一般資料倉儲皆有設計時間維度,來分析其資 料長期性趨勢與特性。

貳、資料庫與資料倉儲之比較[20]

資料倉儲與傳統運作系統在資料庫的設計上以及對系統預期的作用是 不同的,運作系統組織架構的設計是為了支援資料庫的線上交易處理 (OnLine Transactional Processing, OLTP),例如訂單輸入、銀行的存取款等作 業,需具備快速的交易處理需求。而資料倉儲的組織架構設計,則是依據特 定的主題 (subject) 而定,例如行銷、產品等。兩者的比較列於表 2-2-3[67]。

(7)

表2-2-2 資料庫線上交易處理與資料倉儲比較表 資料庫的線上交易處理 資料倉儲

組織架構 依執行的交易而定(如訂單處

理、進銷存處理等) 依主題而定(如產品、顧客等)

使用者的數量 大量的同時上線的使用者

經常的使用者人數可能只有 數百人或更少 (如分析或業務 或行銷資料)

交易的數量/

處理時間

交易時間通常很短,只存取數 筆資料;交易處理在數秒間完

處理查詢的交易時間可能長 達數分鐘到數小時;查詢次數 少;但很複雜,通常是檢索許 多筆資料,並需要結合(join) 多個資料庫的表格

資料庫的大小

OLTP 的資料庫通常小於資 料倉儲;因為歷史資料會移 出,不在線上。

資料倉儲的資料量通常遠大 於OLTP資料庫,因為其中整 合 了 數 種 資 料 來 源 ( 包 括 OLTP),也包括歷史資料。

結構

高度正規化的資料結構,由許 多表格組成,每一個表格設計 是愈少欄位愈好。

表格數量較少(因為有特定的 主題),但欄位的數量很多。

歷史資料 線上只維持在較短期間的資 料。

維護的資料可能回溯到數年 以前。

更新處理 當新交易被處理或輸入時,持 續性的更新(近乎即時)。

期間性的更新,通常以批次的 方式 (例如為了反應OLTP資 料的變更)。

資料來源:http://www.gss.com.tw/eis/16/dataware.htm (2004.01.10)

因此資料倉儲不同於日常營運的交易資料庫,通常是基於公司特殊的需 求而建置的,它將日常的交易資料庫經過資料庫架構的分析,依據分析上的 需求而萃取出其中一部分所需的資料進行規劃、整理,並設計應用程式,主 要是為了協助工作人員執行管理決策。

(8)

另外由於資料倉儲具備將資料整合的特性,對於分散於不同系統間的資 料而言,資料倉儲能提供穩固的平台,以整合性的架構將系統進行整合,有 效規劃歷史資料的管理。

林傑斌、劉明德(民91)強調需要建立完整、正確的資料倉儲架構下,

OLAP 及 DATA MINING 才能發揮最大的效能,資料如未經整合、篩選、過 濾等建置過程,則線上分析處理(OLAP)與 Data Mining 其功能與效益將 大打折扣。[12]

參、資料倉儲的架構:

Han & Kamber(2001)於「Data mining Concepts and Techniques」書中 把資料倉儲架構分為三層。資料倉儲的資料來源為現有操作系統或其它外部 資料,並經由篩選、轉換、擷取,轉至最底層的資料倉儲Server。最底層的 資料倉儲Server 其架構除資料倉儲外,還包含資料超市(Data marts)或定 義資料結構的詮釋資料(Metadata)。資料倉儲資料經由中間層次資料模式 與維度定義、資料儲存格式與Cube 預存處理;輸出層最前端為一般使用者 報表、查詢、OLAP 或 Data Mining 等分析工具的利用。[49]

圖2-2-1 資料倉儲架構(Han & Kamber,2001)

一、ETL(Extract Transform Load)轉換階段

資料倉儲其資料來源為現行內部運作的前端交易的操作系統,或外部提

(9)

供的其它資源系統,或不同平台的異質資料庫,所以其資料型態格式與定義 可能不一樣,因此資料倉儲在建立之前,必須面對異質性資料庫與資料格式 重新定義與整合。如何將各式不同的資料型式與定義,重新彙整再定義,是 建置資料倉儲的過程重要的階段。而資料倉儲建立後,後續如何將資料定期 更新與重新載入,以維持資料倉儲的資料與其來源資料的一致性,則是資料 倉儲系統維護階段最重要的議題。根據一般資料倉儲專案執行經驗,資料倉 儲建置過程中,大部份作業時間都花在資料擷取(Data Extraction)、資料轉換 (Data Transformation)與資料載入(Data Loading),因此ETL(Extract Transform Load)該階段工具利用與資料整合,為資料倉儲建置中最重要的工作項目。

一般 ETL(Extract Transform Load)工作事項包括下列事項:

1. 資料擷取 (Data Extraction) :擷取不同平台或異質資料庫的資料檔 案,這些檔案資料格式可能包括:關聯式資料庫、階層式資料庫、

文字檔、或其他特殊資料檔案格式。

2. 資料轉換(Data Transformation):資料轉換的工作是整理所擷取的資 料,並重新定義資料格式以便載入到資料倉儲,其工作包括資料清 理(Scrubbling)、驗證(Validation)、整合(Integration)、非正規化處理 (Denormalization)與彙總處理(Summalization)。

3. 資料載入(Data Transformation):把經由轉換處理的資料載入至 資料倉儲的資料庫裏,而後續資料倉儲資料的累積、定期重新載入 與更新為資料倉儲系統維運階段最重要的工作項目。

二、資料超市(Data Mart)

資料超市為一小型的資料倉儲系統,邏輯上為資料倉儲的一個子集合,

其規模較資料倉儲為小,可能涵蓋範圍為企業組織某一特定部門或區域的主 題範圍,僅能提供該部門或區域的資料,並給予特定人員或部門使用,以符 合實際運作需求。但其技術架構處理、綱要設計或建置過程皆與資料倉儲無 異。

三、詮釋資料(Metadata)

所謂Metadata 最為一般人普遍接受的定義是「資料中的資料」(data about data),用來描述與摘要資料倉儲中資料屬性與結構的定義資料;經 由Metadata對於資料一致性的定義,可以使資料倉儲在建置時,容易彙整擷 取相關資料;系統功能新增時更容易維護與管理,對於後續資料倉儲之資料 整合與資料運用有很大的幫助。

(10)

因此我們可以得到以下資料倉儲的示意圖2-2-6:

圖2-2-2 資料倉儲示意圖

(http://www.sysage.com.tw/Gst/Solution/GSolOne.asp?nPK=9,2004.01.10)

肆、線上分析處理(Online Analytical Processing,簡稱 OLAP)

線上分析處理意指一些使用者在線上完成的作業,例如在線上透過試算 表與圖片的DSS 模式。OLAP 與線上交易的不同,在於 OLAP 簽涉到許多 關係複雜的資料項目。OLAP 的目標之一即是分析這些關係,並找出模式、

趨勢以及例外的條件。

一個OLAP 資料庫中的銷售資料很可能已從地區、產品種類,與銷售 通路等觀察點進行資料的合併。一個典型的OLAP 查詢可能會進入一個容 量有好幾GIGABYTE,橫跨數年的銷售資料庫,以找出各地區在每年中所 有產品種類的銷售量,瀏覽過這些資料之後,分析師可能會想進一步查詢在 各地區或各種類產品中,銷售通路的表現如何。最後,分析師也許會想查詢 每一年或每一季,在每個銷售通路中銷售的比較。整個流程一定要在線上以 快速的回應時間完成,才不會防礙分析的流暢性。OLAP 可視為具有下列特 色的線上分析:

(11)

1. 存取大量的資料,例如:數年份的銷售資料。

2. 分析各種類型之企業元素的關係,例如銷售、產品、地區及通路等。

3. 牽涉到合併的資料,例如銷售量、預算金額、以及支出金額。

4. 由短而長的時間間隔進行合併資料的比較─ 從每個月、每一季到 每一年。

5. 從不同的觀點呈現資料,例如每個地區的銷售量與每樣產品的銷售 量,或每個地區、每樣產品的銷售量。

6. 牽涉到資料元素之間複雜的運算時,例如預期利潤可視為某地區中 每種銷售通路的銷售收入的一個函數。

7. 快速回應使用者的查詢,使得使用者的分析思考不會因為系統遲緩 而被打斷、干擾。

OLAP 執行時會進行預先彙總處理(per-aggregate),將要分析資料依 據先前設計好的維度與量值預先彙總處理,使用者在執行查詢時,可直接存 取之前已預先彙總好的資訊,OLAP 經由事先定義好的維度的上拉

(Roll-UP)、下拉(Drill-Down)、切丁(Dice)、切片(Slice)、轉軸(Pivot)

等操作運算來檢視其資料,其研究方式為假設導向(hypothesis driven)-建 立假設再驗證其結果。

有些廠商如SAS 公司會提供自然語言介面。該查詢會轉換成 SQL 格 式,並且透過網路,傳送到掌管該資料庫或資料倉儲的資料庫管理系統 (DBMS)。資料庫管理系統找出查詢時的答案之後,然候再傳回給使用端。

最後,使用者可以根據自己的需求設計出一份報告,並且用來展示該查詢結 果。企業在今日,還可以透過企業內部的網路或是網際網路進入OLAP 資料 庫。

雖然OLAP 在許多實際使用情況下都非常好用,但其基本功能是回顧既 有的歷史資料,不能提供自動的、預測的知識,但是我們卻可以依據舊有的 資訊,來評估未來的可行性與決策方向。

伍、多維度資料模型

資料倉儲和OLAP 工具是以多維度資料模型來作分析,該模型將資料看 做是資料立方體(Data Cube),資料立方體允許以多重維度對資料建立模型 和觀察。通常,多維度資料模型圍繞著中心主題加以組織,該主題用事實表

(12)

PERIOD KEY

Store Dimension Time Dimension

Product Dimension STORE KEY

PRODUCT KEY PERIOD KEY

Dollars Units Price

Period Desc Year

Quarter Month Day

Current Flag Resolution Sequence Fact Table

PRODUCT KEY Store Description

CityState District ID District Desc.

Region_ID Region Desc.

Regional Mgr.

Level

Product Desc.

Brand Color

SizeManufacturer Level

STORE KEY

(Fact Table)來表示,事實表包括事實表的名稱或度量,以及每個相關維 度表關鍵字,例如,在一個銷售紀錄資料倉儲中,事實表包含銷售的款項、

銷售量和供應總量等的度量值。

多維度資料模型是資料倉儲的資料模型中,最常用的形式,多維度資料 模型可以是以星狀綱要模式、雪花狀綱要模式或事實星座模式的形式存在,

以下針對這些模式簡要介紹:[49]

一、星狀綱要模式(Star Schema)

此綱要中資料倉儲包含兩部分:

1. 一個大型包含大量資料和不包含冗餘的事實表。

2. 一組小的維度表,每個維度都有一個相對應的維度表。

這種模式很像星星爆發,眾多的維度表環繞在事實表四周形成輻射狀。

如圖2-2-3 所示:

2-2-3 星狀綱要模式(Han & Kamber,2001)

二、雪花狀綱要模式(Snowflakes Schema)

雪花狀綱要模式是星狀綱要模式的變形,其中的某些維度經過統一化,

因而把資料進一步分解並附加,結果綱要圖形就類似於雪花的形狀,如圖 2-2-4 示。這樣的綱要表易於維護,並節省儲存空間,但是由於執行查詢需

(13)

要較多的連結操作,因此雪花狀綱要可能降低瀏覽的性能。

2-2-4 雪花狀綱要模式(Han & Kamber,2001)

三、事實星座模式(Fact Constellation)

這類的綱要模式,可以視作星狀綱要模式的一群組合,因此又被稱為星 系綱要模式(Galaxy Schema),如圖 2-2-5 所示。

2-2-5 事實星座綱要模式(Han & Kamber,2001)

STORE KEY Store Dimension

Store Description City

State District ID District Desc.

Region_ID Region Desc.

Regional Mgr.

District_ID District Desc.

Region_ID

Region_ID Region Desc.

Regional Mgr.

STORE KEY PRODUCT KEY PERIOD KEY

Dollars Units Price

Store Fact Table

Dollars Units Price

District Fact Table District_ID PRODUCT_KEY

PERIOD_KEY Dollars Units Price

RegionFact Table Region_ID PRODUCT_KEY PERIOD_KEY

Dollars Units Price

District Fact Table District_ID PRODUCT_KEY PERIOD_KEY

Dollars Units Price

Region Fact Table Region_ID PRODUCT_KEY PERIOD_KEY PERIOD KEY

Store Dimension Time Dimension

Product Dimension STORE KEY PRODUCT KEY PERIOD KEY

Dollars Units Price

Period Desc Year Quarter Month Day Current Flag Sequence Fact Table

PRODUCT KEY Store Description

CityState District ID District Desc.

Region_ID Region Desc.

Regional Mgr.

Product Desc.

Brand Color Size Manufacturer STORE KEY

(14)

陸、相關資料倉儲論文研究

利用資料倉儲作為研究技術的,絕大多數都是利用OLAP 進行資料倉儲的分 析,例如:

曾美卿(民92)利用國立中正文化中心(兩廳院)現有檔期安排系統 中,有關節目基本資訊如節目分類、演出時間等資料;及售票系統中會員交 易、節目票房銷售等資料,建立會員交易及節目銷售之資料倉儲雛型。並以 OLAP(On-Line Analytical Processing )技術,分析相關資料與趨勢,協助行銷 宣傳或客戶關係管理相關策略的制定,有效的維持與增加觀眾對表演藝術節 目的參與率[24]。

翁勝妙(民91)提到學術上線上分析處理文獻大都徧重於決策支援的 應用,較少探討應用線上分析處理於客戶關係管理,因此研究中主要是運用 資料倉儲建構客戶關係管理,首先進行客戶關係管理系統導入資料倉儲的各 項步驟分析,再進一步運用資料切割結合Web 化的使用介面來進行資料與 權限的控管並建構出以資料倉儲及線上分析處理技術為核心的客戶關係管

理系統,並提供客戶完整的資訊,強化客戶對企業的忠誠度與滿意度[17]。

邱德生(民91)將實際建構設備管理資訊系統資料倉儲(Data Warehouse for Equipment-Related Management Information System, DW-ERMIS)系統,

透過資料萃取轉換載入(ETL)等步驟,將資料庫內的資料載入到以星狀綱 要(Star Schema)及雪花狀綱要(Snowflake Schema)為其設計架構的資料 倉儲中,並對經常查詢之設備統計資料建立多維度(Multidimension)的資 料方體(Data cube),再利用線上分析處理技術,讓決策分析者能依其需求 快速彈性地取得所需的資訊。此外,並可透過MS-Excel 中的樞紐分析表功 能,將資料經由網際網路(Internet)利用瀏覽器以視覺化(Visualization)

的方式呈現資訊,以提昇決策品質及時效。[14]

李俊民、張義範(民92)考慮各種不同藥品在實務上不同需求的特性,

以時間序列分析作需求預測,以降低潛在的存貨成本。並建立多維度的資料 倉儲包含藥品消耗的歷史紀錄及執業醫師與藥品間具有的關聯性,採線上分 析處理進行,以建立訂購決策支援系統。同時利用EXCEL 統計圖表的強大 功能,將資料倉儲所呈現的資料視覺圖形化,以方便瀏覽與閱讀[9]。

黃仁偉、梁高榮(民91)利用資料倉儲技術,將台北農產運銷公司的 農產品作流動量管制,透過「批發資訊分享熱線」進行配銷貨,並可針對行 情評估、到貨量控制做一個有效的決策管理[25]。

(15)

根據以上的研究可以得知對於主管們或是高層決策者而言,他們所需要 的資訊是屬於彙總的整合性資訊。尤其是最高決策者,他通常是從整個企業 的觀點來看事情,而且他所需要的資訊可能會隨著他的想法而不斷地改變,

這樣的需求是一般的資料庫所無法提供的。而資料倉儲包含有大量的歷史資 料,除了可輕易提供整合性資訊及進行趨勢分析外,對於所需的查詢資訊及 報表等,也可不必經由資訊專業人員就能立即獲得,讓主管及決策者們可隨 時掌握業務營運狀況,進而協助其制定最合適的決策或修正不適當的決策。

柒、應用於資料倉儲分析的工具介紹

市面上用來建立資料倉儲的軟體有很多,茲就一些常用的軟體做一個分 析比較,以瞭解各個資料倉儲軟體的優缺點。

2-2-3 應用於資料倉儲分析的工具介紹

產品名稱 簡介

Sybase Warehouse Studio(Sybase Warehouse)

Sybase Warehouse Studio為整合性產品組,為高效能的訂製型 資料超市與資料倉儲,提供完整、具成本效益的快速設計、

部署與管理環境。Sybase Warehouse Studio 提供重要的定義性 資料(MetaData)及英文查詢新功能,擴展了領導業界的

Adaptive Server IQ 決策支援資料庫管理系統,並降低總成 本,加快部署的時程。Sybase也藉由PowerStageTM 的資料摘 取(Extraction)、轉換與清除功能,進一步延伸 Sybase

Warehouse Studio的能力。而PowerDimensionsTM則透過 ROLAP伺服器提供完善的多層次模型建構功能,並以企業用 戶的格式傳送資料。

IntelligentMiner

(IBM)

IBM 提供完整的商業智慧解決方案,IntelligentMiner家族是其 中的中心部份。IBM已被大眾所認可的開採技術,補充了它的 商業智慧和內容管理工具,例如IBM Visual Warehouse、IBM DB2 OLAP Server、IBM Digital Library和 IBM EDM Suite。

IBM資料開採顧問和 IBM Global Business Intelligence

Solutions(全球商業智慧解決方案)可以在資訊開採專案的任 何或所有階段提供協助,從概念形成一直到規劃、執行、訓 練和支援。IBM和IBM商業夥伴提供範圍廣泛的特定產業應用 程式,這些應用程式利用IBM Intelligent Miner工具,其中包括 IBM Discovery Series(探索系列)、IBM Customer Relationship

(16)

Intelligence(客戶關係智慧)和IBM Text Knowledge Server(文 字知識伺服器)。

Warehouse Administrator

(SAS)

SAS Warehouse Administrator 提供親和性高的使用者介面,由 單一窗口整合 SAS 既有之資料倉儲 ETL 的功能,來控制與 管理整個資料倉儲建置與維護的工作。SAS Warehouse Administrator 可以由單一平台控制整個網路上所有平台資料 與進出倉儲,讓資料倉儲管理者很容易地管理資料倉儲所建 構的專案。SAS Warehouse Administrator在使用者點選的過程 中,能夠產生與管理有關的倉儲架構與資料流向的

metadata,並由metadata自動產生 SAS 程式。這些自動產生 的 metadata,記錄了建構過程中所有重要的資訊,不會因為 人事異動而影響到倉儲的建構與維護。SAS Warehouse Administrator 也提供介面連結 OS 上定時(Scheduling)軟 體,在某特定時間點自動執行某個SAS程式。

SMART OLAP

(SAS)

SMART OLAP就是「A Statistical Management、Analysis and Recommendation、Technology for On-Line Analytical

Processing」的縮寫。

SMART OLAP 特點包含 MDDB 檔案結構可以解決大量資料 時,處理速度之瓶頸,動態多維度分析可以任意組合篩選各 個維度,進行分析,以及重點資料傳遞將分析之異常或重點 資料顯著標示並快速傳遞。

SAS MDDB (Multi-Dimensional Data Base,多維度資料庫) Server 是 SAS 公司整個決策管理架構中的一個重要檔案結 構。此種用在線上分析處理(On-Line Analytical Processing,

OLAP )的檔案結構讓使用者能迅速地從不同的角度,由縱切 面與橫切面來分析大量的彙總資料,做複雜的多維度分析與 資訊報告。

SAS MDDB 是以一種特殊的資料儲存格式存放彙總資料。使 用者可以很快地從各種維度,例如時間、地區或產品的交錯 來分析大量的資料。IT 部門人員可以用交談(Interactive)或批 次(Batch)方式來建置多維度資料庫。

資料來源:本研究整理

(17)

第三節 資料探勘

壹、資料探勘的定義

資料探勘指的是尋找隱藏在資料的訊息,像是趨勢(Trend)、特徵

(Pattern)和相關性(Relationship)的過程,也就是要從資料中去挖掘資訊 或者是知識(Knowledge Discovery in Database,KDD),有人稱之為「資料 考古學」(Data Archaeology)、「資料樣型分析」(Data Pattern Analysis)或者 是「功能相依分析」(Functional Dependency Analysis),目前被許多的研究 人員視為結合資料庫系統和機器學習技術的重要領域。這個領域蓬勃發展的 主因在於,現在企業常常蒐集大量資料,但是資料超載和無結構化,讓決策 單位無法有效利用現有的資訊,甚至誤用。但若能透過資料探勘的技術,從 這些大量的資料庫中,採取出不同的資訊和知識出來,支援決策,必定可以 提升企業的競爭優勢[49]。

Fayyad, Piatesky Shapiro & Smtyh (1996)將資料探勘定義為找出資料中 有效的、嶄新的、潛在有用的、易於瞭解的樣式的一個不繁瑣的過程。他認 為資料庫知識發現為在資料庫中取得知識的過程,流程步驟是先理解要應用 的領域、熟悉相關知識,然後再建立目標資料集,且專注在所選的資料集,

再從目的資料中進行前置處理,除去錯誤或不一致的資料,接著做資料簡化 與轉換的工作,再由資料探勘的技術程序成為樣型(Patterns)、做迴歸分析 或找出資料的關聯性,最後才得到結果,資料探勘只是其中的步驟而已[41]。

Peacock (1998)則將資料探勘的定義歸納出三點[60]:

1. 狹義的資料探勘是指自動發現隱藏在資料庫中有趣但不明顯的模式。狹 義的資料探勘圍繞在機器學習的方法論上,強調發現的過程。

2. 廣義的資料探勘,在確定或測試發現過程中所揭發的關係。用統計方 法、建立假說,或者研究並確認關係以支持在狹義的資料探勘中形成的 模式,強調的是人的學習以及管理者與分析者的投入。

3. 最廣義的定義則是與資料庫知識發現(KDD)同義。包含內部與外部 資料取得、轉換、清理、格式化、分析、確認、賦予資料意義、建立與 執行決策支援工具和系統、使資料探勘的結果對決策者產生效用,且不 斷對模型修正與系統維護。

資料探勘可以與使用者或知識庫互動,提供有趣的模式給使用者,或作

(18)

為新的知識存放於知識庫之中,資料探勘是知識挖掘中的一個步驟,但卻是 最重要的一個步驟,因為他發現隱藏於資料庫中的模式,如圖2-3-1 所示。

圖2-3-1 資料庫之知識探索流程圖(Han & Kamber,2001)

貳、資料探勘的過程

P. Cabena等人 (1998) 提出資料探勘包含下列幾個步驟:[38]

一、確定目標:雖然定出目標是很直覺的一件事,但在資料探勘中卻是不可 缺少的一部份,所以必須明確地定義出問題所在及質疑的地方。

二、預備資料:此一步驟是資料探勘處理過程中最花時間的一個步驟,在整 個資料探勘的過程中,大約佔了60%的時間。此一步驟又分為三部份:

1. 資料選取:從所有的資訊中選擇所需要的資料。

2. 資料的前置處理:確保所選取資料的品質,使分析更容易。

3. 資料轉換:根據不同的資料探勘演算法,將資料轉換成演算法所適合 的模式。

三、資料探勘:選擇適當的資料探勘演算法來探勘上一個步驟所轉換出來的 資料。

(19)

四、分析結果:評估步驟3 所探勘出來的資料。

五、吸收知識:將步驟4 所分析出來的資料加到企業化的組織或資訊系統 裡。

參、資料探勘的技術

資料探勘就是利用不同的智慧型演算法,如類神經網路、基因演算法、

決策樹、統計回歸、群集方法、關聯規則、線性分析等,挖掘出有用或有興 趣的資料特徵型樣。資料探勘技術可以被運用在不同應用領域,例如購物籃 分析、客戶群組特徵、顧客行為型樣等,依其需求內容之不同,我們可以將 資料探勘的方法,歸類成幾個主要的工作類型:關聯規則分析(Association Rule Analysis)、分類分析(Classification Analysis)、群集分析(Cluster Analysis)、時間序列分析(Time-series Analysis)、孤立點分析(Outlier Analysis)、回歸分析(Regression Analysis)、次序相關分析(Sequential Pattern Analysis)等,以下分析各項的資料探勘技術,並說明各項技術的使用時機。

一、 序列規則[49]

1. 關聯規則分析(Association Rule Analysis)

關聯規則分析主要被用來尋找資料庫中某些資料項目或屬性之間 共同發生的關係。最初應用於超級市場的購物籃分析,從購物籃的交易 記錄中,可找出相關產品間的關聯,並據以分析顧客購買行為及較常出 現購買模式。這樣的結果,可以產生一個行銷的策略就是將經常被一起 購買的商品放近一些,以便進一步刺激這些商品一起銷售。

舉例來說:

假設有60﹪的讀者借閱BASCE 入門,有75﹪的讀者借閱Java進 階,有40﹪的讀者同時借閱BASCE 入門及Java 進階,則依上述關聯法 則的定義可得出以下的規則。

BASCE 入門→Java 進階[40﹪,60﹪]

又如:『牛奶==>麵包 [support = 3%, confidence=62%]』

support(支持度)=3%指全部交易筆數中,同時包括"牛奶"與"麵包"的交 易筆數有3%,confidence(信賴度)=62%表示包括"牛奶"的交易筆數中,

有62%的交易資料中筆數包括了"麵包"的交易。

(20)

2. 次序相關分析(Sequential Pattern Analysis)

為了找出變數與變數間,事件隨時間的關聯(如哪些貨品之買 賣有先後順序)。次序相關分析的目的是由一群有時間上次序性的交 易中,找出經常出現的交易項目組合,進而瞭解顧客的長期購買行 為。關聯規則分析以單筆交易為分析單位,來瞭解交易內交易項目 的相關性,而次序相關分析是著重於相同顧客於不同交易間(而非 交易內)交易項目的相關性(如大多數的顧客購買了洗衣機後,會 購買烘衣機;又例如家具店在賣出床具之後,被單、枕頭套逐漸地 有相同的顧客來購買)。

二、 分類區隔[49]

1. 分類分析(Classification Analysis)

分類分析是根據一些變數的數值做計算,再依照結果作分類。(計 算的結果最後會被分類為幾個少數的離散數值,例如將一組資料分為

「可能會回應」或是 「可能不會回應」兩類)。我們會用一些已經分類 的資料來研究它們的特徵,然後再根據這些特徵對其他未經分類或是新 的資料做預測。這些我們用來尋找特徵的已分類資料可能是來自我們的 現有的歷史性資料,或是將一個完整資料庫做部份取樣,再經由實際的 運作來測試;譬如利用一個完整資料庫的部份取樣來建立一個分類模式

(Classification Model),以後再利用這個模式來對資料庫的其他資料或 是新的資料作預測。

分類分析通常都是提到兩種資料探勘技術:類神經網路(Neural Nets)以及決策樹(Decision Tree)。雖然這些統計方法本身都十分複雜,

但使用者並不會牽涉到這些繁雜的統計。

A. 類神經網路

使用許多參數,每個參數代表網絡(Net)上的一個節點(Node)

來建立一個模式,這個模式接受一組輸入值來預測出一個連續值或 分類值。每一個節點都是一個函數,這個函數是使用輸入該節點的 相鄰節點值的加權總和(Weighted Sum)做運算。在建立一個模式 的過程中,我們要用一些資料來 '餵' 給這個網路,「訓練」它來找 到一組能夠產生最佳輸出結果的加權值(Weights)。有一種最常用

(21)

的「訓練法」稱為 Back-Propagation,它是把輸出結果與一個已知 的正確結果相比。每次相比之後就產生另一組調整過的Weights,

然後再產生一個新的輸出值再與該已知值相比。這個過程經過反覆 的執行後,這個 Neural Net 就被「訓練」 得能夠相當正確的做預 測了。

B. 決策樹

則是利用一系列的規則來得到一個類別或數值。例如,你想把 申請貸款的人歸類成 '風險高' 與 '風險低' 兩種,有了這個 Desicion Tree,銀行的放款人員就可以審查申請人的條件,決定該 人是屬於高風險或低風險群。例如「收入高於40000」而且 「高 負債」的人會被歸為高風險之類,而「收入低於40000」而且「工 作超過5 年」 則會被歸為低風險之類。 Desicion Tree 現在相當普 遍,因為它所做的預測相當正確,而且又比 Neural Net 容易瞭解。

2. 群集分析(Cluster Analysis)

群集分析是利用一些特性的組合來對樣本作群體的分類(例如百貨 公司有哪些不同採購特性的顧客:準媽媽型、暴發戶型、酷妹型、公務 人員型……)。更進一步說明,就是設定一組由多個屬性描述其特性的 物件集合,群集分析根據物件間的相似性,將這些物件分成群集,使得 每個群集內的成員具有高度的相似性,而不同群集間之物件具有高度的 不相似性。

企業有了分群資料就可以採取目標行銷,名貴產品的DM就郵寄給 爆發戶型的顧客,時尚的配件、飾品的DM就郵寄給酷妹型的顧客,不 同以往的DM都是厚厚一本發給所有的顧客,顧客往往都是丟掉不看。

因為,每次寄來都是和自己需求無關,幾次以後就不想再看,所以相反 地,目標行銷卻可以針對顧客的需求來行銷。

3. 孤立點分析(Outlier Analysis)

孤立點分析的目的是要在資料中找出不同於以往經驗的報告或記 錄,這樣的技術通常用在資料的清理,特殊而且不正常的交易,以及找 出不尋常的事物或是不好的現象。

孤立點分析事實上就是在一個正常的資料中,找出裡面引人注意的 極端值。通常在統計運算中這樣的極端值都有很大的影響力,而且在很

(22)

多的事件中必須要將這些記錄給剔除,但是,我們也應該注意到異常值 可能會因為我們測度了一個不符合真實資料的分佈而出現,我們也必須 注意到,這樣數值的產生或許只是一個簡單的結果,就是我們用自以為 對的方式來應用於資料的紀錄當中,最簡單的例子就是使用了錯誤的測 量方法或是取得資料的方式錯誤。

但是,許多的研究分析指出,很多的異常交易都可以由孤立點分析 來減低交易時所產生的風險,例如信用卡公司,藉由客戶平常的交易記 錄中,一旦發現異於平時的交易,則可以採取先期的預防措施,像是電 話通知與客戶確認交易或是阻斷交易。

三、 推算預測[66]

1. 回歸分析(Regression Analysis)

回歸分析就是一種統計分析的方法,主要在了解自變數

(independent variable)與應變數(dependent variable)間之數量關係。

它的主要用處,是尋找兩個或兩個以上的變數之間的相互變化的關係。

當我們找到(或以為找到)這些關係之後,我們就可以利用它來做下面 的事情:

A. 敘述(description):例如節目製作費用與收視率之關係 (了 解變數之關係)。

B. 控制(control):例如商品價格與需要量之關係,故控制價格,

也許就可以控制需要量(以價制量)。

C. 預測(prediction) :例如製作費與收視率之關係,也許可以 用來預估某節目的收視率。

2. 時間序列分析(Time-series Analysis)

時間序列分析是一組按時間順序發生的事件,研究者根據每一固定 時間間距(Time Interval)依序紀錄事件結果,而時間序列數據最大特 點就是當中每一筆緊接著數據的紀錄時間間距均相同。股票市場固定時 段價格變化,每月進出口貿易相關數字,每年人口出身率數字等分別為 時間序列數據例子。

要分析時間序列數據,研究者首先可以使用一些視覺檢查(Visual Inspection)工具(例如立體圖表)從時間序列數據紀錄,觀察出某些

(23)

現象特徵及行為,通常時間序列有四種主要的變化[49]:

A. 長期或趨勢變化(Long-Time or Trend Movement)

用於反應一般變化方向,其時間序列表示較長時間間隔上的資 料變化,這樣的變化反應一種趨勢線或是趨勢曲線。

B. 迴圈變動或迴圈變化(Cyclic Movement or Cyclic Variation)

沿著趨勢線或是趨勢曲線的長時間擺動(Long-Time

Oscillations),他可以是也可以不是週期性的,也就是在等時間間 隔之間,迴圈不需要依循同樣的模式演變。

C. 季節性移動或季節性變化(Seasonal Movement or Seasonal Variation)

他反應的是每年都重複出現的事件,也就是說,季節性移動是 指同一個或近似同一個模式,在連續幾年的相關日期或相關時節上 重複出現的趨勢。

D. 非規則或隨機變化(Irregular or Random Movement)

他反應的是由於隨機或偶然事件引起的零星時間序列變化。

透過對趨勢、迴圈、季節和非規則成分變動的系統分析,使研究可 可以在較合理的情況之下,制訂出長期或短期的預測(即預報時間序 列)

肆、資料探勘的應用領域 一、相關研究分析

1. 關聯規則分析(Association Rule Analysis)

廖虹雲(民93)透過公司產品類別或產品屬性特徵做為分群處理 的基礎,比對歷史交易紀錄,找出偏好購買相似產品類別或特徵的顧客 族群,以關聯規則分析,輔以市場區隔變數來描述消費族群的特徵,最 後計算與各群顧客特徵相符的規則得分,以判斷新舊顧客隸屬於不同市 場區隔的程度。將偏好程度加以排序後,得知各個區隔中具有較高偏好 程度的目標族群,可用於個人化推薦清單之發送依據,亦可減少無謂的

(24)

行銷成本。而透過動態資料探勘之概念,觀察顧客在區隔間偏好程度的 改變與轉移,可供管理決策者針對顧客偏好之變動做出即時且適當的回 應,以滿足顧客需求。實驗結果顯示,當訓練樣本具有顯著的屬性特徵 時,將可明顯區分出偏好相似的顧客族群,而根據偏好程度產生之個人 化產品推薦於便利商店消費者之評估調查,有達八成的接受度,此將有 助於目標行銷組合策略之制訂,讓企業能快速掌握消費者需求變化的脈 動,創造新的商機[27]。

Jiao Jianxin, Zhang Yiyang(2004)提到在商業競爭中,好的產品說 明書是有深遠的影響。一般而言,產品說明書涉及兩個主要的層面, 一 個是產品識別,而另一個是產品的評價和選擇。吸引顧客的注意力和理 解顧客的需要,必須要有效的且明確的把這些產品的優點轉變成產品說 明書中的條文,然而如何決定呈現這些條文內容最理想的架構,就是本 論文研究的主題。研究中主要是發展一套明確決定支援模組,從過去銷 售和產品的記錄中,根據有效資料探勘技術,改進產品說明書的條文敘 述。而關聯規則分析可以在顧客,銷售人員,和設計者中間找出有用的 模組。因此從產品定義的過程到產品說明書中的條文敘述,可以藉由關 聯規則分析找出一個有用的模組,以做為未來制訂產品名稱到產品說明 書的一個依據[48]。

蔡鴻旭、李姿儀、鍾志明(民90)利用若瑟醫院的門診資料庫,

採用Apriori 演算法進行門診疾病之關聯規則研究。在醫院門診資料的 知識發現上,採用支持度0.3%且具信賴度 90%的規則,並發現兩則能 理解的法則:

A. 病患若有急性鼻咽炎及支氣管炎的症狀出現,則可以推斷此人 罹患了流行性感冒。

B. 當病患有神經痛、神經炎及神經根的症狀出現後,而本身又有 骨質疏鬆症,則可以推斷此病人可能患有骨關節病。[29]

2. 次序相關分析(Sequential Pattern Analysis)

Chiang Ding-An, Wang Yi-Fan, Lee Shao-Lun, Lin Cheng-Jung

(2004)研究中提出一個有效率的演算法,稱之為「Goal-oriented sequential pattern」,當企業即將失去有價值的客戶之前,這個演算法可 以快速的對經營者提出警告訊號,這個資訊同時可以作為經營時的決策 建立,研究中並且將這個演算法與「Apriori」演算法做一比較,結果也 顯示出「Goal-oriented sequential pattern」較有效率。[39]

(25)

3. 分類分析(Classification Analysis)

楊雅淨(民92)選取 89、90、91 年度綜合所得稅資料,先經由增 刪、轉換、合併、彙總等前置處理,同時也增加一些衍生變數。利用決 策樹及類神經網路資料探勘方法建立模型,以探討資料探勘技術對於綜 所稅逃漏稅是否具有分類能力,並找出逃漏稅案件可能具有之特徵,並 解析分類之正確率,再配合分析綜所稅稽徵業務流程,以及申報戶實際 補稅情況計算出在資料探勘技術協助之下,可節省之成本及可能產生之 稅收損失。研究結果可作為稽徵機關建立綜所稅選案模式時的參考。藉 由決策樹產生之分類規則,建立正確且有效之基本參數或標準來進行選 案,並可依據葉部節點預測率之高低,分別精查程度,然後集中稽徵人 力對異常案件加以深查。並杜絕多次重複補稅作業衍生的民怨與輿論的 攻訐及現行綜所稅查核人力不足之窘境。[26]

4. 群集分析(Cluster Analysis)

歐陽良全(民92)應用資料探勘技術中群集分析與決策樹分類法,

分析健康檢查中心顧客資料,區分出不同之顧客群組,接著針對型態類 似的顧客群組,擬定適當的銷售策略,經由促銷方案的實施,驗證目標 行銷的效果。健檢客戶資料經由叢集分析後,發現事業有成組與家庭主 婦組的客戶數佔全體42.31%,屬於人數多、影響獲利大的兩群客戶。

這些客戶在健康檢查的營收中佔有舉足輕重的角色,可以說是健康檢查 中心的經濟命脈,必須特別加以重視。健檢中心行銷人員根據此結果,

針對兩個組群擬訂不同的行銷策略並付諸實行後,確實提高了這兩個群 組的利潤貢獻,證實資料探勘技術對健檢中心的目標行銷有所助益 [28]。

邱崇兼(民92)利用資料探勘技術來偵測信用卡交易是否異常,

以消費者過去購買產品之交易資料為探勘的資料來源,以目前某一消費 者之購買產品為探勘的目標,我們依據消費者購買產品的重複性及關聯 性,提出兩階段的探勘方法,來判斷此消費者之購買產品是否為異常交 易[13]:

A. 根據購買產品的重複性,將此購買產品與持卡人過去之交易資 料做比對,若滿足所設定的「最小交易相似度」,則可判斷此

(26)

購買產品為非異常交易,若未能達到所設定的「最小交易相似 度」,則必須進入第二階段來處理。

B. 在第二階段中,設計不同的分群化方法,分別用來探勘某一消 費者之信用卡交易是否異常,並根據所提出的方法,設計與建 置一個信用卡交易偵測系統,此結果可做為信用卡處理單位在 監視異常交易時的輔助工具。

He, J.等人. (2004) 認為信用卡持卡人的行為分析是發卡銀行的主 要研究主題之一。通常持卡人的行為,尤其是破產的預警行為,可以經 由持卡人過去的消費紀錄中找出一個模式。在真實生活中,統計學和類 神經網路可以用來預測計算這樣的一個模式。近來,不同的線性回歸分 析技術,均可用來處理分類分析以分析持卡人的行為。本研究以智慧型 線性回歸分析來發掘持卡人的破產模式。[44]

5. 時間序列分析(Time-series Analysis)

阮士峰(民92)使用資料探勘的技術尋找股票市場中具有特別的 K 線組合序列。其主要是在尋找不同的公司或類股中,某一個序列在中期 投資中對股價有一程度的影響。研究中將整個作業的資料分成探勘及測 試資料,利用不同的資料選擇方式,可以找出兩個資料族群之間有相同 意義的K 線組合關係,並找出其重要的 K 線組合序列,再由它們的歷 史資料中來分析K 線組合序列的含意是屬於起漲、起跌、續漲、續跌 及反轉之何種K 線指標。也可以利用自己族群的歷史資料來尋找最近 股市資料中重要的K 線指標,進而提供投資者一種在選擇買賣時機的 參考依據。實驗的結果得到兩個重要的結論,首先是在相同的資料中若 利用適當的篩選參數可以尋找到較多的K 線組合序列;第二,若以 K 線組合序列的影響間隔時間設定為一至兩個月時,相對的也可以得到較 多序列結果,這表示在短期投資其存在不穩定的因素較多而不易尋找到 較多的序列,反而在中期投資時使用參考K 線組合序列可以達到較高 的準確率。[10]

二、資料探勘應用領域彙整

上述的資料探勘行為,是目前資料探勘應用上最常見的研究方向,以下 就針對資料探勘的應用領域,來做一統整的敘述:

(27)

2-3-1 資料探勘應用領域彙整 應用領域 應用項目

信用卡發 卡銀行

信用卡公司可使用資料探勘來增加信用卡的應用,作為交易授權決 定,分析持卡人的購買行為,並偵測詐騙行為。

金融服務 機構

證券分析師廣泛使用資料探勘來分析大量的財務資料,以建立交易 及風險模式來發展投資策略。許多公司的財物部門已經嘗試使用資 料探勘後的資訊,來作為投資決策的依據。

銀行

銀行業者以自有的資料倉儲來作資料探勘,可以收集並分析客戶的 金融消費記錄,然後整合這些資訊,以做為其他金融商品的行銷策 略與廣告對象。同時,也可使用資料探勘分析顧客的貸款活動,適 時調整金融商品的適切性,以符合顧客的需求,同時可以擴增客源,

以及加強顧客服務。

零售商

零售業在使用資料探勘技術這方面,是目前應用最多的領域之一。

瞭解顧客購買行為及偏好對零售商的策略來說是必要的,像購物籃 分析(Market Basket Analysis)與採購籃分析,運用其結果來極力投 入有效的促銷及廣告,以增加某些商品的銷售成績。有些商店也會 應用資料探勘技術來偵測收銀員的詐騙行為。

電話銷售 及直銷

電話銷售公司可以利用資料探勘技術來精確取得目標客戶,以節省 電話費支出與廣告成本,這樣的策略不只可以減少電話費用的支 出,而且也增加了電話銷售的成功率。

而直銷公司可以依據顧客過去的消費記錄及地理資訊,來配置及郵 寄產品目錄,以節省郵寄及目錄印刷的成本,同時依據顧客過去的 消費記錄,依其對消費的價格作等級上的區分,進而達成差異化行 銷的目的。

製造業 資料探勘技術被使用在製造工業的控制及排程技術的生產程序,這 樣可以偵測產品的潛在品質問題,以降低不良率。

醫療業 預測手術、用藥、診斷或是醫療行為的流程控制,另外也可以推估 一些罕見病例的發生原因。

保險公司

保險公司對於風險管理極為重視,因此除了一般產品的行銷與銷售 之外,還必須要注意保險詐騙的偵測,資料探勘可以提供有效的資 訊,以預估可能的詐騙行為。

電信公司

藉由資料探勘技術,可以瞭解到電信公司所提供的服務,哪些是用 戶最喜歡使用的,哪些需要改進,同時,也可以運用快速的運算方 式偵測出不尋常的行為,以防止電話竊打。

數據

圖 2-2-3  星狀綱要模式(Han & Kamber,2001)
圖 2-2-4  雪花狀綱要模式(Han & Kamber,2001)
表 2-3-1  資料探勘應用領域彙整  應用領域  應用項目  信用卡發 卡銀行  信用卡公司可使用資料探勘來增加信用卡的應用,作為交易授權決定,分析持卡人的購買行為,並偵測詐騙行為。  金融服務 機構  證券分析師廣泛使用資料探勘來分析大量的財務資料,以建立交易及風險模式來發展投資策略。許多公司的財物部門已經嘗試使用資 料探勘後的資訊,來作為投資決策的依據。  銀行  銀行業者以自有的資料倉儲來作資料探勘,可以收集並分析客戶的金融消費記錄,然後整合這些資訊,以做為其他金融商品的行銷策略與廣告對象。同時,
表 2-3-3  資料探勘工具比較表  資料探勘技術  產品名稱  關聯規 則分析  次序相關分析 分類  分析  類神經網路  決策樹 群集 分析  時間序列分析 Clementine  (SPSS)  ˇ  ˇ  ˇ  ˇ  ˇ  ˇ  ˇ

參考文獻

相關文件

學校是推動工藝體驗教育最重要的平台,在 12 年國教的學習階 段,校園是工藝 Maker 孵育的最佳場域,學校教師則扮演著工藝

校長、學校行政主戶及「統一登入系統」學校行政戶口可按右上方的「

實務上在應用 SPSS 軟體 run 完主 成分分析後,應該進一步進行因素 轉軸,在社會科學研究中,varimax 法為最常使用的,varimax

本彙集輯錄了多篇學校經驗分享的文章,闡述「管理與組織」範疇的各項全校 參與訓育及輔導工作模式的重點,請參閱教統局網頁,索引: 本局向學生及家 長提供的服務 >

進行 18 以內的加法和減法口算 學生須透過口算解主要以圖像闡述的應用 題,並以橫式作記錄。.. 加法和減法的直式在學習單位 1N4

學校收到有非華語幼兒的在家進 行這個活動的片段分享。學校適 時提供個別支援,從中以多範疇

5.1.1) 法團校 董會以 受託人 身 分擁 有及 處 理由政 府發放 給學校 的經費 及資 產。法 團校董 會亦以 同樣的身分擁 有及處理由學生繳交的堂費 及由 公眾人士給予學校的捐贈。.

「 姊妹學校計劃 」自2004年開展以來,為香港的中、小