• 沒有找到結果。

第二章 文獻探討

2.4 資料倉儲(Data Warehouse, DW)

2.4.3 資料維度模式

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

使用。少部分的使用者懂得如何使用自行配置所要查詢的項目,然而大部份 的使用者需要藉由一些已經設定好的查詢方式,來查詢資料倉儲的資料。

2.4.3 資料維度模式

維度模式是一種資料倉儲設計的技術和概念。在維度模式的架構中,資料表 被分為事實資料表(Fact Table)和維度資料表(Dimension Table),事實資料表記錄 的是與維度資料表的關聯及數值型資料,例如:銷售額、毛利率等;維度資料表 記錄的是不同角度想要分析的主題,例如:財務、產品、顧客等。Kimball(1996) 所提出的星狀綱要(Star Schema)是一種最常被採用的多維度模式,其架構的中間 為一事實資料表,而四周包圍著維度資料表,如下圖2-15。

圖2-15 星狀模型案例 資料來源:Kimball(1996)

基本的星狀綱要包含四個元件,分別是事實資料表(Fact Table)、維度資料表 (Dimension Table)、屬性(Attributes) 、屬性階層(Attribute Hierarchies),以下將依 序介紹:

1. 事實資料表(Fact Table)

儲存企業已經量化的數值資料,例如:銷售額、毛利率等,是企業分析 的主要表格,也是整個星狀綱要的中心。表格的內容通常非常大,在實際建 置的時候,為了效率的考量,通常不對事實表進行正規化。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

2. 維度資料表(Dimension Table)

儲存企業想要了解的主題,根據不同的主題可以建立不同的維度資料表,

例如:產品、顧客等。

3. 屬性(Attributes)

用來觀察事實資料表,其作用是針對事實表的內容進行分類、篩選以及 蒐尋使用。

4. 屬性階層(Attribute Hierarchies)

其作用是針對屬性進行階層性的安排,方便進行資料的下挖(Drill Down) 和上捲(Roll up)的分析。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y 第三章 系統分析與設計

本章說明系統分析與設計內容,包括雛型架構、平衡計分卡績效評估的參考 指標、實作指標的設計,以及資料收集、處理流程以及資料模型,以下將依序予 以說明。

3.1 雛形架構

為了建置電子商務觀測站,透過文獻回顧,本研究以 White(1999)提出的商 業智慧架構為基礎,作為開發商業智慧系統分析與設計的雛形,如下圖3-1。

圖3-1 本研究架構

資料來源:White(1999); 本研究整理

依據Kaplan & Norton(1992)提出的平衡計分卡,由財務構面、顧客構面、內 部流程構面以及學習與成長構面來衡量,本研究參考(陳瑜芬、吳翠治、鄭凱文,

Maisel(1992)

Fletcher & Smith(2004) Kaplan & Norton(1992;

1996)

Fletcher & Smith(2004) Kaplan & Norton(1992;

1996)

Fletcher & Smith(2004) Kaplan & Norton(1992;

1996)

員工平均收益 Kaplan & Norton(1992, 1996) Performance Indicators; KPI),其中包含財務構面 2 個、顧客構面 3 個、內部流程 2 個以及學習與成長構面 1 個,並詳細探討各 KPI 的策略目標與計算公式,如下

*參考電子商務年鑑:http://ecommerce.org.tw/knowledge_research_list.php?ctype=3

資料來源:本研究整理

Web ATM、線上信用卡、線上直接扣 款、小額付款機制付款

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

3.4 資料收集

為達成本研究之目的,依據制定實作的財務、顧客、內部流程以及學習與成 長等四個構面之績效指標為前提,收集所需的必要資料。根據資料來源不同,分 為外部和內部資料,以下將依序說明。

3.4.1 外部資料

外部資料來源包括公開交易資訊和電子商務調查資料,說明如下:

1. 公開交易資訊

本研究依據台灣證劵交易所之股票分類,以電子商務上市櫃公司為對象,

採用的資料期間為2006 年到 2010 年,共計 5 年。資料主要源自台灣經濟新 報(Taiwan Economic Journal Data Bank, TEJ)資料庫及台灣證劵交易所的公 開資訊交易站為主,台灣證劵交易所的年度財務報告書、公開說明書、股東 會年報等資訊,作為參考資料。

資料收集的更新週期參照財務資料的更新頻率,以季為週期進行資料的 更新,以下將針對收集的資料內涵依序說明:

(1) 企業的背景資料

為電子商務上市櫃公司的基本資料,包含股票代號、公司名稱、地 址、成立日期、資本額、上市上櫃日期、公開發行日期以及發行股數等。

(2) 企業的財務資料

為電子商務上市櫃公司四大財務報表,包含損益表、資產負債表、

股東權益變動表及現金流量表。本研究針對季報的財務資訊進行收集。

料庫(orders)、顧客資料庫(customers),以及供應商資料庫(suppliers)。

2. 到訪者瀏覽資料

以範例電子商店的網站為對象,安裝Google Analytics Tag 收集到訪者 瀏覽網頁的行為資料,並運用Google Analytics API 儲存資料到本地資料庫 中。資料來源包括造訪人次、新造訪人次、網頁瀏覽量、平均網頁瀏覽量、

特定頁面瀏覽量、造訪跳出率、網站停留時間、平均網站停留時間,採用的

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

資料期間為2011 年 1 月到 6 月,共計 6 個月。

3.5 資料萃取、轉換、載入(ETL)

為了使外部資料的格式,能夠符合本研究設計的維度模型,必須先進行資料 的前置處理。將收集的外部資料,透過萃取、轉換、清洗工具,轉換成適合的資 料格式,以確保資料格式的一致性。資料轉換流程分為三個階段,以下將依序予 以說明:

1. 第一次資料轉換

為了能有效歸類地區性的研究,本研究新增郵遞區號維度表(ZIP),紀 錄城市和鄉鎮的相關資料,並參考中華郵政所制定的3+2 碼郵遞區號,以郵 遞區號(ZIP Code)為主鍵(PK),建立郵遞區號與公司地址之間的關聯,其詳 細流程如下圖3-2。

圖3-2 第一次資料轉換工作流程 資料來源:本研究整理

2. 第二次資料轉換

由於公開資訊觀測站所採用的日期格式,是以民國曆的方式表示,和 TEJ 西元曆的日期表示格式不同。為了考慮到未來研究的一致性需要,本研

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

究採用西元曆作為統一標準的格式,將外部資料採用民國曆格式的表示方法,

進行轉換成西元曆,其詳細流程與步驟如下圖3-3。

圖3-3 第二次資料轉換工作流程 資料來源:本研究整理

3. 第三次資料轉換

為了能有效了解公司成立的時間長短與衡量目標達成率的關係,本研究 新增成立年限(Age of Establishment)來記錄公司創立至今的時間。利用取得 的原始資料記錄的成立時間,經過程式運算之後,取得該公司成立至今的成 立年限,其詳細流程如下圖3-4。

圖3-4 第三次資料轉換工作流程 資料來源:本研究整理

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

4. 電子商務調查資料轉換:

由於調查資料大部分為實際數值,屬於比例尺度,如營業額、每月瀏覽 人數、顧客平均交易次數、客戶重購率、客戶新增率、行銷費用率、IT 費 用率、宣傳方式種類、行銷策略合作家數…等等,均轉換為 1-7 的區間尺度。

轉換方式為將各年度各問項的資料逐一彙整後,依據各問項,扣除極端值,

再 將 實 際 數 值 x 、 最 大 值 max 、 最 小 值 min 帶 入 公 式 round((x-min)/(max-min)*6+1,0),經由四捨五入,轉換成 1-7 的區間尺度(曾 淑峰、翁玉麟,2012)。

3.6 資料管理

為了考量到資料管理的彈性,本研究採用Kimball & Ross(2002)提出由下而 上(Bottom-up)的建構方式,以星狀綱要(Star Schema)為維度模式的設計模型,是 一種多維度模式的資料模型設計。

3.6.1 星狀綱要(Star Schema)

維度模式包含事實資料表和維度資料表,事實資料表的欄位分成兩種類型:

主鍵和衡量值,主鍵由維度資料表的主鍵值(Primary Key; PK)所組成,衡量值是 要進行分析的數值型(Numerical Measure)資料,包括原始的數字資料和經過運算 處理的延伸數字資料,如圖3-5, 圖3-6, 圖3-7。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

圖3-5 Stock Report Fact and Dimension 資料來源:本研究整理

圖3-6 Sales Fact and Dimension 資料來源:本研究整理

圖3-7 Clickstream Page Event Fact and Dimension 資料來源:本研究整理

3.6.2 事實資料表(Fact Table)

事實資料表儲存本研究對象的數據資料,包括Stock Report Fact、Sales Fact,

以及Clickstream Page Event Fact,並設定資料綱要(Data Schema),整理如表 3-4。

表3-4 事實資料表

事實資料表 欄位名稱 資料型態 是 否 為 空

值(NULL) 欄位說明

Stock Report Fact

Stock Number(FK) Varchar(4) NOT NULL 股票代號 Report Date(FK) Datetime NOT NULL 報表公告日期 ZIP Code(FK) Varchar(5) NOT NULL 郵遞區號 Asset Varchar(60) 總資產 Operating Revenue Varchar(60) 營業收入 Operating Cost Varchar(60) 營業成本 Net Income Varchar(60) 營業淨利 Sales Revenue Varchar(60) 銷貨收入 Sales Cost Varchar(60) 銷貨成本 Sales Return & Discount Varchar(40) 銷貨退回與折讓 R&D Expenses Varchar(40) 研發費用

Sales Growth Rate Varchar(10) 銷貨成長率 Customer Returned Rate Varchar(10) 顧客退貨率 R&D Indicator Varchar(10) 研發效益指標 Productivity Varchar(10) 生產力

Average Revenue Varchar(40) 員工平均收益

Sales Fact

Sales Date(FK) Datetime NOT NULL 銷售日期 Product ID(FK) Varchar(5) NOT NULL 產品代碼 Customer ID(FK) Varchar(5) NOT NULL 顧客編號 Supplier ID(FK) Vachar(10) NOT NULL 供應商編號 Product Price Varchar(40) 產品單價 Product Cost Varchar(40) 產品成本 Product Quantity Varchar(40) 產品數量 Sales Revenue Varchar(60) 銷貨收入 Sales Cost Varchar(60) 銷貨成本 Gross Profit Varchar(60) 毛利

Clickstream Page Event

Fact

Visit Date(FK) Datetime NOT NULL 瀏覽日期 Visitor ID(FK) Varchar(10) NOT NULL 瀏覽者編號 Page ID(FK) Varchar(10) NOT NULL 頁面編號 Visit Count Varchar(60) 造訪人次 New Visit Count Varchar(60) 新造訪人次 Page Views Varchar(60) 網頁瀏覽量 Page Views Per Visit Varchar(60) 平均網頁瀏覽量 Unique Page Views Varchar(60) 特定頁面瀏覽量 Visit Bounce Rate Varchar(60) 造訪跳出率 Time On Site Varchar(60) 網站停留時間 Avg Time On Site

(Per Visit) Varchar(60) 平均網站停留時間 Survey 2006

Fact 參照表3-3 2006 年電子商務

調查資料 Survey 2007

Fact 參照表3-3 2007 年電子商務

調查資料 Survey 2008

Fact 參照表3-3 2008 年電子商務

調查資料 資料來源:本研究整理

3.6.3 維度資料表(Dimension Table)

維度資料表儲存本研究對象的主題資料,包括Company、ZIP、Report Date、

Product、Customer、Sales Date、Supply、Visitor、Page、Visit Date,以及Session,

並設定資料綱要(Data Schema),整理如下表3-5。

表3-5 維度資料表

事實資料表 欄位名稱 資料型態 是否為空值

(NULL) 欄位說明

Company

Stock Number(PK) Varchar(10) NOT NULL 股票代號 ZIP Code(FK) Varchar(5) NOT NULL 郵遞區號 Company Name Varchar(20) 公司名稱 Short Name Varchar(20) 公司簡稱 Address Varchar(20) 地址

Date of Establishment Datetime 公司成立日期 Age of Establishment Vachar(10) 成立年限 Report Date

Report Date(PK) Datetime NOT NULL 報表公告日期

Year Datetime 年度

Quarter Datetime 季別

Product

Product ID(PK) Varchar(10) NOT NULL 產品代碼 First Category Varchar(20) 大類 Second Category Varchar(20) 中類 Product Name Varchar(20) 產品名稱

Customer

Customer ID(PK) Varchar(10) NOT NULL 顧客編號 Customer Name Varchar(20) 顧客姓名 Customer Type Varchar(20) 顧客類型 Address Varchar(20) 地址

Sales Date

Sales Date(PK) Datetime NOT NULL 銷售日期

Year Datetime

Quarter Datetime

Month Datetime 月

Day Datetime 日

Supplier Supplier ID(PK) Varchar(10) NOT NULL 供應商編號 Supplier Name Varchar(20) 供應商名稱

Visitor

Visitor ID(PK) Varchar(10) NOT NULL 瀏覽者編號 Country Varchar(20) 國家

City Varchar(20) 城市 Network Domain Varchar(20) 網域 Network Location Varchar(20) 網路地區

Page

Page ID(PK) Varchar(10) NOT NULL 頁面編號 Land Page Path Varchar(60) 進入頁面路徑 Second Page Path Varchar(60) 次頁面路徑 Exit Page Path Varchar(60) 離開頁面路徑

Visit Date

Visit Date(PK) Datetime NOT NULL 瀏覽日期

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

化的介面與警示燈號控制來降低使用門檻,讓決策使用者能夠快速的學習使用。

1. 圖表化的介面

藉由圖表化的介面設計,創造容易學習、容易使用的介面。藉由點選和 下拉式選單的功能,避免由使用者操作輸入,造成系統介面回傳錯誤的情況,

使得使用者產生挫折感,而降低使用的動機。

2. 警示燈號控制

本研究採用警示燈號的概念,對使用者而言,能夠立即發現警示的問題

本研究採用警示燈號的概念,對使用者而言,能夠立即發現警示的問題

相關文件