• 沒有找到結果。

第四章、 個案分析

第四節、 STP 分析資料模型設計

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

62

本研究分析資料來源為台電用戶服務資料倉儲(隸屬單位:台電 綜合研究所),依據前述研究需求找出倉儲中相關資料欄項,以高壓 用戶屬性主檔,及 AMI 電表需量資料表為資料來源,其中前者高壓 用戶屬性主檔提供用戶基本屬性資料,共計 123 欄位,目前有 24,185 戶高壓用戶資料,而後者 AMI 電表需量資料提供用戶用電行為資料。

兩表之實體資料模型圖如下圖 23 及圖 24:

圖 23、資料倉儲-高壓用戶屬性主檔

資料來源:台電綜合研究所提供

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

63

圖 24、資料倉儲-AMI 電表需量資料表

資料來源:台電綜合研究所提供

2、資料超市

在後續分析的資料應用上,可直接抓取高壓用戶屬性主檔進行分 群、分類,但 AMI 電表需量資料表的儲存結構不利分析,故需經過 結構調整與轉換,以資料倉儲-AMI 電表需量資料表為基礎,抽取並 轉換資料,建置為資料超市。

 缺漏值補正

資料預處理首先設計 AMI 每 15 分鐘一筆用電度數資料缺漏值之 填補機制。資料倉儲中與用電度數相關欄位有五項,除了 AMI 資料

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

64

外,高壓用戶屬性主檔會記錄該用戶於該月份總用電度數,以及該月 份離峰時段用電總和、半尖峰時段用電總和、尖峰時段用電總和等,

記錄於主檔是為方便台電電費計算而用,因此加總某用戶於某月分 AMI 所記錄的各筆資料會與主檔總用電數度值相等,並且記錄該總 值分布於離峰、半尖峰、尖峰時段之用電度數。示意圖如下圖 25:

圖 25、預處理-AMI 缺漏值補正

資料來源:本研究整理

承上,可知總用電度數(x)與 AMI 電表度數總和(Sum

y

) 之差值即為資料缺漏總值,此差值依據該時段佔總用電度數比例給予 一加權乘數,平均分配給該時段缺漏值。以上圖 25 數值為例,若用 戶 A 於 2012 年 1 月 AMI 表中共缺漏 5 筆資料,其中 3 筆(a、b、c)

發生於尖峰時段,離峰與半尖峰各佔 1 筆(d、e),加總 AMI 資料表

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

65

中用戶 A 於 2012/1 用電度數為 298,000,數值補正計算如下:

總用電度數 - AMI 本月分用電總和 = 300,000 - 298,000 = 2,000

 尖峰時段缺漏值補正數值

= 2,000 * (110,000/300,000) * (1/3) = 244.4

 半尖峰時段缺漏值補正數值

= 2,000 * (100,000/300,000) * (1/1) = 666.6

 離峰時段缺漏值補正數值

= 2,000 * (90,000/300,000) * (1/1) = 600

故資料缺漏值 a、b、c 填補為 244.4,缺漏值 d 填補為 666.6,缺 漏值 e 填補為 600。

 資料存儲結構轉換

資料缺漏補正後,為適用分群、分類分析,將原分散於 AMI 電 表需量資料各列的用戶用電資料,轉存為單筆完整用戶用電資料,如 下圖 26 所示:

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

66

圖 26、預處理-AMI 資料存儲結構轉換

資料來源:本研究整理

 資料比例化

比例化公式:某時點用電度數 / Max(該資料列所有用電度數)。

比例化後數值將介於 0~1 間,目的在於消去資料間量值的差距,使資 料趨勢容易被比較。

如下圖 27 及圖 28 用戶 A、B 之數據及趨勢線所示,發現比例 化前用戶 A 於各時間點用電量皆高於用戶 B,在分群、分類上容易被 視為不同群/類,但經資料比例化後(見圖 29),可得 A、B 兩用戶 在用電行為趨勢是上相似的。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

67

圖 27、預處理-AMI 資料比例化前後數據

資要來源:本研究整理

圖 28、預處理-AMI 資料比例化前用電趨勢線

資料來源:本研究整理

0 10 20 30 40 50 60

1 2 3 4 5 6 7 8 9 10 11 12

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

68

圖 29、預處理-AMI 資料比例化後用電趨勢線

資料來源:本研究整理

因此,在資料預處理時,同時保留原始用電資料與比例化後用電 資料,可提供使用者在分析上視需求選擇較適當的資料形式。

 資料超市現況

據台電綜合研究所提供資料,目前取得 AMI 資料筆數共計 85,708 筆,共計有 1,190 戶高壓用戶,資料時間範圍橫跨 2011/7/1 ~ 2011/8/30 及 2012/1/2 ~ 2012/1/30 共 3 個月份。

0 0.2 0.4 0.6 0.8 1 1.2

1 2 3 4 5 6 7 8 9 10 11 12

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

69

 新增用電行為指標【尖離比】

用電行為指標:尖離比 = 尖峰用電量 / 離峰用電量(陳宗天,

台電綜研所會議簡報,100 年 12 月 16 日)。尖離比越高表示用戶用 電集中在尖峰時段,反之,尖離比越低表示用電分散在離峰時段。此 處尖峰時段定義為每日早上 7 時~下午 5 時,其餘時間屬離峰時段。

以尖離比來識別用戶,比值越高者越為優先改善對象,優先鼓勵 調整用電行為。於分析應用上可做為目標用戶選擇的依據,或做為用 戶分群、分類的屬性之一。

相關文件