數值標準化之建立

三､本研究選取指標項目

第二節數值標準化之建立

本研究中為避免各項變數的尺度不一致,而形成某些大的尺度變數優勢支配其他較小變數的偏誤。因此在分析時,我們先將各個變數加以標準化,即將各變數之數值做平移(利用各變數值減去其平均值),再依各變數對該平均值做離散幅度的調整(將其除以標準差),以得出該指標值對於各變數之相對位置,如此才足以得到各指標之相對尺度的一致性,最後再利用正規化的過程,將數值轉換到 0-1 之間, 使其具有統一權重的功用,正規化的動作主要在避免數值經標準化後在權重的判讀誤差,然後再進行後續之分析,相關的計算式如下:

R ^jk

⁼

T

x x

j j jk −

………(3.1)

其中

R ^jk

=j 個指標第 k 個觀察值之標準化數值。

x ^jk

=第 j 個指標第 k 個觀察值。

x ^j

=第 j 個指標在新竹縣各鄉鎮市兩個年度的平均數。

T ^j

=第 j 個指標在新竹縣各鄉鎮市兩個年度之標準差。

標準化的指數值若為 0 則表示該指標值相當於新竹縣各鄉鎮市各年度之平均值,若為正值則表示高於平均值,負值則表示低於平均值;各數值經標準化後其平均數為 0,標準差為 1,所以得到若標準化數值的絕對值大於 1,表示其數值差距在 1 個標準差以上;若小於 1,表示數值差距在 1 個標準差以內,所以亦可經由標準化的過程看出各數值的離散程度。

依社會學的研究,為提高數值的判讀性,本研究擬以線性轉換的方式將標準化後的數值換算到 0-1 的區域,因為經由正規化的過程,才足以解決各數值的權重問題,相關的計算式如下:

p _jk

⁼

Y R R

j j

jk − , min

………..(3.2)

p _jk

=第 j 個指標第 k 個觀察值的指數值。

R ^jk

=第 j 個指標第 k 個觀察值的標準化數值。

min ,

j

=第 j 個指標在新竹縣各鄉鎮市研究年度內觀察值標準化數值最小值。

Y ^J

=第 j 個指標在新竹縣各鄉鎮市研究年度內觀察值標準化數值(最大值-最 小值)。

經由正規化的過程所得到的各指數值若為 0.5 則表示接近於各鄉鎮市之平均值,大於 0.5 則表示高於平均值,低於 0.5 則表示低於平均值,如此更可得知當指數值愈接近 1 時則表示該指標愈接近高值,指數值愈接近 0 時則表示該指標愈接近低值。

指標值轉換的最後程序將是調整正負符號,因本研究所採行的指標並非全部和住宅區域發展有正向的關連性,為了統一其指數的方向,擬經由(1-指數值),將其轉換成與住宅區域發展成正向的關連,而依本研究中與住宅區域發展呈負關連性的指標計有:人口扶養比,犯罪率,離婚比例。

附表 3-1 是民國八十年和民國八十八年之各項變數資料標準化後之數值;在下一節中,我們將依據上述各變數,進行因子分析和群落分析。

在文檔中第一節研究動機與目的一､研究動機 (頁 40-43)

三､本研究選取指標項目

第二節 數值標準化之建立

R jk

T

x x

j j jk −

R jk

x jk

x j

T j

p jk

Y R R

j j

jk − , min

p jk

R jk

min ,

j

Y J

第二節數值標準化之建立

R ^jk

R ^jk

x ^jk

x ^j

T ^j

p _jk

p _jk

R ^jk

Y ^J