• 沒有找到結果。

數值標準化之建立

三、本研究選取指標項目

第二節 數值標準化之建立

本研究中為避免各項變數的尺度不一致,而形成某些大的尺度變數優勢支配 其他較小變數的偏誤。因此在分析時,我們先將各個變數加以標準化,即將各變數 之數值做平移(利用各變數值減去其平均值),再依各變數對該平均值做離散幅度 的調整(將其除以標準差),以得出該指標值對於各變數之相對位置,如此才足以得 到各指標之相對尺度的一致性,最後再利用正規化的過程,將數值轉換到 0-1 之間, 使其具有統一權重的功用,正規化的動作主要在避免數值經標準化後在權重的判 讀誤差,然後再進行後續之分析,相關的計算式如下:

R jk

=

T

x x

j j jk

………(3.1)

其中

R jk

=j 個指標第 k 個觀察值之標準化數值。

x jk

=第 j 個指標第 k 個觀察值。

x j

=第 j 個指標在新竹縣各鄉鎮市兩個年度的平均數。

T j

=第 j 個指標在新竹縣各鄉鎮市兩個年度之標準差。

標準化的指數值若為 0 則表示該指標值相當於新竹縣各鄉鎮市各年度之平均值,若 為正值則表示高於平均值,負值則表示低於平均值;各數值經標準化後其平均數為 0,標準差為 1,所以得到若標準化數值的絕對值大於 1,表示其數值差距在 1 個標準 差以上;若小於 1,表示數值差距在 1 個標準差以內,所以亦可經由標準化的過程看 出各數值的離散程度。

依社會學的研究,為提高數值的判讀性,本研究擬以線性轉換的方式將標準化 後的數值換算到 0-1 的區域,因為經由正規化的過程,才足以解決各數值的權重問 題,相關的計算式如下:

p jk

=

Y R R

j j

jk − , min

………..(3.2)

p jk

=第 j 個指標第 k 個觀察值的指數值。

R jk

=第 j 個指標第 k 個觀察值的標準化數值。

min ,

R

j

=第 j 個指標在新竹縣各鄉鎮市研究年度內觀察值標準化數值最小值。

Y J

=第 j 個指標在新竹縣各鄉鎮市研究年度內觀察值標準化數值(最大值-最 小值)。

經由正規化的過程所得到的各指數值若為 0.5 則表示接近於各鄉鎮市之平均 值,大於 0.5 則表示高於平均值,低於 0.5 則表示低於平均值,如此更可得知當指數 值愈接近 1 時則表示該指標愈接近高值,指數值愈接近 0 時則表示該指標愈接近低 值。

指標值轉換的最後程序將是調整正負符號,因本研究所採行的指標並非全部 和住宅區域發展有正向的關連性,為了統一其指數的方向,擬經由(1-指數值),將 其轉換成與住宅區域發展成正向的關連,而依本研究中與住宅區域發展呈負關連 性的指標計有:人口扶養比,犯罪率,離婚比例。

附表 3-1 是民國八十年和民國八十八年之各項變數資料標準化後之數值;在下 一節中,我們將依據上述各變數,進行因子分析和群落分析。

相關文件