國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
53 三、 個人 結 束最 高 學歷 的年 齡 ,與 結束 先 前學 歷 的年 齡 沒 有相 關。 四 、未 繼 續升 學女 性 的畢 業年 齡 ,與 繼 續升 學 女 性的畢業年齡兩者之間相互獨立 沒有相關。
第三節、研究方法
本節將結合研究資料介紹本研究 所使用之分析方法。
一、 存活分析簡介
存活分析方法是針對貫時性資料( longitudinal data)進行分析的 方法,關心事件(event)的發生及發生時間。傳統社會學研究多 半 分析橫斷面資料( cross-sectional data),只在乎當下為止發生 的事件,
比較缺乏對於長時間面 向的認 識。但是 事件發生的可能 性通常會 隨 著時間流逝與觀察群體 的改變產生差 異 ,因此本研究採 用存活分 析 方式捕捉女性的初婚可能性如何 逐齡改 變。
存活分析關注事件(event),以及到事件發生之前所經歷的時 間
(time)。事件是指任何研究者 關心的,發生在個人 身上的事件,可 以是死亡、生病、或是 初婚。 時間指個 人從觀察開始, 一直到事 件 發生為止經過的時間, 時間單位可以是 年、月、日等 。 在存活分 析 中,「時間」又稱為存活時間( survival time),指個人從觀察時間 起 點至事件發生這段期間(duration or period)。由於存 活分析通常關 注 於死亡,因此會將「事件」的發 生視為存活的失敗( failure)。但是 要如何界定開始或是事件,仍然 端看研究者關心的對 象。
本研究關心的事件為「 初婚」,存活時間( survival time)為「 結 束最高學歷至初婚發生的期間」,觀察的時 間單位是年。另外我們 關 心的初婚可能性,係指 在任何一個時間 點 上,未婚女性 進入初婚 的 可能性,此為存活分 析中的風險率 (hazard rate),與風險率相對 的
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
54
則是存活率(survival rate)。
然因初婚 事件 與原本 存活分 析中所 關注 的事件 —「死 亡」的 意 涵相去甚遠,故本文仍 保持初婚可能性 之稱呼,而不用 風險率來 指 稱,以避免概念上的混 淆。 透過存活分 析, 本研究得以 關注初婚 可 能性在時間軸上發生的變化。
二、 存活分析的資料類型
1. 完全資料
存 活 分 析 中主 要 分 析 的 資 料 為 完 全 型 資料 。 完 全 型 資 料指 的是 一 個觀 察 對象 ,我 們 可以 清楚 判 斷此 觀 察對 象 從 開始 到事 件 發生 的 時間 , 並 計 算其 存活 時 間。 以 本研 究 來 說,完全資料為已經結過婚、具 有初婚年齡的女性 。
2. 截斷型資料(Censored Data)
存 活 分析 中 有 個 關 鍵問 題 稱 為 截 斷( Censored)。 截 斷 型資 料發 生 的原 因 為: 當研 究 對象 的存 活 時間 超 過我 們 的 觀測時間,我們便無法清楚得 知 研究對象確切的存活時間。
以本研究資料為例,由於本研究採用的資料為 2006 年「婦 女婚育與就業調查」,若女性在調查當時尚未結婚,則缺乏 初婚年齡資料,自然無法計算其 存活時間。
三、 存活分析的術語
1. 存活時間
T 是一隨機變數,我們以 大寫的 T 來代表個人的存活時 間。
survival time ( 0)
T T
‧
存活分析以存活函數(survival function)和風險函數(hazard rate)為基礎,說明事件 存活的時間及離開的機 率。
‧
法(Kaplan-Meier estimation)或稱 PL 估計法(product-limit estimation)來計算女性初婚可能性 的存活函數,此 方法為非參數的 模型,僅 樣
Kleinbaum & Klein(2005)認為存活分析有三 個主要目的:一、
估計、解釋存活和風險 函數。 二、比較 存活和風險函數 。 三、了 解 解釋變項和存活時間的 關係。本研究欲 以存活分析方法 ,展現女 性 的初婚可能性如何隨著 年齡 改變,並且 了解結束最高教 育 的年齡 對 於初婚可能性的影響。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
57