確數據(unbiased estimates),而且誤差的計算(standard error)也不同,使得
分析資料的工作比較複雜。但目前已有適當電腦軟體(computer program)可以正
確地解決這些問題。
研究型資料庫
精心設問卷及量表。問卷及量表的製作,影響資料品質與回覆 率。一些重要考量包括
用詞要簡易,避免使用很深或不常用的字;
問題要扼要,不可冗長;
回答問卷或考試所需時間不宜太長(一般以50分鐘為限),以免受 訪或受試者疲勞、厭倦、沒做完或不專心做答;
有關問卷的說明與指示(instruction)要簡明,以免受訪者(答卷 者)不知如何進行做答;
一些問題若在長期追蹤研究或其他定期研究重覆使用,則問題方 式與內容得維持一致性(consistency),以便做比較(trend
analysis or inter-cohort comparison);
關鍵性的問題(critical items)不宜排在太後面,以減少被「空 白」的現象;
避免使用雙重負向的問題(double negative);
注意編印格式與排版,包括字體大小、行間距離等。重要說明 部份可加框或用不同顏色,加重標示,以免被忽略。問卷印刷 不宜太精美或太粗糙。
研究型資料庫
採用多重資料來源。為了充實資料內容、提升品質、減低個別做答問 卷及評量時間,可考量從不同來源蒐集資料,匯整成為資料庫。假如 所需資料能從現有的檔案抽錄,則應儘量從這些檔中節錄抽取。以美 國高中生長期追蹤研究(如High School and Beyond)為例,資料來源 包括
學生就讀高中的學校資料,包括校長問卷調查資料,以便了解可 能影響學生成長的學校因素。
高中授課教師的問卷調查(以英文及數學老師為主),以便了解教 師素質以及教師教學措施與學生成長的關係,同時也藉此徵求教 師給每位學生做一些評量。
父母親問卷調查,以便了解家庭狀況、父母親觀念以及家庭教育、
輔導等因素。
在校學生記錄表內之資料(student transcripts),包括背景、所 修課程及成績、活動表現記錄以及會考成績(如州際會考,SAT,
ACT等)。
學生問卷調查及測驗評量,調查內容包括學生在校活動、學習及表現 以及學生觀念、態度、抱負、未來生涯規劃、升學計畫等。
研究型資料庫
建置方便使用的電腦檔。有三個值得特別留意的項目是:
檢驗資料的正確性。許多資料在處理過程中,由於人員的疏忽,
造成錯誤。這種錯誤是不能容忍的,應設法避免。為了減少錯誤,
除了要求資料處理工作人員必須細心之外,往往還常要有檢測人 員,設計一些程序抽檢資料,比如做一些統計分析,診斷可能的 錯誤。
為資料所做的檔案說明也必須正確無誤。
維護隱私權。資料確定無誤之後,還需考量如何保護資料,以防被人 用來傷害個人(privacy protection)。在美國,任何可能被用來找出 個人身份的資料,都會被刪除或限制使用。每一個資料庫在發放給大 眾使用之前,都要經由一個特別委員會審核(Disclosure Analysis Review Board)、分析及檢驗資料檔中是否有些可能資料,被用來找出 個人身份的可能性,並提出改進辦法。有些資料庫含有很多經由分析 後可能檢定個人身份的資料,不能完全以刪除方式處理,因此一方面 為了維護隱私權,另一方面又為了促進資料的高度使用,有些資料庫 分成「大眾使用檔」 (public released file)及「限制性使用檔」
(restricted file)兩類。要使用「限制性使用檔」的研究人員必須提 出申請,說明研究用途並保證遵守使用規則,若有違規,則接受重罰 (可判五年徒刑或二十五萬元罰款)。
研究型資料庫