蒐集適合特定用途之真實世界數據,建議遵循「真實世界證據 支持藥品研發之基本考量」所提出的流程,如下圖所示:
真實世界產生巨量的醫療相關數據,並非皆適用於法規用途,
必須經由設計良好的真實世界研究以蒐集合適的數據。研究設計的 原則與傳統臨床試驗相同,須清楚訂定研究目標,並事先擬定研究 計畫書(protocol)與統計分析計畫(statistical analysis plan)。
計畫書的內容必須完整,其中須具體說明數據的來源及其合理
(Data accrual)
數據處理
(一) 數據清理:意指發現並糾正數據中可識別之錯誤。檢查數據 是否有超出正常範圍之異常、是否有重複、或是否有遺漏。
評估數據蒐集過程中可能發生的錯誤,包含數據之輸入、測 量與合併等。建議事先制定數據清理程序,根據預先設定好 的標準來檢驗數據並處理錯誤數據。數據清理完成應擬訂相 關報告,說明數據完整性及所偵測到之錯誤。
(二) 數據轉換:目的是將數據轉換成通用格式,通用表達方式(如 專有名詞、編碼等),使數據成為適合進一步統計分析之數據 格式。步驟可以包含將數據集(dataset)轉換為通用數據模型 (common data model),數據去標識化,對記錄的數值進行標 準化,對臨床事件進行分類,對缺失數據進行插補及使用演 算法來計算複合或匯總變項(composite or summary variables) 等。原始數據轉換過程應完整記錄,包括轉換目的、歷史用 途、轉換決策、所採用的轉換方法、插補方法等。
(三) 數據串聯:目的是藉由數據串聯來連結個別病人紀錄在不同 數據庫之數據,以增加數據豐富性與完整性,或結合不同數 據來源之病人以增加樣本數。當串聯不同數據庫之相同病人 數據時,須注意病人隱私保護及可識別性。數據串聯過程須 完整記錄,包含不同來源間之數據不一致處(例如:個別病人
在同一時間兩個不同數據來源之同一變數之紀錄不同),及 比較不同數據庫的關鍵差異,包含測量方法、選擇偏差及數 據標準等。若真實世界數據來自多個不同醫療照護系統(例 如不同國家),則應考量不同醫療照護系統間數據差異,及其 他醫療照護系統之數據能否具備足夠的關聯性及可靠性,來 提供我國病人使用藥品的真實世界證據。若不同醫療照護系 統間數據差異大,可考慮預先制定解決數據差異的計畫。
數據蒐集與處理過程中,應將錯誤率減至最低,以確保 數據的品質。數據處理完成後,宜先評估適用性。若所蒐集 的數據具備相當的適用性,方可進入後續統計分析作業。後 續章節將對評估適用性做進一步闡述。