從 過 去 的 研 究 中 可 以 得 知 [44-45] , 病 人 疼 痛 自 控 止 痛 法 (Patient-Controlled Analgesia ,PCA) , 在 手 術 後 疼 痛 的 控 制 上 , 與 傳 統 肌 肉 注 射 止 痛 法 (Intramuscular Injection ,IM)相比,控制術後疼痛的效果較佳且所需時間較短。使用 PCA 裝置需先由麻 醉醫師,依據病患的身體狀況,設定適合該病患的麻醉藥劑量和使用該裝置的安全範 圍,其中安全範圍包括「鎖定時間(lockout)」和「四小時限制(4 hour limit)」。
本篇論文將資料探勘技術應用於實務經驗,用以預測分析病患使用 PCA 裝置的情 形,其中包括預測病患在使用 PCA 裝置一段時間後,在短期未來之內所需之總麻醉藥 劑量和病患經由按壓 PCA 裝置所注射之麻醉藥劑量,以及預測病患在之後的 PCA 使用 上,是否需要醫師調整 PCA 裝置的設定。在 PCA 裝置參數設定調整預測分析中,因為 大多數的病患使用 PCA 裝置時,在初始設定後大多無需重新設定參數,因此,在此預 測分析中會遭遇類別不平衡(class imbalance)之問題,傳統的學習演算法在學習類別不平 衡的資料 時,通 常會 傾向預測 多數類 別(majority class)而忽略了少數類別(minority class),造成「未做調整」類別的預測準確度很高,「有做調整」類別的資料卻大多被預 測錯誤,而對於類別不平衡的資料而言,大多數會較為關注少數類別,因此,「有做調 整」類別的預測準確度為我們希望改善之重點。此外,我們透過分群的方式,對「有做 調整」類別的資料作分群,以各群質心為圓心,該群中距質心最遠之資料與質心距離為 半徑,發現 99.875%「未做調整」之資料都在此圓邊界內,由此得知,我們的資料除了 有類別不平衡的問題以外,兩種類別的資料相當稀疏且重疊,其中有相當多的雜訊。這 些問題,在資料探勘領域中,是很具備挑戰性且困難的。
在總劑量預測、PCA 劑量預測和 PCA 裝置參數設定調整預測三種預測分析中,我 們 嘗 試 了 單 一 的 學 習 演 算 法 , 包 括 決 策 樹 (C4.5) 、 簡 單 貝 氏 分 類 器 (Naïve Bayes Classifier)、類神經網路(Artificial Neural Network ,ANN)、支援向量機(Support Vector Machine ,SVM)和決策表(Decision Table)五種學習演算法,再以決策樹為基礎演算法,發 展 bagging、bagging + stacking、random forest、random forest + stacking 和 AdaBoost 五
73
種整體學習演算法(ensemble learning algoritm),而在 PCA 裝置參數設定調整預測中,為 解決類別不平衡的問題,搭配減少多數類別取樣法(under sampling)和增加少數類別取樣 法(over sampling),因此在此預測分析中,還使用了 bagging + under sampling、bagging + over sampling、AdaBoost + under sampling、AdaBoost + over sampling 和 DataBoost-IM 五 種方法,共十種整體學習演算法。此外,我們也使用 k-nearest-neighbor 演算法對資料進 行資料清理(data cleaning),藉此刪除資料中的雜訊(noise)。
總劑量預測分析的實驗結果,bagging 為表現最佳之演算法,整體準確度為 80.9%,
而所有的演算法中,高劑量(high dose)的 recall 和 precision 的結果都差於一般劑量 (medium dose)和低劑量(low dose)的表現,我們推測是因為高劑量的資料數量較另外兩種 類別的資料數量來的少。而屬性分析的部分,我們發現 contidose(病人經由點滴方式被 注射的麻醉藥劑量)為較為重要之屬性,推測是因為有 78.1%的病患,麻醉藥的來源比 例,經由點滴方式被注射的麻醉藥劑量高於經由 PCA 裝置被注射的劑量。
PCA 劑量預測分析的部分,表現最佳的演算法為 bagging,有 73.1%的整體準確度,
並且經由 paired t-test 檢定,C4.5 搭配 bagging 均優於其他之演算法,且均有顯著差異。
我們也從屬性分析中得知,在該預測分析中,被決策樹挑選為較為重要之屬性,均與病 患按壓 PCA 裝置相關,例如,pcadose、p_timediff_var 等。而其中以 pcadose_9hr、
pcadose_6hr 和 pcadose_19hr 為出現頻率較高之屬性,我們利用單因子變異數分析 (One-way ANOVA),分析上述三個屬性以及鄰近時間之屬性與 PCA 劑量分類結果之相 關性,發現這幾個時間點之屬性與其他出現頻率非前十高之屬性相比,確實與 PCA 劑 量分類結果有較高之相關性。
在 PCA 裝置調整預測分析中,以 bagging + under sampling 搭配資料清理的表現最 佳,positive F-score 為 35.2%。而且大多數的學習演算法和整體學習演算法,在資料清 理後,positive F-score 和幾何平均(geometric mean)都顯著提升,顯示資料清理對大多數 的演算而言,在預測工作上都是有幫助的。我們以 bagging + under sampling 搭配資料清 理的結果和單一的學習演算法中,表現較好的 ANN + over sampling 和 Naïve Bayes + over sampling 的表現作比較,可以看出 bagging + under sampling 搭配資料清理的結果,
74
不僅可提升「有做調整」類別的準確度,在「未做調整」類別的準確度的部分,和 ANN + over sampling 比較之下,也並未降低太多。屬性分析的部分,我們找到 BP_HIGH 和 PULSE 兩種較為關鍵之屬性。
在我們的研究中,我們使用決策樹(C4.5)作為主要的資料探勘工具,而實驗結果也 證實,決策樹可以被應用於此研究上,在搭配整體學習演算法後,準確度的表現上有不 錯的表現外,決策樹也提供了較佳的可讀性。而在面對類別不平衡以及資料相當稀疏的 問題,我們利用 k-nearest-neighbor 演算法對資料進行資料清理,幾乎對所有的演算來 說,該方法均確實顯著提升了預測準確度 ,對我們的預測工作上是有幫助的。
我們利用決策樹的特性,挑選出在各個預測分析中,較為關鍵之屬性,並利用單因 子變異數分析(One-way ANOVA),證實這些屬性確實和各個預測分析的分類結果有較高 之相關性。和過去的文獻不同的地方在於,我們除了考量病患生理資訊的相關屬性外,
還加入病患使用 PCA 裝置的相關資訊作為預測工作之屬性,而在劑量的預測分析中,
經由決策樹挑選出的較為關鍵之屬性也大多為病患使用 PCA 裝置之相關資訊,然而文 獻中提出的年齡、性別和體重,和其他生理資訊屬性相比,確實還是具有較高之相關性。
而在最後的 lesion study 中,我們將屬性分為兩大部分,一部分為病患之生理資訊以及 手術相關屬性,也就是在過去的文獻中所使用之屬性,另一部份則是病患使用 PCA 裝 置之相關屬性,即在我們的研究中加入用來預測的屬性,發現僅使用病患之生理資訊以 及手術相關屬性的預測結果大多比以病患使用 PCA 裝置之相關屬性來作預測的結果來 得差,得知在我們的研究中,加入這些病患使用 PCA 裝置之相關屬性,對總劑量預測 和 PCA 裝置調整預測確實是有幫助的。
並且在過去的研究中,較少人去探討病患在使用 PCA 裝置期間,其參數是否需要 被調整,而我們在此問題中,找出 BP_HIGH 為較為關鍵之屬性,推測是因為患有高血 壓或是血壓較高者的病患,在使用 PCA 裝置時,會較一般未患有高血壓之病患有較高 之危險性,因此,也更容易會有不適的情況而需要調整參數。
75
參考文獻
1. B. Walder, M. Schafer, H. Henzi, ”Efficacy and safety of patient-controlled opioid analgesia for acute postoperative pain,” Acta Anaesthesiol Scand, pp. 795-804, 2001.
2. S.J. Dolin, J.N. Cashman, J.M. Bland, “Effectiveness of acute postoperative pain management: evidence from published data,” Br J Anaesth, pp. 409–423, 2002.
3. http://www.surgeryencyclopedia.com/La-Pa/Patient-Controlled-Analgesia.html (Patient-controlled analgesia)
4. J. B. MacQueen, ”Some Methods for classification and Analysis of Multivariate
Observations,” Proceedings of 5-th Berkeley Symposium on Mathematical Statistics and Probability, Berkeley, University of California Press, 1,pp.281-297, 1967.
5. J.R. Quinlan, C4.5: Programs for Empirical Learning, Morgan Kaufmann, San Francisco, CA. USA, 1993.
6. I.J. Good, “The Estimation of Probabilities; an Essay on Modern Bayesian Methods,”
M.I.T. Press, 1965.
7 . D. Paterson, “Artificial Neural Networks,” Prentice Hall, Singapore, 1996.
8. R.E. Fan, P.H. Chen, C.J. Lin, “Working Set Selection Using Second Order Information for Training Support Vector Machines,” Journal of Machine Learning Research, 6, pp.
1889-1918, 2005.
9. R. Kohavi, “The power of decision tables,” in European Conference on Machine Learning, 1995.
10. U.M. Fayyad, N. Weir, S. Djorgovski, “SKICAT: A machine learning system for
automated cataloging of large scale sky survey,” in Proc. 10th International Conference on Machine Learning, pp. 112-119, 1993.
11. W. Lehnert, S. Soderland, D. Aronow, F. Feng, A. Shmueli, “Inductive Text Classification
76
for Medical Applications,” J Experimental and Theoretical Artificial Intelligence 7(1), pp.
271-302, 1995.
12. E. Bauer, R. Kohavi, “An empirical comparison of voting classification algorithms:
Bagging, boosting, and variants,” Machine Learning, 36, pp. 105-139, 1999.
13. L. Breiman, “Bagging predictors,” Machine Learning Journal, 24, pp.123-140, 1996.
14. R. Schapire, “The strength of weak learnability,” Machine Learning, 5 (2), pp. 197-227, 1990.
15. L. Breiman, “Random forests,” Machine Learning Journal, 45, pp.5-32, 2001.
16. L. Breiman, “Looking Inside the Black Box,” Wald Lecture II, Department of Statistics, California University, 2002.
17. Y. Freund, R. Schapire, “Experiments with a new boosting algorithm,” In Proc. 13th International Conference on Machine Learning, pp. 148-156, 1996.
18. D. Wolpert, “Stacked generalization,” Neural Networks, 5, pp. 241-259, 1992.
19. N. Japkowics, S. Stephen, “The class imbalance problem: A systematic study,” Intelligent Data Analysis, 6(5), pp. 203-231, 2002.
20. C. Phua, D. Alahakoon, V. Lee, “Minority Report in Fraud Detection: Classification of Skewed Data,” SIGKDD Explorations, 6(1), pp. 50-59, 2004.
21. M. Kubat, R.C. Holte, S. Matwin,” Machine learning for the detection of oil spills in satellite radar images,” Machine Learning, 30, pp. 195–215, 1998.
22. M. Kubat, S. Matwin. “Addressing the curse of imbalanced training sets : One-sided selection,” In Proc. 14th International Conference on Machine Learning, pp. 179-186, 1997.
23. C. Ling, C. Li, “Data Mining for Direct Marketing Problems and Solutions,” In Proc. of 4th International Conference on Knowledge Discovery and Data Mining (KDD-98), 1998.
24. N. Chawla, K. Bowyer, L. Hall, W. Kegelmeyer, “SMOTE: Synthetic Minority
77
Over-sampling Technique,” J. Artificial Intelligence Research, 16, pp. 321-357, 2002.
25. C. Cardie, N. Howe, “Improving minority class prediction using case-specific feature weights,” in Proc. 14th International Conference on Machine Learning, pp. 57-65, 1997.
26. M.V. Joshi, R.C. Agarwal, V. Kumar, “Predicting rare classes: can boosting make any weak learner strong?” In Proc. 8th ACM SIGKDD international conference on Knowledge discovery and data mining. ACM, pp. 297-306, 2002.
27. H. Guo, H.L. Viktor, “Learning from imbalanced data sets with boosting and data generation: the DataBoost-IM approach,” Sigkdd Explorations, 6(1), pp. 30–39, 2004.
28. E.M. Knorr, R.T. Ng, V. Tucakov, “Distance-based outliers: algorithms and applications,”
The VLDB Journal, 8, pp. 237-253, 2000.
29. F. Angiulli, C. Pizzuti, “Fast outlier detection in high dimensional spaces,” In Proc. 6th European Conference on Principles of Data Mining and Knowledge Discovery, pp. 15-26, 2002.
30. G. Batista, R.C. Prati, M.C. Monard, ” A study of the behavior of several methods for balancing machine learning training data,” SIGKDD Explorations,6(1),pp. 20-29, 2004 31. M. Hall, E. Frank, G. Holmes, B. Pfahringer, P. Reutemann, and I. H. Witten, ”The
WEKA data mining software: An update,” SIGKDD Explorations, 11(1):10–18, 2009.
32. F. Provost, T. Fawcett, ”Robust classification for imprecise environments,” Machine Learning,42,pp. 203-231,2001.
33. M. Kubat, R. Horte, S. Matwin, “Learning when negative examples abound,” In Proc. 9th European Conference on Machine Learning, pp. 146-153, 1997.
34. D.D. Lewis, W. A. Gale, “A sequential algorithm for training text classifiers,” In Proc.
17th Annu. Int. ACM SIGIR Conf. Res. Develop. Inf. Retrieval, pp. 3–12, 1994.
35. P. E. Macintyre, D. A.Jarvis, “Age is the best predictor of postoperative morphine requirements,” Pain, 64, pp. 357–364, 1995.
36. H. Y. Ip, A. Abrishami, P. W. Peng, J. Wong, F Chung, “Predictors of postoperative pain
78
and analgesic consumption:A qualitative systematic review,” Anesthesiology, 111, pp.
657–77, 2009.
37. A. Abrishami, J. Chan, F. Chung, J. Wong, ”Preoperative Pain Sensitivity and Correlation with Analgesic Consumption,” Anesthesiology, 114, pp.445-457, 2011.
38. Y. Y. Chia, L. H. Chow, C. C. Hung, K. Liu, L. P. Ger, P. N. Wang,” Gender and pain upon movement are associated with the requirements for postoperative patientcontrolled iv analgesia: a prospective survey of 2,298 Chinese patients,” ANESTH, 49(3), pp.249-255, 2002.
39. B. Ng, J. E. Dimsdale, J.D. Rollnik and H. Shapiro, “The effect of ethnicity on
prescriptions for patient-controlled analgesia for post-operative pain,” Pain,66, pp. 9–12, 1996.
40. P. H. Pan, R. Coghill, T. T. Houle, M. H. Seid, W. M. Lindel and R. L. Parker et al.,
“Multifactorial preoperative predictors for postcesarean section pain and analgesic requirement,” Anesthesiology,104, pp. 417–425, 2006.
41. L. A. Fleisher, J. Beckman, ”Anesthesia and Noncardiac Surgery in Patients with Heart Disease,” In: R. O. Bonow, D. L. Mann, D. P. Zipes, P. Libby, Libby P, “Braunwald’s Heart Disease. 9th ed,” Philadelphia: Elsevier, pp. 1811-1827, 2012.
42. C. Prys-Roberts, “Hypertension and anesthesia—fifty years on,” Anesthesiology,50,pp.
281-284, 1979.
43. P.A. Steen, J.H. Tinker, S. Tarhan, “Myocardial reinfarction after anesthesia and surgery,”
JAMA, 239, pp. 2566–2570, 1978.
44. V. Thomas, M. Heath, D. Rose, P. Flory, ”Psychological characteristics and the effectiveness of patient-controlled analgesia,” British Journal of Anaesthesia, 74, pp.
271-276, 1995.
45. A.M. Chang, W.Y. Ip, T.H. Cheung, “Patient-controlled analgesia versus conventional intramuscular injection: a cost effectiveness analysis,” J Adv Nurs, 46(5), pp. 531–541,
79
2004.