建構醫療品質指標方法文獻之回顧
游宗憲
1,3賴美淑
2,3台大公衛學院醫療機構管理研究所
1台大公衛學院預防醫學研究所
2台大公衛學院健康保險研究中心
3前
言
二十一世紀的醫療照護是要追求一個安全、有 效果、以病人為中心、即時、有效率及公平的服務 系統[1]。醫療機構管理者與醫療專業提供者的使 命,在於掌握醫療的本質與醫療機構存在的意義─ 「品質」。有學者認為,在經歷過醫療擴張時期、 成本控制時期之後,醫療產業即將步入的是課責的 年代(era of accountability)[2],在這個時代之中,醫 療品質改善已然成為一門顯學,而且是醫療體系中 的一種核心能力,它不再是專屬熱心參與者的事 務,而已經變成了日常工作中的一環[3],而就在 一 代 品 質 大 師Avedis Donabedian 於 1966 年 在 Milbank Memorial Fund Quarterly-Health and Society( 後 來 改 名 為 Milbank Quarterly) 所 發 表 的”Evaluating Quality of Medical Care”[4]一文中將 醫療品質測量的內涵確立之後,醫療品質測量的架 構自此幾可確定。美國在醫療品質測量的領域一直 居於領先的地位,約莫在1980年代開始[5]投注大 量的資源在醫療品質議題上,醫療品質指標也在這 段時間開始被重視與應用,幾乎所有的品質改善活 動都會以醫療品質指標作為改善標的。 正因為醫療品質指標在品質測量的歷史中扮 演著十分重要的地位,因此醫療品質指標建立過程 是非常值得深入探究的,Web of Science (以下簡 稱WOS)為美國 Thomson Reuters 於 1997 年間建置之網際網路版引用文獻索引資料庫系統,提供 使用者理、工、醫、農、人文、及社會科學等各學 科領域之文獻書目、作者摘要、及引用文獻等資 料。該系統共包含Science Citation Index Expanded (SCI- EXPANDED)、 Social Sciences Citation Index (SSCI)與Arts & Humanities Citation Index (A&HCI) 三大資料庫(建立日期分別為1900年、1956年與 1975年所建立),收錄期刊超過 10,000 種,每週更 新其內容,每年提供超過 110 萬筆書目及2300 萬 筆引用文獻資料。該資料庫特有之文獻間相互引用 關係檢索,不但提供研究人員更完整之研究參考資 訊,更可依循前人研究軌跡,進一步瞭解同儕及競 爭對手之研究。除了可建構研究脈絡之外,更可以 透過引用次數的數據來了解該項領域/學科最重要 的經典文章有那些。 因此,本研究將藉由WOS來 了解醫療品質指標文獻的發展脈絡,並進一步整理 文獻中所提及的指標發展方法,以及透過這些嚴謹 的方法來重新檢視過去所發表的建構醫療品質指 標的文獻是如何建立的。
研究方法
一. 文獻搜尋策略 為達到研究目的,本研究利用WOS三大文獻 資料庫進行文獻搜尋,搜尋的時間為各資料庫建立 日期至2008年3月。此外WOS的查詢欄位之中與其 他資料庫不同的是他多了一項Topic,Topic這項欄 Title: Literature Review of Healthcare Quality Indicators DevelopmentAuthors: Tsung-Shien Yu1,3, Mei-Shu Lai2,3; 1Institute of Health Care Organization Administration; 2Institute of Public Health; 3Center for Health Insurance Research, National Taiwan University, Taipei, Taiwan
位代表查詢文章Title、Keywords、Abstracts,為提 昇搜尋解果的敏感度(sensitivity),本研究所採行的 搜尋策略為結合Title與Topic兩項欄位以求較多的 文 獻 篇 數 , 並 分 別 以Performance Measure 、 Performance Indicators、Quality Measure、Quality Indicator、Clinical Measure、Clinical Indicator與 Quality of Care作為搜尋字串,共可得到12項組合 (如表一),所得文獻篇數為1807篇。 二. 選取品質指標相關文章之條件 刪除重複出現的81篇文章之後,本研究再逐一 由題目著手刪除與指標無關的品質測量文章(如品 質評估、指引等)及其他非醫療照護相關(如實驗室 品質等)文章後剩餘430篇,其中建構醫療品質指標 的建構方法學文章有31篇(7.4%),指標實務開發的 文章有50篇(11.6%),其餘的349篇包含醫療品質指 標測量的概念、醫療品質指標風險校正的方法、醫 療品質指標的後續應用以及申報資料與照護結果 的關係等等幾類的文章。 本研究將就建構方法學與指標實務開發兩類 文章進行分析與整理。其中方法學的部分將著重在 被引用次數最多的文獻,並且從中整理共通的方 法;在指標實務開發的文章部份也將依據這些共通 的方法,進一步分析其完整性,提供台灣進行此類 研究應用之參考。
結
果
一. 文獻搜尋結果 從本次所選取的文獻之中可以發現首篇指標 建構方法學的文章出現於1981年,但到1992年開始 才幾乎每年都有這類的文章出現。而指標實務開發 的部份則集中於90年代後期,甚至在2000年之後成 表一:兩項搜尋策略所得之篇數 策略一 策略二Title Title 篇數 Title Topic 篇數
Performance Measure* 138 Performance Measure* 531 Performance Indicators 8 Performance Indicators 36
Quality Measure* 126 Quality Measure* 595
Quality Indicator 47 Quality Indicator 214
Clinical Measure* 1 Clinical Measure* 83
Clinical Indicator Quality of Care 3 Clinical Indicator Quality of Care 25 註:加註*時,系統會自動搜尋類似的字串,在本研究中即為 measure 與 measurement 0 2 4 6 8 10 12 1980 1982 1984 1986 1988 1990 1992 1994 1996 1998 2000 2002 2004 2006 年 文章數 指標開發 建構方法 圖一:1980 至 2007 年指標建構方法學與指標實務開發文獻發表狀況
長的速度更是有增無減(趨勢圖如圖一)。就指標的 內容來看,幾乎各種疾病、科別都有醫療品質指標 (見下文)。顯見醫療品質指標已經是當今一項重要 的品質改善工具 二. 指標建構方法學的整理 關於指標建構方法學的文章有很多,每篇文章 的步驟、手法各有不同,Campbell依據前人的研究
在 Research methods used in developing and
applying quality indicators in primary care[3]一文中
以宏觀的角度將指標發展的方法歸類為下列四種: 1. 非系統性之方法:他們根據資料和真實生活重
要 事 件 的 可 及 性(they are based on the availability of data and real life critical incidents.)。常應用於品質改善計畫內的個案研 究。 2. 以證據為基礎之系統性方法︰指標應建構在 科 學 證 據 之 上 並 且 經 過 嚴 謹 實 證 研 究 確 認 後,越強的證據力越能應用在降低罹病率、死 亡率或是改善照護品質。 3. 以證據為基礎並結合共識之系統性方法:在醫 療領域中,並不是所有的事情都有充足的科學 證據,所以必須要藉由近似於證據力的方法來 發展指標(family of evidence to develop quality indicators),包括利用專家意見來尋求共識。 4. 以指引為導向之系統性方法:指標也可以建構 在臨床照護指引之上,英國的NHS曾就糖尿 病、冠狀動脈心臟病、氣喘與憂鬱症四項重要 的臨床症狀發展指標,美國的AHCPR(AHRQ 的前身)也曾利用此方法發展指標。 究竟哪一類的發展方法是為多數人所接受的 呢?本研究則從31篇建構方法的文章中,挑選至 2008年3月底為止,被引用次數前三名進行回顧, 分 別 是 McGlynn 等 [6] 於 1998 年 所 發 表 的
Developing a clinical performance measure,被引用
次 數 為55 次 ; Ashton 等 [7] 於 1994 年 所 發 表 的 A
Method of Developing the Weighting Explicit Process of Care Criteria for Quality Assessment,引用次數為
46次;Rubin等[8]於2001年所發表的From a process
of care to a measure: the development and testing of a quality indicator,引用次數為33次。其內容整理
如下:
McGlynn等認為指標發展應該有四個步驟,包 含:(1)選擇要測量的臨床領域(choosing clinical areas to measure) ; (2) 在 每 個 領 域 中 選 擇 指 標 (selecting performance indicators within each area); (3) 設 計 可 以 讓 指 標 持 續 執 行 的 使 用 說 明 書 (designing specifications for consistent implementation of a measure);(4)評估指標的科學強度(evaluating the scientific strength of a measure)。
而Ashton等認為,品質指標的建構應該有六個 步驟,分別為:(1)找出現有文獻中的可作為指標 的指標清冊(Derivation of Criteria);(2)透過專家挑 選指標(Refinement of Criteria);(3)對於候選指標予 以權重(Weighting the Criteria);(4)挑選出不重要的 指標(Flagging of Low-yield Criteria);(5)選擇計算 方式(Selection of a Scoring Method);(6)訓練病歷審 查員進行效度確認(Training of Chart Reviewers)。
Rubin則是提出七步驟的指標建立流程,包 含:(1)確認指標的使用者;(2)選擇待評估的臨床 領域(Choose clinical area to evaluate);(3)組織評估 團隊(Organize assessment team);(4)選擇測量的角 度或準則(Select aspect of care or process criteria to be measured) ; (5) 撰 寫 指 標 說 明 (Write measure specifications) ; (6)執行前測 (Perform preliminary tests);(7)撰寫分析報告(Write scoring, analytical specifications)。 從以上三篇的發展步驟我們可以發現,Ashton 的方法比較著重在選取指標的階段,而McGlynn等 人與Rubin等人都有考量到指標發展的目的以及發 展之後的測試,但總體而言,在指標選取過程的方 法,三篇文章的相似性很高,綜合這三篇文章的優 點,一個嚴謹的指標發展方法應該包含以下幾項: 1. 確認測量領域、目的與使用者 2. 組織多元團隊 3. 收集具證據力的候選指標清單 4. 詳述指標選擇的方法 5. 進行實施前測試 6. 撰寫指標說明與分析報告 茲將上述六點,與 McGlynn、Ashton與Rubin 等人的文章進行比較,其結果如表二。 三. 指標實務開發文獻的完整性分析 以下將就本次研究所搜尋到的50篇開發醫療
品質指標的文獻,依據前文所彙整的六項重要關鍵 項目分別進行回顧。 1. 確認測量領域、目的與使用者 到底要測量什麼以及測量的目的是開發指標 的基石,這50篇文章中,如果依據指標的屬性可以 發現一共有19篇(38%)為單一疾病別的指標(如急 性心肌梗塞、中風)、18篇(36%)為單一科別的指標 (如精神科、外科、心臟外科、麻醉科)以及13篇(26 %)為一般性的指標(如再住院率、死亡率、未計畫 返院等等)。如果改以疾病型態進行分類,則急性 疾病指標有36篇(72%)、慢性疾病指標有2篇(4 %)、癌症指標有8篇(16%)、精神科指標為3篇(6 %)、安寧照護指標有1篇(2%)。如果依據測量的層 級作為分類的標準,則主要都為機構層級的指標, 共有48篇(96%),只有2篇(4%)為國家層級的測 量。至於指標建置的目的則是以內部改善的文章最 多,共有46篇(92%),機構外再應用的文章(如資訊 公開、國際比較)比例較少,共有4篇(8%)。 在確認欲測量的臨床領域與目的之後,另外必 須要考慮的是由誰來使用這些指標,Rubin[8]認為 應該要清楚的描述所產生的指標是要給誰使用、做 什麼用,不同的使用對象所選取的篩選條件會不 同,甚至之後的分析單位也會有所不同,這部分只 有兩篇以國際比較[9,10] 為目的的文章有較清楚 的說明,其餘的文章都較為隱晦不明。 2. 是否組織多元團隊 團隊中應該包含各種利害關係人,但總人數不 宜過多。假設要建立一個國家級的品質指標,則應 該廣邀各區域、各種規模與型態的醫療機構參與。 在這次所搜尋到的文章之中,大多數的文章在進行 指標開發時都有邀請其他的利害關係人共同參 與,僅有Kjaer等人[11]的文章,並沒有邀請其他關 係人參與,這是比較特殊的狀況。 3. 如何收集候選指標清單 這次所回顧的文章之中,其候選指標清冊來 源所採取的方法多數是文獻回顧、臨床指引與專家 意見三者的組合,其中以專家意見結合文獻以及文 獻結合指引最為常見,各佔40%,單獨使用文獻(12 %)、臨床指引(6%)的較少,也有1篇(2%)研究是直 接拿現已用於其他用途的指標作為候選指標清 冊。雖然說臨床指引的證據能力最高,但其與指標 仍存有根本性的差異[12],而且發展指引的過程往 往曠日廢時,並非所有醫療處置都有指引可以參 考,且醫療科技的進步又日新月異,所以臨床指引 也難完全作為候選指標,必須輔以其他的資料以求 資訊的完整。 4. 選擇指標的方式 這階段的工作就是要透過嚴謹的程序凝聚專 家的共識來選取適合的指標,在文章中最常見的方 法以美國蘭德公司所發展的RAND appropriateness method之修正型德菲法(modified Delphi)最為常見 (60%),其餘的共識方法還有專家會議(16%)、問 卷(10%)、德菲法(6%)、名目團體法(Nominal Group Technique, NGT)(4%)以及一名專業人士(2%)與證 據力(2%)。不過在Rubin的文章之中有提到在選取 指標時必須要注意風險校正的議題,但比較可惜的 是在這50篇文獻中,風險校正的過程與方法並沒有 被詳細的說明,因此也無法就此判定這些指標在建 立的過程之中是否有進行風險校正。 5. 進行實施前測試、撰寫指標說明與分析報告 在任何措施實施之前,如果可以進行小規模的 測試將會有助於後續的推行,撰寫指標說明與分析 表二:主要指標建構文獻比較表 主要文獻 指標建構步驟
McGlynn Ashton Rubin
確認測量領域與目的 - - + 組織多元團隊 x + + 收集候選指標清單 + + + 詳述指標選擇的方法 + + + 進行實施前測試 x x + 撰寫指標說明與分析報告 + x + x:無提及;-:部分提及;+:完全符合
報告更可以讓後人充分了解這些指標的來龍去 脈。同樣的在這50篇的文獻之中,往往都到選取指 標之後便停止了,我們無法從中了解所開發的指標 是否適用現實環境,當然更無法從中了解這些指標 是否真的被執行,或者僅止於研究階段。
討
論
從本研究結果可以發現,醫療品質指標在過去 十年間有著蓬勃的發展,雖然如此,但不意謂著醫 療品質指標是近十年的產物,這裡所呈現的結果僅 是文獻資料庫的搜尋結果,或許與實際使用狀況會 有不一致,例如美國馬里蘭州醫院協會所建立的 Maryland Quality Indicator Project 與 JCAHO 的 IMSystem都是於80年代所建立的,而有關這兩項 指標系統的文章並沒有出現在80年代的文章之 中,此乃本研究之限制。此外,本研究也發現建構 醫療品質指標的方法已經有一致性的作法,多數的 文章都是透過文獻的實證與專家的共識選取適合 的指標組,只是比較可惜這些文章並未談論到實施 前測試與測試的結果,因此我們也無法確定這些文 章所建立的指標是否符合實務上的需要。我們也發 現建立醫療品質指標的文章有越來越多的趨勢,這 也顯示在今日,醫療品質指標被重視的程度。因 此,本研究認為,從文獻之中,可以給台灣幾點啟 示: 1. 指標的發展與應用為大勢所趨:從這次的研究 結果發現,指標所涵蓋的面象越來越廣,不但 有急性疾病、慢性疾病、癌症、精神疾病,也 有內部性指標、外部性指標,幾乎是各個醫療 專業都可以發展屬於自己的指標,近年隨著病 人安全議題的被重視,也開始出現開發病人安 全指標的文章。而國內在這部份則較起步較 晚,大約在2000年左右開始推動醫療品質指 標,比較著名的除了有財團法人醫院評鑑暨醫 療品質策進會主導之「台灣醫療品質指標計 畫」(Taiwan Quality Indicator Project, TQIP)及 由臺灣醫務管理學會所辦理之「台灣醫療照護 指標系列」(Taiwan Healthcare Indicator Series, THIS)之外,近年來中央健康保險局也在總額 預算下建構了37項品質公開指標(醫院總額10項、西醫基層總額10項、牙醫總額7項、中醫 總額4項),血液透析也有6項,此外也有機構 內 部 使 用 的VPN(Virtual Private Network) 指 標,中央健康保險局各分局也另外自行建立數 項品質公開指標。除了中央健康保險局之外, 國民健康局也有六大癌症核心測量指標、衛生 署全民健保爭議審議委員會於去年亦推出三 項疾病品質公開指標,相較於既有的文獻,國 內的品質指標數量不算太多,而且除了TQIP、 THIS與各院自行建立的指標之外,其餘的指標 多由申報資料中取得,因此在臨床指標的部 份,台灣仍有相當大的發展空間,但是在研究 者也必須注意到指標資料的收集也是需要耗 費許多資源,以醫院現有的人力物力是否足以 因應,現有的指標是否就以足夠,這些都是必 須加以考量的地方,從這次的研究中可以發 現,過去的文獻對發展指標的必要性並未有清 楚的陳述,如果只淪落為為發展指標而發展指 標,則對於醫療品質的提升將無太大的助益。 2. 透過正式程序發展指標:同前文所提,指標的 發展方法至今日已經有一套完整且嚴謹的發 展方法,但反觀國內的指標系統,除TQIP與 THIS(TQIP 為 引 進 International Quality Indicator Project;THIS則為參考美國Maryland Quality Indicator Project - 亦 為 International Quality Indicator Project的前身-的發展方法所 建立的)以及國民健康局的六大癌症核心測量 指標之外,其餘的各項指標究竟是如何來的, 是否具有科學依據,是否依據學界所公認的發 展方法而產生的,由於沒有文獻報告,因此這 些疑問也只有主事者才能回答。而在發展指標 的過程中,利害關係人的參與是非常重要的, 除了可以了解各方的觀點之外,這也是確保指 標發展之後,使用者願意去相信且使用的一項 重要關鍵,特別是台灣多數的品質指標是由官 方所發佈的,這些指標數據將必須要十分具有 公信力,否則這些指標不被信任及使用,最後 淪入政府與醫界各說各話的情況這也不會是 社會大眾所樂見的壯況。 3. 審 慎 思 考 發 展 以 機 構 為 基 礎 之 次 級 資 料 (population-based) 或 以 臨 床個 案 資 料 為 基 礎
(case-based)的指標:在台灣,現有的指標都是 以機構為分析單位,不論是醫院自行提報的 TQIP、THIS或者是由中央健康保險局利用申 報資料所建立的各種指標,但卻沒有輔以臨床 個案資料為分析內容的指標系統。在本次所搜 尋到的文獻,亦僅有Malin等人[13]的文章是發 展以臨床個案資料為基礎的指標,其餘的指標 都是以人口為基礎的指標。Eddy[14]認為發展 以組織為基礎之次級資料指標將會有許多不 易克服的限制,包含缺乏即時性(bluntness)、 昂貴、資訊不完整、扭曲醫療行為等問題,如 果改發展臨床個案資料為基礎的指標則可以 獲得更多的臨床資訊、更可以了解病患就醫的 實際狀況、鼓勵醫師遵從指引、可以減少醫療 行為的扭曲、不需進行大規模資料庫分析等好 處。由國際的趨勢可以知道,未來指標的應用 將會是一大挑戰,因此指標的好壞是否能直接 代表品質的良莠就相當重要,國外曾有研究 [15,16]證實了指標的執行會扭曲醫療行為進 而帶來一些負面的未預期結果,這些未預期結 果甚至有可能會影響到醫療品質。因此,發展 以臨床個案資料為基礎的醫療品質指標似乎 是一項可行的替代方案。
結
語
品質指標是當今最重要的品質管理工具,從本 研究中可以發現在指標建立方法已經有高度的共 識,台灣在指標的發展與應用較晚,如何利用國際 的經驗來提昇自我的能力將是醫界與學界的當務 之急。推薦讀物
1. Institute of Medicine (U.S.). Committee on Quality of Health Care in America. Crossing the quality chasm: a new health system for the 21st century. 2001, Washington, DC: National Academy Press. xx, 337 p.
2. Relman AS: Assessment and accountability: the third revolution in medical care. N Engl J Med 1988;319: 1220-2.
3. Campbell SM, Braspenning J, Hutchinson A, et al: Research methods used in developing and applying quality indicators in primary care. Qual Saf Health Care 2002;11: 358-64.
4. Donabedian A: Evaluating Quality of Medical Care. Milbank Mem Fund Q 1966;44:166-206. 5. Loeb JM: The current state of performance
measurement in health care. Int J Qual Health Care 2004;16:I5-9.
6. McGlynn EA, Asch SM: Developing a clinical performance measure. Am J Prev Med 1998;14: 14-21.
7. Ashton CM, Kuykendall DH, Johnson ML, et al: A Method of Developing the Weighting Explicit Process of Care Criteria for Quality Assessment. Medical Care 1994;32:755-70.
8. Rubin HR, Pronovost P, Diette GB: From a process of care to a measure: the development and testing of a quality indicator. Int J Qual Health Care 2001;13: 489-96.
9. Arah OA, Westert GP, Hurst J: A conceptual framework for the OECD health care quality indicators project. Int J Qual Health Care 2006;18(s1): 5-13.
10. Arah OA, Westert GP, Hurst J, et al: Selecting indicators for patient safety at the health system level in OECD countries. Int J Qual Health Care 2006;18 (Suppl 1):5-13.
11. Kjaer ML, Mainz J, Soernsen LT, et al: Clinical quality indicators of venous leg ulcers: Development feasibility, and reliability. Ostomy Wound Management 2005;51: 64.
12. Walter LC, Davidowitz NP, Heineken PA, et al: Pitfalls of converting practice guidelines into quality measures: lessons learned from a VA performance measure. JAMA 2004;291:2466-70. 13. Malin JL, Asch SM, Kerr EA, et al: Evaluating
the quality of cancer care: development of cancer quality indicators for a global quality assessment tool. Cancer 2000;88:701-7.
and solutions. Health Aff (Millwood) 1998;17:7-25.
15. Tahrani AA, Varughese GI, Macleod AF: Pay-for-performance programs in family
practices in the United Kingdom. N Engl J Med 2006;355:1832-3.
16. Kassirer JP: Doctor discontent. N Engl J Med 1998;339:1543-5.