建構醫療品質指標方法文獻之回顧

(1)

建構醫療品質指標方法文獻之回顧

游宗憲

1,3

賴美淑

2,3

台大公衛學院醫療機構管理研究所

1

台大公衛學院預防醫學研究所

2

台大公衛學院健康保險研究中心

3

前

言

二十一世紀的醫療照護是要追求一個安全、有效果、以病人為中心、即時、有效率及公平的服務系統[1]。醫療機構管理者與醫療專業提供者的使命，在於掌握醫療的本質與醫療機構存在的意義─ 「品質」。有學者認為，在經歷過醫療擴張時期、成本控制時期之後，醫療產業即將步入的是課責的年代(era of accountability)[2]，在這個時代之中，醫療品質改善已然成為一門顯學，而且是醫療體系中的一種核心能力，它不再是專屬熱心參與者的事務，而已經變成了日常工作中的一環[3]，而就在一代品質大師Avedis Donabedian 於 1966 年在 Milbank Memorial Fund Quarterly-Health and Society( 後來改名為 Milbank Quarterly) 所發表的”Evaluating Quality of Medical Care”[4]一文中將醫療品質測量的內涵確立之後，醫療品質測量的架構自此幾可確定。美國在醫療品質測量的領域一直居於領先的地位，約莫在1980年代開始[5]投注大量的資源在醫療品質議題上，醫療品質指標也在這段時間開始被重視與應用，幾乎所有的品質改善活動都會以醫療品質指標作為改善標的。正因為醫療品質指標在品質測量的歷史中扮演著十分重要的地位，因此醫療品質指標建立過程是非常值得深入探究的，Web of Science （以下簡稱WOS）為美國 Thomson Reuters 於 1997 年間

建置之網際網路版引用文獻索引資料庫系統，提供使用者理、工、醫、農、人文、及社會科學等各學科領域之文獻書目、作者摘要、及引用文獻等資料。該系統共包含Science Citation Index Expanded (SCI- EXPANDED)、 Social Sciences Citation Index (SSCI)與Arts & Humanities Citation Index (A&HCI) 三大資料庫(建立日期分別為1900年、1956年與 1975年所建立)，收錄期刊超過 10,000 種，每週更新其內容，每年提供超過 110 萬筆書目及2300 萬筆引用文獻資料。該資料庫特有之文獻間相互引用關係檢索，不但提供研究人員更完整之研究參考資訊，更可依循前人研究軌跡，進一步瞭解同儕及競爭對手之研究。除了可建構研究脈絡之外，更可以透過引用次數的數據來了解該項領域/學科最重要的經典文章有那些。因此，本研究將藉由WOS來了解醫療品質指標文獻的發展脈絡，並進一步整理文獻中所提及的指標發展方法，以及透過這些嚴謹的方法來重新檢視過去所發表的建構醫療品質指標的文獻是如何建立的。

研究方法

一. 文獻搜尋策略為達到研究目的，本研究利用WOS三大文獻資料庫進行文獻搜尋，搜尋的時間為各資料庫建立日期至2008年3月。此外WOS的查詢欄位之中與其他資料庫不同的是他多了一項Topic，Topic這項欄 Title: Literature Review of Healthcare Quality Indicators Development

Authors: Tsung-Shien Yu1,3, Mei-Shu Lai2,3; 1Institute of Health Care Organization Administration; 2Institute of Public Health; 3Center for Health Insurance Research, National Taiwan University, Taipei, Taiwan

(2)

位代表查詢文章Title、Keywords、Abstracts，為提昇搜尋解果的敏感度(sensitivity)，本研究所採行的搜尋策略為結合Title與Topic兩項欄位以求較多的文獻篇數，並分別以Performance Measure 、 Performance Indicators、Quality Measure、Quality Indicator、Clinical Measure、Clinical Indicator與 Quality of Care作為搜尋字串，共可得到12項組合 (如表一)，所得文獻篇數為1807篇。二. 選取品質指標相關文章之條件刪除重複出現的81篇文章之後，本研究再逐一由題目著手刪除與指標無關的品質測量文章(如品質評估、指引等)及其他非醫療照護相關(如實驗室品質等)文章後剩餘430篇，其中建構醫療品質指標的建構方法學文章有31篇(7.4%)，指標實務開發的文章有50篇(11.6%)，其餘的349篇包含醫療品質指標測量的概念、醫療品質指標風險校正的方法、醫療品質指標的後續應用以及申報資料與照護結果的關係等等幾類的文章。本研究將就建構方法學與指標實務開發兩類文章進行分析與整理。其中方法學的部分將著重在被引用次數最多的文獻，並且從中整理共通的方法；在指標實務開發的文章部份也將依據這些共通的方法，進一步分析其完整性，提供台灣進行此類研究應用之參考。

結

果

一. 文獻搜尋結果從本次所選取的文獻之中可以發現首篇指標建構方法學的文章出現於1981年，但到1992年開始才幾乎每年都有這類的文章出現。而指標實務開發的部份則集中於90年代後期，甚至在2000年之後成表一：兩項搜尋策略所得之篇數策略一策略二

Title Title 篇數 Title Topic 篇數

Performance Measure* 138 Performance Measure* 531 Performance Indicators 8 Performance Indicators 36

Quality Measure* 126 Quality Measure* 595

Quality Indicator 47 Quality Indicator 214

Clinical Measure* 1 Clinical Measure* 83

Clinical Indicator Quality of Care 3 Clinical Indicator Quality of Care 25 註：加註*時，系統會自動搜尋類似的字串，在本研究中即為 measure 與 measurement 0 2 4 6 8 10 12 1980 1982 1984 1986 1988 1990 1992 1994 1996 1998 2000 2002 2004 2006 年文章數指標開發建構方法圖一：1980 至 2007 年指標建構方法學與指標實務開發文獻發表狀況

(3)

長的速度更是有增無減(趨勢圖如圖一)。就指標的內容來看，幾乎各種疾病、科別都有醫療品質指標 (見下文)。顯見醫療品質指標已經是當今一項重要的品質改善工具二. 指標建構方法學的整理關於指標建構方法學的文章有很多，每篇文章的步驟、手法各有不同，Campbell依據前人的研究

在 Research methods used in developing and

applying quality indicators in primary care[3]一文中

以宏觀的角度將指標發展的方法歸類為下列四種： 1. 非系統性之方法：他們根據資料和真實生活重

要事件的可及性(they are based on the availability of data and real life critical incidents.)。常應用於品質改善計畫內的個案研究。 2. 以證據為基礎之系統性方法︰指標應建構在科學證據之上並且經過嚴謹實證研究確認後，越強的證據力越能應用在降低罹病率、死亡率或是改善照護品質。 3. 以證據為基礎並結合共識之系統性方法：在醫療領域中，並不是所有的事情都有充足的科學證據，所以必須要藉由近似於證據力的方法來發展指標(family of evidence to develop quality indicators)，包括利用專家意見來尋求共識。 4. 以指引為導向之系統性方法：指標也可以建構在臨床照護指引之上，英國的NHS曾就糖尿病、冠狀動脈心臟病、氣喘與憂鬱症四項重要的臨床症狀發展指標，美國的AHCPR(AHRQ 的前身)也曾利用此方法發展指標。究竟哪一類的發展方法是為多數人所接受的呢？本研究則從31篇建構方法的文章中，挑選至 2008年3月底為止，被引用次數前三名進行回顧，分別是 McGlynn 等 [6] 於 1998 年所發表的

Developing a clinical performance measure，被引用

次數為55 次； Ashton 等 [7] 於 1994 年所發表的 A

Method of Developing the Weighting Explicit Process of Care Criteria for Quality Assessment，引用次數為

46次；Rubin等[8]於2001年所發表的From a process

of care to a measure: the development and testing of a quality indicator，引用次數為33次。其內容整理

如下：

McGlynn等認為指標發展應該有四個步驟，包含：(1)選擇要測量的臨床領域(choosing clinical areas to measure) ； (2) 在每個領域中選擇指標 (selecting performance indicators within each area)； (3) 設計可以讓指標持續執行的使用說明書 (designing specifications for consistent implementation of a measure)；(4)評估指標的科學強度(evaluating the scientific strength of a measure)。

而Ashton等認為，品質指標的建構應該有六個步驟，分別為：(1)找出現有文獻中的可作為指標的指標清冊(Derivation of Criteria)；(2)透過專家挑選指標(Refinement of Criteria)；(3)對於候選指標予以權重(Weighting the Criteria)；(4)挑選出不重要的指標(Flagging of Low-yield Criteria)；(5)選擇計算方式(Selection of a Scoring Method)；(6)訓練病歷審查員進行效度確認(Training of Chart Reviewers)。

Rubin則是提出七步驟的指標建立流程，包含：(1)確認指標的使用者；(2)選擇待評估的臨床領域(Choose clinical area to evaluate)；(3)組織評估團隊(Organize assessment team)；(4)選擇測量的角度或準則(Select aspect of care or process criteria to be measured) ； (5) 撰寫指標說明 (Write measure specifications) ； (6)執行前測 (Perform preliminary tests)；(7)撰寫分析報告(Write scoring, analytical specifications)。從以上三篇的發展步驟我們可以發現，Ashton 的方法比較著重在選取指標的階段，而McGlynn等人與Rubin等人都有考量到指標發展的目的以及發展之後的測試，但總體而言，在指標選取過程的方法，三篇文章的相似性很高，綜合這三篇文章的優點，一個嚴謹的指標發展方法應該包含以下幾項： 1. 確認測量領域、目的與使用者 2. 組織多元團隊 3. 收集具證據力的候選指標清單 4. 詳述指標選擇的方法 5. 進行實施前測試 6. 撰寫指標說明與分析報告茲將上述六點，與 McGlynn、Ashton與Rubin 等人的文章進行比較，其結果如表二。三. 指標實務開發文獻的完整性分析以下將就本次研究所搜尋到的50篇開發醫療

(4)

品質指標的文獻，依據前文所彙整的六項重要關鍵項目分別進行回顧。 1. 確認測量領域、目的與使用者到底要測量什麼以及測量的目的是開發指標的基石，這50篇文章中，如果依據指標的屬性可以發現一共有19篇(38％)為單一疾病別的指標(如急性心肌梗塞、中風)、18篇(36％)為單一科別的指標 (如精神科、外科、心臟外科、麻醉科)以及13篇(26 ％)為一般性的指標(如再住院率、死亡率、未計畫返院等等)。如果改以疾病型態進行分類，則急性疾病指標有36篇(72％)、慢性疾病指標有2篇(4 ％)、癌症指標有8篇(16%)、精神科指標為3篇(6 ％)、安寧照護指標有1篇(2%)。如果依據測量的層級作為分類的標準，則主要都為機構層級的指標，共有48篇(96%)，只有2篇(4％)為國家層級的測量。至於指標建置的目的則是以內部改善的文章最多，共有46篇(92％)，機構外再應用的文章(如資訊公開、國際比較)比例較少，共有4篇(8％)。在確認欲測量的臨床領域與目的之後，另外必須要考慮的是由誰來使用這些指標，Rubin[8]認為應該要清楚的描述所產生的指標是要給誰使用、做什麼用，不同的使用對象所選取的篩選條件會不同，甚至之後的分析單位也會有所不同，這部分只有兩篇以國際比較[9,10] 為目的的文章有較清楚的說明，其餘的文章都較為隱晦不明。 2. 是否組織多元團隊團隊中應該包含各種利害關係人，但總人數不宜過多。假設要建立一個國家級的品質指標，則應該廣邀各區域、各種規模與型態的醫療機構參與。在這次所搜尋到的文章之中，大多數的文章在進行指標開發時都有邀請其他的利害關係人共同參與，僅有Kjaer等人[11]的文章，並沒有邀請其他關係人參與，這是比較特殊的狀況。 3. 如何收集候選指標清單這次所回顧的文章之中，其候選指標清冊來源所採取的方法多數是文獻回顧、臨床指引與專家意見三者的組合，其中以專家意見結合文獻以及文獻結合指引最為常見，各佔40%，單獨使用文獻(12 ％)、臨床指引(6％)的較少，也有1篇(2%)研究是直接拿現已用於其他用途的指標作為候選指標清冊。雖然說臨床指引的證據能力最高，但其與指標仍存有根本性的差異[12]，而且發展指引的過程往往曠日廢時，並非所有醫療處置都有指引可以參考，且醫療科技的進步又日新月異，所以臨床指引也難完全作為候選指標，必須輔以其他的資料以求資訊的完整。 4. 選擇指標的方式這階段的工作就是要透過嚴謹的程序凝聚專家的共識來選取適合的指標，在文章中最常見的方法以美國蘭德公司所發展的RAND appropriateness method之修正型德菲法(modified Delphi)最為常見 (60％)，其餘的共識方法還有專家會議(16%)、問卷(10%)、德菲法(6%)、名目團體法(Nominal Group Technique, NGT)(4％)以及一名專業人士(2%)與證據力(2%)。不過在Rubin的文章之中有提到在選取指標時必須要注意風險校正的議題，但比較可惜的是在這50篇文獻中，風險校正的過程與方法並沒有被詳細的說明，因此也無法就此判定這些指標在建立的過程之中是否有進行風險校正。 5. 進行實施前測試、撰寫指標說明與分析報告在任何措施實施之前，如果可以進行小規模的測試將會有助於後續的推行，撰寫指標說明與分析表二：主要指標建構文獻比較表主要文獻指標建構步驟

McGlynn Ashton Rubin

確認測量領域與目的 - - + 組織多元團隊 x + + 收集候選指標清單 + + + 詳述指標選擇的方法 + + + 進行實施前測試 x x + 撰寫指標說明與分析報告 + x + x：無提及；-：部分提及；+：完全符合

(5)

報告更可以讓後人充分了解這些指標的來龍去脈。同樣的在這50篇的文獻之中，往往都到選取指標之後便停止了，我們無法從中了解所開發的指標是否適用現實環境，當然更無法從中了解這些指標是否真的被執行，或者僅止於研究階段。

討

論

從本研究結果可以發現，醫療品質指標在過去十年間有著蓬勃的發展，雖然如此，但不意謂著醫療品質指標是近十年的產物，這裡所呈現的結果僅是文獻資料庫的搜尋結果，或許與實際使用狀況會有不一致，例如美國馬里蘭州醫院協會所建立的 Maryland Quality Indicator Project 與 JCAHO 的 IMSystem都是於80年代所建立的，而有關這兩項指標系統的文章並沒有出現在80年代的文章之中，此乃本研究之限制。此外，本研究也發現建構醫療品質指標的方法已經有一致性的作法，多數的文章都是透過文獻的實證與專家的共識選取適合的指標組，只是比較可惜這些文章並未談論到實施前測試與測試的結果，因此我們也無法確定這些文章所建立的指標是否符合實務上的需要。我們也發現建立醫療品質指標的文章有越來越多的趨勢，這也顯示在今日，醫療品質指標被重視的程度。因此，本研究認為，從文獻之中，可以給台灣幾點啟示： 1. 指標的發展與應用為大勢所趨：從這次的研究結果發現，指標所涵蓋的面象越來越廣，不但有急性疾病、慢性疾病、癌症、精神疾病，也有內部性指標、外部性指標，幾乎是各個醫療專業都可以發展屬於自己的指標，近年隨著病人安全議題的被重視，也開始出現開發病人安全指標的文章。而國內在這部份則較起步較晚，大約在2000年左右開始推動醫療品質指標，比較著名的除了有財團法人醫院評鑑暨醫療品質策進會主導之「台灣醫療品質指標計畫」(Taiwan Quality Indicator Project, TQIP)及由臺灣醫務管理學會所辦理之「台灣醫療照護指標系列」(Taiwan Healthcare Indicator Series, THIS)之外，近年來中央健康保險局也在總額預算下建構了37項品質公開指標(醫院總額10

項、西醫基層總額10項、牙醫總額7項、中醫總額4項)，血液透析也有6項，此外也有機構內部使用的VPN(Virtual Private Network) 指標，中央健康保險局各分局也另外自行建立數項品質公開指標。除了中央健康保險局之外，國民健康局也有六大癌症核心測量指標、衛生署全民健保爭議審議委員會於去年亦推出三項疾病品質公開指標，相較於既有的文獻，國內的品質指標數量不算太多，而且除了TQIP、 THIS與各院自行建立的指標之外，其餘的指標多由申報資料中取得，因此在臨床指標的部份，台灣仍有相當大的發展空間，但是在研究者也必須注意到指標資料的收集也是需要耗費許多資源，以醫院現有的人力物力是否足以因應，現有的指標是否就以足夠，這些都是必須加以考量的地方，從這次的研究中可以發現，過去的文獻對發展指標的必要性並未有清楚的陳述，如果只淪落為為發展指標而發展指標，則對於醫療品質的提升將無太大的助益。 2. 透過正式程序發展指標：同前文所提，指標的發展方法至今日已經有一套完整且嚴謹的發展方法，但反觀國內的指標系統，除TQIP與 THIS(TQIP 為引進 International Quality Indicator Project；THIS則為參考美國Maryland Quality Indicator Project - 亦為 International Quality Indicator Project的前身-的發展方法所建立的)以及國民健康局的六大癌症核心測量指標之外，其餘的各項指標究竟是如何來的，是否具有科學依據，是否依據學界所公認的發展方法而產生的，由於沒有文獻報告，因此這些疑問也只有主事者才能回答。而在發展指標的過程中，利害關係人的參與是非常重要的，除了可以了解各方的觀點之外，這也是確保指標發展之後，使用者願意去相信且使用的一項重要關鍵，特別是台灣多數的品質指標是由官方所發佈的，這些指標數據將必須要十分具有公信力，否則這些指標不被信任及使用，最後淪入政府與醫界各說各話的情況這也不會是社會大眾所樂見的壯況。 3. 審慎思考發展以機構為基礎之次級資料 (population-based) 或以臨床個案資料為基礎

(6)

(case-based)的指標：在台灣，現有的指標都是以機構為分析單位，不論是醫院自行提報的 TQIP、THIS或者是由中央健康保險局利用申報資料所建立的各種指標，但卻沒有輔以臨床個案資料為分析內容的指標系統。在本次所搜尋到的文獻，亦僅有Malin等人[13]的文章是發展以臨床個案資料為基礎的指標，其餘的指標都是以人口為基礎的指標。Eddy[14]認為發展以組織為基礎之次級資料指標將會有許多不易克服的限制，包含缺乏即時性(bluntness)、昂貴、資訊不完整、扭曲醫療行為等問題，如果改發展臨床個案資料為基礎的指標則可以獲得更多的臨床資訊、更可以了解病患就醫的實際狀況、鼓勵醫師遵從指引、可以減少醫療行為的扭曲、不需進行大規模資料庫分析等好處。由國際的趨勢可以知道，未來指標的應用將會是一大挑戰，因此指標的好壞是否能直接代表品質的良莠就相當重要，國外曾有研究 [15,16]證實了指標的執行會扭曲醫療行為進而帶來一些負面的未預期結果，這些未預期結果甚至有可能會影響到醫療品質。因此，發展以臨床個案資料為基礎的醫療品質指標似乎是一項可行的替代方案。

結

語

品質指標是當今最重要的品質管理工具，從本研究中可以發現在指標建立方法已經有高度的共識，台灣在指標的發展與應用較晚，如何利用國際的經驗來提昇自我的能力將是醫界與學界的當務之急。

建構醫療品質指標方法文獻之回顧