健保署只是「付錢的人」嗎?——當付費方式本身變成一種政策
從論量到論價值,拆解支付制度如何成為重塑醫療行為的誘因程式碼,並細究台灣總額預算下浮動點值的衝量賽局。
健保署只是「付錢的人」嗎?——當付費方式本身變成一種政策
你已經知道全民健保(National Health Insurance, NHI)把全民放進同一個風險池,知道資源配置要在效率與公平之間拉鋸。現在我們把鏡頭往內推一格,問一個入門篇刻意略過的問題:錢被收進池子之後,到底是「用什麼規則」流到醫院和醫師手上的?
這個問題遠比想像中關鍵。因為付費規則一旦訂下,它就不只是「結帳方式」,而是一套無聲的指令,告訴整個醫療體系「多做什麼會賺、多做什麼會虧」。同一群醫師、同一批病人、同一套臨床知識,在「論量計酬」與「論人計酬」兩種制度下,會做出系統性不同的醫療行為。換句話說,支付制度(payment system)就是寫進醫療體系骨子裡的誘因程式碼。衛生政策最精巧、也最容易出錯的工程,往往不在「給不給付」,而在「怎麼給付」。
這篇進階文章不再重述風險分攤與 QALY,而是直接走進這個「誘因設計」的引擎室:不同支付模式如何重塑提供者行為、台灣總額預算下「點值浮動」這個獨特機制藏了什麼賽局、為什麼幾乎所有先進國家都在從「論量」轉向「論價值」,以及流行病學與計量經濟學如何幫我們判斷這些改革到底有沒有效。

支付制度光譜:風險到底壓在誰身上?
理解所有支付模式,只要抓住一條主軸:財務風險(financial risk)被放在提供者那一端,還是付費者那一端? 把這條軸從一端拉到另一端,常見的制度可以排成一道光譜。
- 論量計酬(fee-for-service, FFS):做一項服務、付一項錢。風險幾乎全在付費者(健保)身上——病人用得愈多,健保付得愈多,醫院只要「多做」收入就增加。誘因方向:鼓勵增加服務量,潛在副作用是過度醫療(overtreatment)、重複檢查。
- 論病例計酬/診斷關聯群(diagnosis-related group, DRG):依「這次住院屬於哪一類疾病」給一個包裹定額,不論院方實際做了多少。風險開始往提供者移動——若花費超過定額,超出部分院方自行吸收。誘因方向:鼓勵在單次住院內節省成本、縮短住院天數,潛在副作用是提早出院(quicker-and-sicker)、把病人推給門診或下一次住院、以及「升碼(upcoding)」把病情編得更重以拿到較高給付。
- 論人計酬(capitation):依「負責照顧多少人」按人頭給固定金額,不論這些人實際看了幾次病。風險大幅壓向提供者——人照顧得好、少生病,結餘就留得住;照顧失當、併發症多,虧損自負。誘因方向:鼓勵預防、把人維持在健康狀態,潛在副作用是服務不足(undertreatment)、以及「挑病人(risk selection / cream-skimming)」——偏好收健康者、避開高風險者。
- 總額預算(global budget):先把某個部門(如全國西醫門診)一整年的總支出上限框死,所有提供者在這個天花板下分食。風險以集體方式壓給整個提供者群體。誘因方向:讓提供者群體有集體控制總量的壓力,但也埋下了「個別衝量、集體受害」的搭便車(free-riding)難題——這正是下一節要拆解的台灣案例。
請注意一個核心張力貫穿整條光譜:風險往提供者移,能抑制過度醫療、激勵效率,卻同時打開了服務不足與挑病人的後門;風險往付費者移,保障了病人取得服務,卻容易養出浪費。 沒有任何一種純粹模式能同時消滅這兩個方向的弊病。這就是為什麼真實世界的制度幾乎都是混合式(blended payment)——例如「總額預算為頂、論量計酬為裡、論質計酬為調味」,用多種模式互相牽制彼此的副作用。
台灣的獨門設計:總額預算 × 浮動點值的賽局
台灣健保自 2002 年起全面實施總額支付制度(global budget),搭配一套相當特殊的「浮動點值(floating point value)」機制。理解它,是看懂台灣衛生政策誘因結構的鑰匙,也是一個全球少見、值得細究的政策實驗。
機制大致是這樣:健保不直接用「新台幣」即時結算每一項服務,而是先把每項服務換算成「點數(points)」(例如某項處置 1000 點)。每一季、每個部門有一個被預先框定的總額(一塊固定大小的「餅」)。季末結算時,把這個總額除以該季全體提供者申報的總點數,得到「每點支付金額(point value)」。
關鍵就在這個除法。如果大家申報的總點數恰好等於預估,1 點就值 1 元;但若全體提供者這一季衝出了比預算更多的服務量,分母變大、每點價值就被稀釋到低於 1 元(例如 0.9 元、0.85 元)。也就是說,醫院做了 1000 點的服務,最後可能只拿到 850 元。
這套設計的巧妙之處,是把「控制總額」的責任從付費者轉嫁給整個提供者群體:餅就這麼大,誰都多搶,結果是大家分到的每一口都變薄。它在宏觀上確實有效地把醫療總支出綁進了可預測的軌道——這是總額預算最被稱道的優點。
但它也製造了一個經典的集體行動困境(collective action problem),本質上是一場「公地悲劇(tragedy of the commons)」:
- 對每一家醫院來說,理性策略是「盡量多做」——因為你少做,省下來的額度只會被別家瓜分,你的犧牲換不到自己的好處。
- 但當每一家都這樣想、一起衝量,總點數暴增、點值崩跌,所有人的單點收入都縮水。
- 於是醫院為了維持收入,只好在下一季做得更多來彌補點值的損失,形成「愈跌愈衝、愈衝愈跌」的量價螺旋。
這就是為什麼「總額管得住總錢、卻管不住總量,甚至可能刺激衝量」會是這套制度長年被討論的張力。它生動地示範了一個進階觀念:政策的宏觀目標(控制總支出)達成了,不代表它在微觀層次誘發的行為是健康的。 好的政策分析必須同時看「總量對不對」與「個別行為者被推往哪個方向」這兩層。
近年的改革方向(例如部門別總額再細分、設定保障點值、推動論質計酬與包裹支付試辦)某種程度上都是在回應這個誘因缺口——試圖在「集體控量」與「個別不要被逼著盲目衝量」之間找新的平衡。
從「論量」走向「論價值」:支付改革的世界趨勢
過去二十年,全球支付制度改革有一條清晰的主旋律:從「按服務量付費(volume)」轉向「按健康價值付費(value)」,學界稱為「論價值照護(value-based care)」。核心提問從「你做了多少?」變成「你讓病人健康得更好了嗎、有沒有避免本可避免的併發症與再住院?」
幾種代表性的工具:
- 論質計酬(pay-for-performance, P4P):在基本給付之上,依品質指標(如糖尿病患者的糖化血色素 HbA1c 控制達標率、照護流程完整度、病人結果)給予額外獎勵或扣減。台灣健保已在糖尿病、氣喘、思覺失調症等多項「論質方案」上採用。
- 包裹支付(bundled payment):把一段「照護事件」(如一次膝關節置換手術,從術前、手術、住院到術後復健的 90 天)整包定一個價,逼使原本各自為政的醫師、醫院、復健端為「同一個結果」共同負責、共享結餘也共擔風險。
- 責任照護組織(accountable care organization, ACO):讓一群提供者對「一整群病人在一段時間內的總費用與品質」共同負責,達標且省錢就分享結餘——這其實是把論人計酬的「健康人就賺」邏輯,疊上品質護欄後重新包裝。
但「論價值」絕非萬靈丹,它把一個極困難的技術問題推到了檯面正中央——風險校正(risk adjustment)。
設想:A 醫院專收年輕、單純的病人;B 醫院是醫學中心,收的是多重共病、高齡、社經弱勢的重症。若直接比較兩者的「再住院率」或「死亡率」,B 醫院幾乎注定數字難看——不是因為它做得差,而是因為它的病人本來就更難照顧。若獎懲制度不先把病人的疾病嚴重度與背景差異「調整」掉,論質計酬就會懲罰那些照顧最困難病人的提供者,反而逼出「挑病人(cream-skimming)」:大家爭相收輕症、推走重症弱勢,製造出新一輪、更隱蔽的健康不平等。這恰恰與全民健保「照顧最有需要者」的初衷背道而馳。風險校正做得好不好,因此不只是統計技術問題,更是攸關公平的政策命脈。
看一個例子:兩種制度下,一位糖尿病患者的命運
讓我們用一位虛構但典型的病人——65 歲、控制不佳的第二型糖尿病、合併輕度腎功能下降的陳女士——感受支付制度如何「無聲地」改變她得到的照護。
在純論量計酬(FFS)下:醫療提供者每次門診、每項檢驗、每次處置都能單獨計費。理性的收入策略傾向「讓她常回診、多做檢查」。陳女士可能被安排頻繁的回診與重複檢驗——其中部分確有臨床價值,部分則是制度誘因催生的量。沒有人特別有誘因去「整合」她散落在新陳代謝科、腎臟科、眼科之間的照護,因為「協調」這件事本身不產生計費點數。
在論人計酬/ACO 模式下:照護團隊按人頭領取固定預算,且要為陳女士「一整年的總費用與健康結果」負責。此時誘因翻轉了——若能透過個案管理師主動追蹤、衛教她規律用藥與飲食、把血糖穩住,就能避免一次代價高昂的酮酸中毒住院或洗腎進程,省下的錢成為團隊的結餘。於是「預防」「協調」「主動關懷」第一次有了財務上的理由。
但風險也隨之而來:若這個團隊的給付沒有經過妥善的風險校正,他們可能在收案時就暗暗傾向「別收陳女士這種棘手的」——因為她拉低團隊的平均成本與品質數字。這就是為什麼,任何把風險壓給提供者的制度,都必須同時建好風險校正與服務不足的監測護欄,否則良善的「省錢誘因」會異化成「拒收弱勢」的誘因。
這個對照清楚說明:陳女士接受了什麼樣的照護,不只取決於醫師的醫術與善意,更取決於她「身處哪一套支付制度的誘因場域」。這正是支付制度作為政策工具的威力與危險所在。
動手試試:用「誘因鏡片」拆解一則支付改革新聞
下次讀到「健保擬推動某某包裹支付」「某論質方案上路」「調整某部門總額」這類新聞時,試著套用這組進階提問:
- 這項改革把財務風險往哪一端移? 是更靠近提供者(鼓勵省錢、預防),還是更靠近付費者(保障服務量)?
- 它想抑制的舊弊病是什麼? 是過度醫療,還是服務不足,還是衝量螺旋?
- 它可能打開哪扇新後門? 抑制了過度醫療,會不會誘發挑病人或服務不足?有沒有配套監測?
- 有沒有風險校正? 制度如何避免懲罰那些照顧最重、最弱勢病人的提供者?
- 怎麼驗證它有效? 政府打算用什麼指標、什麼方法判斷改革「真的」改善了結果,而不只是改變了申報數字(例如升碼)?
當你能流暢地問出這五題,你看支付改革的眼光,就從「漲了還是砍了給付」升級為「這套誘因會把整個醫療體系推往哪個方向、又為誰留下了縫隙」。
重點回顧
- 支付制度是寫進醫療體系的誘因程式碼:同一群醫師在不同付費規則下會做出系統性不同的醫療行為;政策最精巧之處常在「怎麼給付」而非「給不給付」。
- 支付模式可排成一條「風險光譜」:論量計酬把風險留給付費者(易過度醫療),論人計酬/包裹支付把風險壓給提供者(易服務不足與挑病人),兩端各有對稱的副作用,真實制度多為混合式以互相牽制。
- 台灣總額預算+浮動點值是一場集體行動賽局:餅固定、衝量者稀釋全體點值,造就「愈跌愈衝」的公地悲劇——示範了「宏觀控住總額」不等於「微觀誘發健康行為」。
- 世界趨勢從論量走向論價值:P4P、包裹支付、ACO 把焦點從「做多少」轉向「結果好不好」,但成敗高度依賴風險校正,否則會懲罰照顧重症弱勢者、誘發更隱蔽的不平等。
- 驗證改革要看「行為」也要看「數字真偽」:申報量上升可能是真的多做,也可能只是升碼;嚴謹的政策評估必須能分辨二者。
深入探討(研究所視角)
走到研究所層次,支付制度設計是衛生經濟學、賽局理論與計量方法交會最密集的戰場之一,以下幾條線索值得長期深挖。
一、最適合約理論與「不完全契約」。 支付制度本質上是付費者(principal)對提供者(agent)的一紙合約,而醫療「品質」中有大量是無法被合約完整書寫、量測或驗證的維度(unverifiable quality)。經濟學的多任務代理理論(multitasking agency, Holmström & Milgrom)給了一個深刻警告:當你只獎勵「可被測量的那幾項指標」,理性的代理人會把心力從「重要但難測量的任務」(如安撫焦慮病人、整合性思考)抽走,投向「可測量的任務」(如把某個 KPI 數字做漂亮)。這正是 P4P 最被詬病的「指標導向治理(teaching to the metric)」與鑽營(gaming)問題的理論根源。理解這層,才知道為什麼「設計品質指標」是一門遠比列清單困難的學問。
二、風險校正的統計與公平政治學。 風險校正模型(如以年齡、性別、共病指標預測預期成本)做得不夠細,會懲罰收重症者的提供者;但做得「太細」也有反效果——若把社經弱勢、種族等因素也納入校正,等於默認「我們對弱勢病人本來就只期待較差的結果」,可能把既存的健康不平等固化進演算法裡。這是一個技術與規範纏繞的前沿議題:校正到什麼程度才算公平? 它與機器學習中的演算法公平性(algorithmic fairness)討論直接接軌,也是「精準公共衛生」治理必須面對的倫理難題。
三、政策評估如何排除「升碼」這個內生混淆。 評估支付改革時有一個惡名昭彰的陷阱:改革後「測得的疾病嚴重度上升」,究竟是病人真的變嚴重,還是提供者學會了升碼(upcoding)把同樣的病編得更重?這是一種因應制度而生的內生性(endogeneity)。嚴謹研究會借助準實驗設計(差異中之差異、合成控制法)並尋找不受編碼行為汙染的「硬結果」(如死亡率、客觀檢驗值、再住院率)來交叉驗證,避免被申報資料的「行為性失真」誤導。判讀一篇支付改革研究的品質,很大程度就是在檢視它如何處理這個內生性。
四、宏觀控費與微觀品質的長期張力。 總額預算之類的硬性支出天花板,在跨國比較中確實是控制醫療費用成長最有效的工具之一;但它的代價可能以不易被即時觀測的形式出現——排隊變長、隱性的服務縮水、提供者過勞與醫療人力出走。如何在「財務永續」與「照護品質及可近性」之間動態校準,並建立能即時偵測品質滑落的監測系統,是高齡化社會中每個採用全民健保國家的共同長期課題。
最後留給學習者一個值得反覆咀嚼的問題:當我們設計任何一套支付規則,本質上都是在「我們有能力測量的東西」與「我們真正在乎的東西」之間打一個未必對齊的賭。前者是成本、服務量、幾個可量化的品質指標;後者是病人真正的康復、尊嚴與長期福祉。一套成熟的衛生政策,不是天真地相信指標等於價值,而是時時警覺兩者的落差,並保留用證據、審議與制度演化去縮小這道落差的能力與謙卑。