一位反覆腹痛的學生，究竟卡在哪一步？

從病史、理學檢查到鑑別診斷，拆解臨床醫師如何在不確定中以貝氏思維逐步逼近正確答案。

大學基礎 · 約 13 分鐘 ·#診斷學#病史詢問#理學檢查#鑑別診斷#臨床推理#認知偏誤

一位反覆腹痛的學生，究竟卡在哪一步？

一位 20 歲的女學生走進診間，主訴「右下腹痛兩天」。年輕的實習醫師立刻在心裡想到「會不會是急性闌尾炎（acute appendicitis）」，於是直接安排電腦斷層（CT）。資深主治醫師卻先坐下來，問了一連串看似瑣碎的問題：痛是怎麼開始的？有沒有移動位置？最後一次月經是什麼時候？接著用手在腹部不同位置輕壓、深按、放手。十分鐘後，他在病歷上寫下三個可能：闌尾炎、卵巢扭轉（ovarian torsion）、異位妊娠（ectopic pregnancy），並決定先驗一管尿。

這兩位醫師的差別，不在於誰懂得多，而在於診斷的順序與邏輯。診斷學（diagnostics）正是這門「如何從一團混亂的線索，逐步逼近正確答案」的學問。它的核心不是某一台昂貴的儀器，而是病史（history）、理學檢查（physical examination）與鑑別診斷（differential diagnosis）三者環環相扣的推理過程。本文不提供個人醫療建議，而是帶你理解臨床推理背後的機制與思維。

診斷學概念示意圖

病史：被低估的最強診斷工具

醫學教育裡有一句被引用到爛、但屢試不爽的話：「好好聽病人說話，他會把診斷告訴你（Listen to the patient, he is telling you the diagnosis）」。這句話最早被歸於 William Osler。多項實證研究支持它的份量：在內科門診情境中，單靠病史就能正確指向診斷的比例約達七到八成，理學檢查再貢獻約一成，剩下才靠檢驗與影像收尾。換言之，最昂貴的 CT 往往只是「確認」，而非「發現」。

病史的力量來自它的結構化詢問。臨床上常用 OPQRST 或 SOCRATES 等記憶框架來剖析一個症狀，以胸痛為例：

發作（Onset）：突然或漸進？運動時或休息時？
誘發／緩解（Provocation/Palliation）：什麼讓它變好或變壞？
性質（Quality）：壓迫感、撕裂感、燒灼感？
位置與放射（Region/Radiation）：是否傳到左臂或下巴？
嚴重度（Severity）：0 到 10 分？
時間（Timing）：持續多久、頻率如何？

一個「突發、撕裂般、放射到背部」的胸痛，會把主動脈剝離（aortic dissection）推到鑑別診斷前段；而「運動時壓迫感、休息緩解」則高度指向穩定型心絞痛（stable angina）。這些區分，完全發生在儀器介入之前。

病史也包含容易被新手忽略的維度：過去病史（past medical history）、用藥史、家族史、社會史（職業、菸酒、旅遊、性行為）。一位「發燒加頭痛」的病人，若補上「兩週前曾到東南亞」，瘧疾（malaria）與登革熱（dengue）的機率就大幅上升。沒問到的病史，等於沒存在的線索。

理學檢查：用感官把假設量化

理學檢查是醫師用視（inspection）、觸（palpation）、叩（percussion）、聽（auscultation）四種基本手法，把病史中浮現的假設加以驗證或排除。它的價值不在於取代影像，而在於即時、低成本、可重複地調整你對各個診斷的機率。

理解理學檢查的關鍵概念是檢查結果如何改變機率。每個檢查徵象（sign）都有它的敏感度（sensitivity）與特異度（specificity）：

高敏感度的檢查若為陰性，有助於排除疾病（記憶法：SnNout，Sensitive test, Negative, rules out）。
高特異度的檢查若為陽性，有助於確認疾病（記憶法：SpPin，Specific test, Positive, rules in）。

舉例來說，闌尾炎的 Rovsing 徵象（壓左下腹卻引起右下腹痛）特異度較高，一旦陽性，會明顯把闌尾炎往「確認」方向推；而腹部柔軟、完全無壓痛這種高敏感的「正常」表現若成立，則讓嚴重腹腔內病灶的可能性下降。

看一個例子：似然比如何更新機率

假設一位中年男性主訴呼吸困難，你懷疑心衰竭（heart failure）。臨床上「頸靜脈怒張（jugular venous distension, JVD）」這個徵象的陽性似然比（positive likelihood ratio, LR+）約為 5。

我們用機率更新的概念來看它的威力。假設根據病史，你估計這位病人有心衰竭的「前測機率（pre-test probability）約 30%」。用勝算（odds）來算最直觀：

前測勝算 = 30 ÷ 70 ≈ 0.43
後測勝算 = 前測勝算 × LR+ = 0.43 × 5 ≈ 2.15
後測機率 = 2.15 ÷ (1 + 2.15) ≈ 68%

一個床邊、零成本、三秒鐘的觀察，就把心衰竭的機率從 30% 推升到近 70%。這就是為什麼資深醫師願意花時間做理學檢查——它不是儀式，而是一次次貝氏更新（Bayesian updating）。反過來，若 JVD 陰性（其陰性似然比約 0.66），機率只小幅下降，提醒我們：JVD 適合「確認」，不適合單獨「排除」。

鑑別診斷：在不確定中安全地推進

鑑別診斷（differential diagnosis）是把所有「可能解釋病人表現」的疾病列成清單，並依機率與危險性排序，再用後續檢查逐一篩選的過程。它的精神不是「猜對唯一答案」，而是有系統地不漏掉致命的可能。

臨床上有兩條互補的排序軸：

最可能（most likely）：依流行病學與當下證據，哪個診斷機率最高？
最不能漏（must not miss）：哪些診斷雖然少見，但漏掉會致命？

以「年輕女性右下腹痛」為例，最可能的或許是闌尾炎或經痛，但異位妊娠屬於「漏掉會致命」，所以無論機率高低，驗孕都是不可省略的一步。這正是開頭那位主治醫師「先驗尿」的邏輯。

建構鑑別清單時，臨床醫師常用解剖或系統性的記憶框架避免遺漏，例如 VINDICATE（Vascular 血管、Infection 感染、Neoplasm 腫瘤、Degenerative 退化、Iatrogenic 醫源性、Congenital 先天、Autoimmune 自體免疫、Trauma 外傷、Endocrine 內分泌等）。框架的用途不是死背，而是強迫思考自己可能忽略的類別。

動手試試：替「急性頭痛」排出鑑別

試著為一位「突發、此生最劇烈頭痛（thunderclap headache）」的病人列鑑別，並標出哪些屬於「不能漏」：

蜘蛛膜下腔出血（subarachnoid hemorrhage）——不能漏，需立即影像與必要時腰椎穿刺。
腦膜炎（meningitis）——不能漏，留意發燒與頸部僵硬。
腦靜脈竇血栓（cerebral venous sinus thrombosis）——不能漏，尤其有口服避孕藥或凝血傾向者。
偏頭痛（migraine）——常見，但屬「排除其他危險後」才安心給的診斷。

你會發現：「突發、最劇烈」這兩個病史詞彙，已經把致命診斷往前推。病史定方向，檢查與影像收網——這就是診斷三件套協作的縮影。

認知偏誤：診斷出錯，常敗在思考而非知識

研究顯示，臨床診斷錯誤多數源自認知偏誤（cognitive bias），而非單純知識不足。醫學決策可粗分為兩種模式（雙歷程理論，dual-process theory）：

System 1（直覺、快速）：靠經驗一眼辨認模式（pattern recognition），效率高但易受偏誤。
System 2（分析、緩慢）：逐項推理、查核，準確但耗時。

常見的偏誤包括：

錨定效應（anchoring）：抓住第一個印象不放，忽略後來矛盾的線索。
確認偏誤（confirmation bias）：只看支持自己假設的證據。
早閉效應（premature closure）：太早停止思考，「找到一個解釋就收工」。
可得性偏誤（availability bias）：最近遇過的病例特別容易被想到。

對抗之道是刻意的後設認知（metacognition）：在下結論前自問「如果不是這個，還會是什麼？」（diagnostic time-out）。這也是鑑別診斷的深層價值——它本質上是一套強迫 System 2 介入、避免早閉的紀律。

重點回顧

病史是最強的診斷工具：約七到八成的診斷方向在問診階段就已確立；結構化框架（OPQRST、SOCRATES）能讓線索無所遁形。
理學檢查是床邊的貝氏更新：每個徵象透過敏感度／特異度與似然比，即時改變各診斷的機率（SnNout 排除、SpPin 確認）。
鑑別診斷有兩條排序軸：「最可能」與「最不能漏」並重，致命診斷無論機率高低都要主動排除（如腹痛先驗孕）。
診斷三件套是接力：病史定方向、理學檢查調機率、檢驗影像收網，昂貴儀器多半是「確認」而非「發現」。
多數診斷錯誤敗在思考：認知偏誤（錨定、確認、早閉）比知識不足更危險，刻意的鑑別與診斷暫停能對抗早閉。

深入探討（研究所視角）

從研究所層級看，診斷推理可被形式化為一個機率推論問題。貝氏定理 P(D|S) ∝ P(S|D)·P(D) 描述了臨床醫師如何由症狀 S 更新疾病 D 的後測機率；理學檢查中的似然比（LR = sensitivity / (1 − specificity) 為 LR+）正是貝氏更新中的概似比項。一個成熟臨床醫師的養成，某種意義上是讓大腦內隱地校準上千個徵象的似然比與疾病盛行率（base rate），這也解釋了為何忽略盛行率（base-rate neglect）會系統性地導致過度診斷罕見病。

測試閾值理論（threshold approach to diagnosis）進一步把診斷與決策連起來：對任一疾病，存在「檢驗閾值」與「治療閾值」。當後測機率低於檢驗閾值，不必再驗、可安心排除；高於治療閾值，則不必再驗、直接治療；只有落在兩者之間的「灰區」才值得做下一個檢查。這把「要不要再做檢查」從直覺變成可量化的決策——檢查的價值取決於它能否把機率推過某個行動閾值，而非檢查本身有多精密。

在跨領域連結上，當代診斷的計算化正快速演進。臨床決策支援系統與機器學習模型嘗試從電子病歷與影像中輔助鑑別，但它們暴露出與人類醫師相同、甚至更隱蔽的弱點：訓練資料的盛行率偏移（dataset shift）會使模型的「隱含先驗」在新族群中失準，正如人類的可得性偏誤。校準（calibration）——模型輸出的機率是否反映真實頻率——因此成為醫療 AI 的核心評估指標，與臨床醫師的機率校準異曲同工。

最後值得深思的是診斷的時間維度。許多疾病在早期是「未分化（undifferentiated）」的，症狀尚未成形，任何單次橫斷面的檢查都無法定論。此時最有力的診斷工具往往是時間本身——安排回診、追蹤症狀演變（watchful waiting）。這提醒我們：診斷不是某個時間點的判決，而是一個隨證據累積而持續更新的動態歷程。理解這一點，才算真正掌握了診斷學的精神：在永遠不完整的資訊下，做出當下最安全、最合理、且願意隨新證據修正的判斷。

（本文為醫學教育性質之知識讀本，旨在說明臨床推理之原理，不構成任何個人診斷或醫療建議。身體不適請諮詢合格醫療專業人員。）

為什麼一個 99% 準確的檢驗，陽性時卻可能八成是假的？

--

4

32.3%

140.05

82.02%

62,201

AI 回覆桌面通知

聊天訊息通知

聲音通知

更多設定

一位反覆腹痛的學生，究竟卡在哪一步？