當製程「平均合格」卻還是不斷出包：你需要看懂變異的數學

深入統計製程管制（SPC）、製程能力指標 Cp/Cpk 與田口損失函數，看懂如何用統計把品質從「事後檢驗」推回「事前設計」。

進階 · 約 15 分鐘 ·#品質管理#統計製程管制#製程能力#田口方法#六標準差#穩健設計

當製程「平均合格」卻還是不斷出包：你需要看懂變異的數學

入門篇留下一個沒講完的關鍵句：六標準差的核心哲學是「變異是品質的敵人」。但這句話如果只停在口號，幾乎沒有操作意義。真正的問題是——變異到底長什麼樣子？我們怎麼知道一個製程是「穩定地有點問題」還是「偶爾爆走」？又該如何用一個數字告訴老闆「這條產線到底夠不夠格接這張訂單」？

想像一個情境。某 CNC 加工廠生產一批軸承，規格要求外徑落在 10.00 ± 0.05 公釐之間。品保抽檢一週，算出平均外徑剛好是 10.00，完美命中中心值。主管鬆了一口氣：「平均對準了，沒問題。」結果出貨後客戶端組裝線卻不斷反映卡死，退貨率高達 3%。平均明明完美，為什麼還是大量不良？

答案是：平均（mean）只告訴你「準不準」，卻完全沒告訴你「穩不穩」。 這條產線的平均對準了中心，但每一件的外徑像撒網一樣散得很開——有的 9.94、有的 10.07，正負兩端都在飛出規格界限之外。互相抵消之後，平均看起來無懈可擊，實際品質卻一塌糊塗。這篇進階文章要帶你深入入門篇一筆帶過的統計引擎：統計製程管制（SPC）、製程能力指標（Cp / Cpk），以及把品質從「事後檢驗」往「事前設計」推的田口損失函數與穩健設計。

品質管理進階概念示意圖

共同原因 vs. 特殊原因：戴明變異理論的分水嶺

要看懂 SPC，得先掌握戴明（W. Edwards Deming）變異理論中最重要、卻最常被誤用的一組概念——共同原因變異（common cause variation）與特殊原因變異（special cause variation）。

共同原因變異是系統「天生」的雜訊。機台本身的微小震動、原料批次間的細微差異、環境溫濕度的自然波動，這些因素永遠存在、無法完全消除，只能透過重新設計系統來縮小。一個只有共同原因在作用的製程，我們稱它「在管制中」（in control）或「統計穩定」——它依然會變動，但變動是可預測的。
特殊原因變異則是「外來的入侵者」。某把刀具突然崩裂、某位新手裝錯夾治具、某批原料供應商偷換規格。這類原因不是系統的常態，它會讓製程突然偏離原本可預測的軌道。

為什麼這個區分如此關鍵？因為對這兩種變異採取錯誤的反應，會讓品質變得更糟，而不是更好。戴明用一個著名的實驗「漏斗實驗」（funnel experiment）說明：如果你看到製程只是因為共同原因而正常波動，卻每次都急著去「調整」機台想把它拉回中心，你的調整本身會引入新的變異，使輸出的散布反而擴大。戴明把這種「對雜訊過度反應」稱為干預（tampering），是管理上極常見的錯誤。

反過來，如果出現的是特殊原因（例如刀具崩裂），你卻把它當成「正常波動，再觀察看看」，那不良品就會源源不絕地產出。

所以管理者真正需要的，是一個能客觀區分「這只是雜訊」還是「真的出事了」的工具。這個工具就是管制圖。

管制圖：給製程裝上心電圖

統計製程管制（Statistical Process Control, SPC）的核心工具是管制圖（control chart），由貝爾實驗室的休哈特（Walter Shewhart）在 1920 年代發明，可以說是整個現代品管統計的源頭。

管制圖的概念出奇地優雅。它在時間軸上連續記錄製程的量測值，並畫出三條線：

中心線（CL）：製程的平均水準。
管制上限（UCL）與管制下限（LCL）：通常設在平均值上下三個標準差（±3σ）的位置。

這裡有一個初學者最容易混淆的致命陷阱：管制界限（control limits）不等於規格界限（specification limits）。

規格界限來自顧客或工程圖面——「外徑必須在 10.00 ± 0.05」是顧客的要求。
管制界限來自製程自己的歷史數據——它描述「這個製程在穩定狀態下，實際上會自然波動到什麼範圍」。

兩者完全是不同來源、不同意義的東西。管制圖回答的不是「合不合格」，而是「這個製程還是不是它原本的樣子」。

為什麼是 ±3σ？因為若數據近似常態分布，落在 ±3σ 之外的機率只有約 0.27%（即一千次中約 2.7 次）。所以當一個點突然跑出管制界限，比起「碰巧的極端雜訊」，更合理的解釋是「系統真的變了」——很可能有特殊原因入侵。除了單點出界，實務上還會搭配「西電規則」（Western Electric Rules）等判讀法則，例如「連續七點都在中心線同一側」「連續六點持續上升」也視為製程失控的訊號——因為這些型態用純機率很難自然發生。

關鍵的管理意涵是：管制圖讓你把『要不要採取行動』這件事，從主觀直覺變成有統計依據的決策。 點在界限內隨機跳動 → 別動它（那是共同原因，亂調就是 tampering）；點出界或出現異常型態 → 立刻追查特殊原因。

看一個例子

延續開頭那家 CNC 廠。品保主管導入 X̄-R 管制圖（平均值圖搭配全距圖），每小時抽 5 件量外徑，把那一組的平均畫在 X̄ 圖、把組內最大減最小的全距畫在 R 圖。

第一天的圖看起來點都在界限內隨機跳動，代表製程穩定。到了第三天下午三點，R 圖突然有一點衝破 UCL——組內全距暴增，表示那一組件裡的尺寸忽大忽小。主管沒有去動機台的歸零設定（那會是 tampering），而是按管制圖的訊號去追查特殊原因，發現是該時段換上的一把刀具已經磨損、切削時開始彈跳。換刀後，R 圖立刻回到界限內。

如果沒有管制圖，這個問題只會在一週後以「客戶端卡死、退貨 3%」的形式爆發。管制圖的價值，就是把問題從「外部失敗成本」（最貴的那一類）往前攔截到「內部、即時」的層級。

製程能力：用一個數字回答「我夠格嗎」

管制圖告訴你製程「穩不穩」，但還有另一個獨立的問題：就算製程很穩定，它的自然散布塞不塞得進顧客的規格範圍？這就是製程能力（process capability）要回答的，而它最常用的指標是 Cp 與 Cpk。

Cp（製程潛在能力）衡量的是「規格寬度」相對於「製程自然散布寬度」的比值：

Cp = (USL − LSL) / (6σ)

分子是規格容許的總寬度（上規格界限減下規格界限），分母是製程的自然散布（±3σ 共 6σ）。直覺理解：Cp 就是在問「顧客給我的籃框，比我投籃時球的散布範圍大幾倍」。Cp = 1 代表製程散布剛好塞滿規格、毫無餘裕；Cp = 2 代表規格寬度是製程散布的兩倍，餘裕充足——而 Cp = 2 正好對應六標準差水準。

但 Cp 有個致命盲點：它只看散布寬度，完全不管製程有沒有對準中心。回到開頭那個「平均完美卻大量不良」如果反過來——一個散布很窄、Cp 很漂亮、但整個偏到規格一側的製程，Cp 依然會給你高分，掩蓋了實際大量出界的事實。

於是有了 Cpk（製程實際能力），它同時考慮散布與偏移：

Cpk = min[ (USL − μ) / 3σ , (μ − LSL) / 3σ ]

它分別算「平均值到上限的距離」與「平均值到下限的距離」各佔幾個 3σ，取較小的那一邊。哪一邊離得近、風險高，Cpk 就反映哪一邊。

兩者的關係極具洞察力：

Cp = Cpk → 製程完美置中。
Cpk < Cp → 製程有偏移，差距越大偏得越離譜。
Cpk < 1 → 即使製程穩定，自然散布也已經超出規格，必然產出一定比例的不良。

所以實務驗收常同時看兩個：Cp 告訴你「潛力夠不夠」（散布夠不夠窄），Cpk 告訴你「現在做得好不好」（有沒有對準）。一個 Cp 高但 Cpk 低的製程，好消息是只要把平均值校回中心就能立刻大幅改善，不必砸錢換設備。

補充一個常被混淆的細節：Cp/Cpk 用的是製程「在管制中」的短期組內變異，反映潛在能力；另有 Pp/Ppk 用涵蓋長期、跨班次的整體變異，反映實際長期表現。兩者的落差，本身就是製程穩定度的診斷線索。

動手試試

假設規格是 10.00 ± 0.05，即 LSL = 9.95、USL = 10.05，規格寬度 0.10。

情境 A：製程平均 μ = 10.00，標準差 σ = 0.01。 - Cp = 0.10 / (6 × 0.01) = 0.10 / 0.06 ≈ 1.67 - Cpk = min[(10.05−10.00)/0.03 , (10.00−9.95)/0.03] = min[1.67, 1.67] = 1.67 - Cp = Cpk，完美置中，能力良好。

情境 B：散布一樣（σ = 0.01），但平均偏掉了，μ = 10.03。 - Cp 不變，仍是 1.67（散布沒變）。 - Cpk = min[(10.05−10.03)/0.03 , (10.03−9.95)/0.03] = min[0.67, 2.67] = 0.67

看出威力了嗎？同樣一條產線，散布完全沒變，光是平均偏移了 0.03，Cpk 就從 1.67 崩到 0.67——遠低於 1。如果只看 Cp，你會以為製程很健康；唯有 Cpk 揭穿了「它正大量產出上限外的不良」。這就是為什麼採購驗收條款幾乎都指定 Cpk ≥ 1.33（業界常見門檻）而非只看 Cp，並要求附管制圖證明製程確實在管制中——因為一個失控的製程，算出來的 Cpk 在統計上根本沒有意義。

從「壓低不良率」到「逼近目標值」：田口的損失函數

到這裡你可能會發現，前面整套思維仍隱含一個傳統假設：只要落在規格界限內，就一律算「好品質」，落在界限外才是「壞」。這是一種「合格／不合格」的二元門檻觀。

日本品質工程大師田口玄一（Genichi Taguchi）對這個假設提出了革命性的挑戰。他主張：品質損失並不是在跨越規格界限那一瞬間才從零跳到滿，而是只要偏離目標值，損失就連續地、漸進地產生了。 一個剛好壓在規格界限內側（9.951）的零件，和一個落在正中心（10.000）的零件，在傳統觀念裡都「合格」，但田口認為前者的潛在損失明顯較高——它離理想值更遠，組裝時與其他零件累積公差後更容易出問題、壽命也可能更短。

田口用一條二次損失函數（quadratic loss function）來描述這件事：

L(y) = k × (y − T)²

其中 y 是實際量測值、T 是目標值、k 是損失係數。這條拋物線的意義是：偏離目標越遠，損失以平方的速度急遽放大；只有命中目標值 T，損失才為零。

這個觀念翻轉了品質改善的目標函數。傳統作法是「降低不良率」——把出界的比例壓下去就好；田口的作法是「降低變異，讓每一件都盡量貼近目標值」——即使它們本來就全部合格。換句話說，田口把品質追求從「不要出界」升級成「向中心靠攏」，這與六標準差「打擊變異」的精神高度一致，但提供了更強的經濟學論證：規格界限內的變異不是免費的，它有實實在在的、可貨幣化的社會損失。

田口最深刻的貢獻其實在設計端——穩健設計（robust design）。他區分了兩種影響輸出的因子：控制因子（我們設計時能決定的參數，如材料配方、製程溫度設定）與雜訊因子（使用時無法控制的干擾，如環境濕度、使用者操作習慣、零件老化）。傳統思維想盡辦法去「消除雜訊」，但雜訊往往昂貴或根本無法消除。田口的洞見是：與其燒錢消除雜訊，不如透過實驗設計（DOE）找出一組控制因子的最佳組合，讓產品『對雜訊變得不敏感』。

舉例來說，與其要求所有顧客都在恆溫環境使用產品（消除雜訊，幾乎不可能），不如在設計階段就找出一種電路參數組合，使產品在 0°C 到 40°C 都能穩定運作（對溫度雜訊不敏感）。這種「讓品質在源頭就被設計進去（design quality in），而不是在末端被檢驗出來（inspect quality out）」的思想，正是現代「設計六標準差」（Design for Six Sigma, DFSS）與品質機能展開（QFD）的精神基礎，也把品質管理的戰場，從入門篇談的生產線、向前推到了產品還在圖紙上的研發階段。

重點回顧

平均值只說「準不準」，標準差才說「穩不穩」。一個平均完美但散布過大的製程，照樣大量出不良；品質的真正敵人是變異。
管制圖的核心是區分共同原因與特殊原因。對共同原因（雜訊）亂調整叫 tampering，會放大變異；對特殊原因視而不見則讓不良源源不絕。管制界限源自製程歷史，不等於顧客的規格界限。
Cp 看潛力（散布夠不夠窄），Cpk 看實際（有沒有對準中心）。Cp 與 Cpk 的落差揭露製程偏移；驗收常要求 Cpk ≥ 1.33，且必須建立在製程在管制中的前提上。
田口損失函數主張：偏離目標即有損失，且以平方放大。品質目標應從「壓低不良率」升級為「向目標值靠攏、降低變異」。
穩健設計把品質前移到研發端：與其昂貴地消除雜訊，不如設計出對雜訊不敏感的產品（design quality in），這是 DFSS 與 QFD 的思想根基。

深入探討（研究所視角）

對於想再往前一步的讀者，本文觸及的統計與工程方法背後，還有幾個值得深究的張力與前沿。

第一，「1.5 倍 sigma 偏移」的爭議。 六標準差宣稱 6σ 水準對應 3.4 DPMO，但純統計上 ±6σ 的出界機率其實只有十億分之二，遠低於 3.4 ppm。3.4 這個數字其實內建了一個「製程長期會偏移 1.5σ」的經驗假設——摩托羅拉觀察到製程的平均值會隨時間漂移約 1.5 個標準差，於是把短期能力打了折扣。這個 1.5σ shift 在學界一直有爭議：它是否普適？對所有製程都該套同一個值嗎？這正好呼應本文 Cp/Cpk（短期）與 Pp/Ppk（長期）的區別，是測量哲學上很有意思的辯論起點。

第二，常態分布假設的脆弱性。 管制界限的 ±3σ 機率、製程能力指標的不良率換算，幾乎都預設輸出服從常態分布。但真實製程的數據常是偏態的（如同心度、表面粗糙度這類有物理下限為零的量測），此時直接套用常態公式會嚴重誤判能力。如何處理非常態資料——是做數據轉換（如 Box-Cox）、改用非參數方法、還是採用 Clements 法估計能力指標——是統計品管研究中持續發展的領域。

第三，SPC 在高頻、高維度資料下的當代轉型。 傳統休哈特管制圖為「人工、低頻抽樣」的時代設計，一次盯一個品質特性。但在 Industry 4.0 情境下，一台機台每秒可能吐出數百個感測器讀數、彼此高度相關。此時單變量管制圖會失效（多重比較會頻繁誤報），於是發展出多變量管制圖（如 Hotelling T² 管制圖）與結合機器學習的異常偵測。品質管理與資料科學、預測性維護（predictive maintenance）的交會，正是當前最活躍的研究前沿之一——SPC 的「區分訊號與雜訊」核心問題沒變，但工具正在從統計學擴張到機器學習。

延伸閱讀方向：可深入研讀休哈特原著中「統計管制狀態」（state of statistical control）的哲學定義、田口方法中「訊噪比」（S/N ratio）與正交表（orthogonal array）的實驗設計細節、量測系統分析（MSA）中的 Gage R&R 如何拆解量測誤差，以及製程能力分析在非常態與小樣本情境下的修正方法。這些都是把「變異是品質的敵人」這句口號，真正轉化為可操作之科學的關鍵環節。

← 上一篇

為什麼一條生產線上，「差不多就好」會讓公司付出昂貴代價

--

3

32.3%

140.05

82.02%

62,201

AI 回覆桌面通知

聊天訊息通知

聲音通知

更多設定

當製程「平均合格」卻還是不斷出包：你需要看懂變異的數學