如果偏見「看不見」,社會學家怎麼證明它存在?
從 Oaxaca-Blinder 薪資分解、履歷對應實驗,到停滯的性別革命、男性氣概的代價與照顧經濟學,看社會學如何把「看不見的歧視」變成可測量、可做因果推論的科學對象。
如果偏見「看不見」,社會學家怎麼證明它存在?
假設有人對你說:「台灣的兩性薪資差距,是因為女生比較常選低薪科系、比較常因為家庭中斷職涯,這是個人選擇,不是歧視。」這句話聽起來很有道理,卻也讓人隱隱不安——它把所有差距都歸給「選擇」,彷彿背後沒有任何結構性的不公。
問題是:你要怎麼反駁這句話?光說「我覺得有歧視」沒有用,對方也可以說「我覺得沒有」。社會學作為一門經驗科學,必須拿出可被檢驗的證據。於是真正的進階問題浮現了:當歧視從不寫在公告上、雇主嘴上都說「我們很重視性別平等」時,研究者如何把「看不見的偏見」變成可以測量、可以推估、甚至可以做因果推論的對象?這篇文章要帶你走進性別不平等研究的「方法引擎室」,看社會學家如何把一個道德直覺,轉化成站得住腳的科學論證。

第一個難題:把薪資差距「拆開」——Oaxaca-Blinder 分解
入門篇提過「同工不同酬」,但「同工」兩個字其實藏著巨大的技術挑戰。男女的平均薪資差距,一部分來自雙方在可觀察特徵(observable characteristics)上的差異:教育程度、年資、職業、工時。如果女性平均年資較短,薪資較低本來就不奇怪。要談「歧視」,必須先把這些合理差異扣掉,看看剩下多少無法解釋。
經濟社會學最常用的工具是 Oaxaca-Blinder 分解法(Oaxaca-Blinder decomposition)。它的核心邏輯可以用一個直覺式的拆解來理解。假設男性平均月薪為 $\bar{W}_m$、女性為 $\bar{W}_f$,研究者先分別跑男、女兩條薪資迴歸,得到「每一單位特徵能換多少薪水」的報酬率(係數)。接著把總差距拆成兩塊:
- 稟賦效果(endowment effect / explained):因為男女在特徵(如年資、職業)上不同所造成的差距。直白說,就是「如果女性擁有和男性一樣的條件,差距會縮小多少」。
- 係數效果(coefficient effect / unexplained):在特徵完全相同的情況下,同一份條件對女性換到的薪水卻比較少的部分。這一塊無法被可觀察特徵解釋,常被審慎地視為「歧視的上界估計」。
關鍵在於最後這個「無法解釋的部分」。研究反覆發現,即使控制了一長串變項,仍有一段差距頑強地留下來。台灣勞動部歷年公布的兩性薪資差距,以及主計總處的受僱員工薪資調查,都可以做類似拆解,結果通常是:教育與年資的差距已大幅縮小,真正難纏的是「職業隔離」與那塊「無法解釋」的殘差。
但這裡有一個必須誠實面對的方法論陷阱:「無法解釋」不完全等於「歧視」。它也可能藏著研究者沒測到的變項(如協商風格、職涯偏好)。反過來,它也可能低估歧視——因為「職業選擇」本身可能就是歧視的產物(女孩從小被勸退理工科)。把這種「上游的歧視」算進「已解釋」那一欄,反而會讓歧視看起來變小。這正是進階研究者要小心的地方:分解法很強大,但它回答的是「會計問題」,不是「因果問題」。
第二個難題:要做因果推論,得讓「履歷」打架——對應實驗
既然觀察資料的迴歸分解無法乾淨地證明因果,社會學家想出一個更巧妙的設計:對應研究(correspondence study),也叫履歷審查實驗(résumé audit study)。它的精神是——把其他條件全部控制成一模一樣,只改變性別,然後看雇主反應。
具體做法是:研究者製作兩份內容幾乎完全相同的假履歷,學歷、經歷、技能全部對等,唯一系統性不同的,是名字所暗示的性別(或在某些研究中是族裔)。把這兩份履歷大量投遞給真實的招募職缺,再統計哪一份拿到更多「回電面試」的機會。因為兩份履歷的差異只剩性別這一個變項,所以回覆率的差距,就可以被解讀為性別本身造成的因果效果——這是觀察資料做不到的。
國際上著名的研究(如針對科學實驗室招募的隨機化履歷實驗)發現,當履歷上的名字從女性換成男性、其餘完全不變時,被評為「能力較強、值得錄用、願意給較高起薪」的比例顯著上升。更耐人尋味的是,男性與女性評審者都展現了這種偏好——這說明偏見不是「壞男人」的個人惡意,而是一套被所有人內化的隱性刻板印象(implicit bias)。這個發現直接呼應入門篇講的:不平等是結構性的,不需要任何人「故意」。
動手試試:設計一個你自己的對應實驗
不妨自己當一次研究者。假設你想檢驗台灣的服務業是否對「已婚育齡女性」有招募偏見,請試著回答以下設計問題:
- 你要操弄什麼變項? 例如在履歷上加一欄不起眼的資訊:一份寫「已婚、育有一名兩歲幼兒」,另一份寫「已婚」但不提小孩,其餘完全相同。這就是你的實驗操弄(manipulation)。
- 你要控制什麼? 兩份履歷的照片、字體、用詞、經歷長度都必須一致,否則回覆率的差異可能來自別的因素,而非你想測的「母職訊號」。
- 你的依變項(outcome)是什麼? 最乾淨的是「是否收到面試邀請」這種雇主無法事後否認的客觀行為,而不是問卷上的態度自陳(雇主嘴上多半都說自己沒偏見)。
- 倫理上要注意什麼? 投假履歷會佔用真實雇主的時間、若進到面試還可能浪費資源,因此這類研究在台灣須經 IRB(研究倫理審查)核可,並通常在收到回覆後立即婉拒,把對招募流程的干擾降到最低。
走過這四步,你會發現:一個看似簡單的「有沒有歧視」問題,背後需要極縝密的因果設計。這正是社會科學方法訓練的價值——它教你把模糊的指控,變成可被反駁、也可被驗證的命題。
第三個難題:為什麼進步「卡住了」——停滯的性別革命
把鏡頭從個別雇主拉回整個社會的長期趨勢,會看到一個令人困惑的現象。二十世紀後半,女性大量進入職場、教育程度甚至超越男性,性別態度也明顯自由化——這常被稱為性別革命(gender revolution)。但社會學家英格蘭(Paula England)等人指出,這場革命在進入二十一世紀後出現了停滯(the stalled / unfinished revolution):女性勞動參與率不再快速上升、職業隔離縮小的速度放慢、家務分工的改變遠慢於職場的改變。
為什麼會卡住?一個核心的解釋是「不對稱的變遷」。社會鼓勵女性「向上」進入原本由男性主導的高薪領域(女性當醫師、工程師被視為進步、被讚許),卻很少鼓勵男性「向下」進入女性主導的照顧領域(男性當護理師、幼教老師、全職奶爸,仍常被質疑)。因為「女性化」的工作被社會貶值,男性跨越性別界線等於是「自降身價」,缺乏誘因。結果是隔離只從一邊鬆動,整體仍卡住。
另一個機制是「文化滯後」:制度(法律、職場)的改變快,但深植於日常的性別腳本(誰該為家庭犧牲、誰是「主要照顧者」)改變慢。於是出現入門篇講過的「第二輪班」與「母職懲罰」——女性進了職場,家裡那條起跑線卻沒跟著移動。這也解釋了為何單靠「讓更多女性就業」並不會自動消除不平等:如果無酬照顧的分配與評價沒有同步改變,新增的只是女性的負擔,而非真正的平等。
第四個難題:別忘了「男性」這一邊——男性氣概的代價
進階的性別社會學有一個常被忽略卻極重要的轉向:把男性與男性氣概(masculinity)本身當成研究對象,而不只是把男性當成「不平等的受益者」。入門篇提過康乃爾(Raewyn Connell)的霸權男性氣概(hegemonic masculinity),這裡我們把它的分析威力展開。
霸權男性氣概理論的精髓是「等級化」:在任何社會裡,存在一種被理想化、被當成「真男人」典範的男性形象(典型如:強壯、果斷、異性戀、事業有成、情感克制)。重點是,能完全符合這個典範的男性其實是少數,但這個典範卻支配著所有人——它讓不符合的男性(較陰柔者、性少數者、失業者、身障者)淪為「從屬男性氣概」,也讓所有女性處於結構性的次位。
這個視角帶出一個重要洞見:性別規範對男性也是一種枷鎖。「男兒有淚不輕彈」「男生要扛起一切、不能示弱、不能求助」這套腳本,與男性偏高的自殺率、偏低的就醫與心理求助意願、以及某些風險行為(酒駕、暴力)有結構性關聯。當「會照顧人」「會表達情緒」被貶為「不夠男人」,受害的是男性自身的健康與關係品質。因此,性別平等不是零和的「女性贏、男性輸」,而是讓所有人從僵化腳本中鬆綁——這也是為什麼當代倡議愈來愈強調「邀請男性成為性別平等的夥伴」,而非把男性當成敵人。
第五個難題:照顧與市場——21 世紀的新前沿
最後一條軸線,是把性別不平等放進更大的政治經濟(political economy)脈絡。當生育率下探、人口高齡化,「誰來照顧」這個問題從家庭內部溢出,成為整個社會的結構危機。
社會學者福爾布雷(Nancy Folbre)等人發展的照顧經濟學(economics of care)指出:照顧勞動(育兒、長照、護理)具有巨大的社會價值,卻因為其「女性化」與「無酬/低酬」的雙重標記而被系統性低估。當社會試圖把照顧「外包」到市場(請外籍看護、托嬰中心、長照機構),這份勞動往往落到更弱勢的女性身上——在台灣,常是社經地位較低的本國女性或來自東南亞的女性移工。這就讓入門篇的交織性(intersectionality)有了最尖銳的現實版本:一位都會專業女性能去職場拚事業,很可能是建立在另一位移工女性以低薪承接了她的照顧責任之上。性別不平等沒有消失,只是沿著階級與族群的斷層被「轉移」了。
更前沿的議題還包括演算法與性別偏見:當企業用 AI 篩選履歷、用機器學習模型評估升遷潛力時,如果訓練資料本身來自過去充滿偏見的人事決策,模型會把歷史的歧視「學起來」並自動放大——曾有大型科技公司的招募 AI 因為學到「過去錄取者多為男性」而自動懲罰履歷中出現「女性」相關字眼。這把古老的性別問題帶進了資料科學的全新戰場,也是 Educational Omics 這類多模態資料平台在設計時必須警惕的倫理紅線。
重點回顧
- 把差距「拆開」是第一步:Oaxaca-Blinder 分解法把薪資差距拆成「可解釋(特徵差異)」與「無法解釋(常被視為歧視上界)」兩塊,但要小心「無法解釋」既可能高估也可能低估歧視。
- 因果證據靠實驗設計:對應研究/履歷審查實驗藉由「只改變性別、其餘全控制」來分離出性別的因果效果,反覆發現連女性評審者也內化了隱性偏見。
- 革命會停滯:性別變遷是不對稱的——社會鼓勵女性向上進入男性領域,卻不鼓勵男性向下承接被貶值的照顧勞動,加上文化滯後,導致進步卡關。
- 男性氣概也有代價:霸權男性氣概理論顯示性別規範同時束縛男性(健康、情感、求助),性別平等是讓所有人鬆綁,而非零和對立。
- 照顧與演算法是新前沿:照顧勞動被系統性低估並沿階級/族群轉移,演算法則可能把歷史偏見自動放大——交織性與資料倫理在此交會。
深入探討(研究所視角)
進入研究所,性別不平等研究的方法論辯論會更為尖銳。第一條軸線是因果推論的階層。對應實驗雖能建立因果,卻有外部效度的限制:它測的是「招募第一關」的偏見,無法回答升遷、留任、長期薪資成長中的歧視。於是學者轉向準實驗設計(quasi-experimental design)——利用政策變動作為自然實驗,例如某地實施「父親專屬育嬰假(daddy quota)」前後,比較男性請假率與女性職涯軌跡的變化(difference-in-differences),以推估制度介入的因果效果。一個值得鑽研的台灣題目是:育嬰留職停薪津貼的歷次修法,是否真的鬆動了照顧分工,還是只是讓原本就會請假的女性領到錢?
第二條軸線是測量與概念的張力。當性別被理解為光譜而非二分時,傳統「男/女」二元編碼的問卷與行政資料就顯得粗糙。如何在量化研究中納入性別認同(gender identity)與性別表現(gender expression)的多樣性,同時維持統計檢力與樣本代表性,是一個尚未有標準答案的前沿難題。這也牽動 Ethicomics 層次的問題:資料的分類方式本身就是一種權力,把人塞進預設的盒子,可能在分析之前就抹除了某些群體。
第三條軸線是跨國比較與福利體制(welfare regime)。艾斯平—安德森(Esping-Andersen)的福利資本主義三類型,以及女性主義學者對它「性別盲」的批判,催生了「去家庭化(defamilialization)」概念——國家透過公共托育、長照把照顧責任從家庭(女性)手中分擔出去的程度。北歐高度去家庭化、東亞(含台灣、日本、南韓)則高度依賴家庭內女性。把台灣放進這個比較座標,可以追問:在一個生育率全球最低、女性高教育、卻仍高度家庭主義的社會,制度(政策設計)與規範(「好媽媽」的文化期待)究竟誰在拖住性別革命的後腿?這是一個能同時串起人口學、社會政策與性別理論的博士級研究問題。
最後,是反身性(reflexivity)的提醒。性別研究者本身也帶著性別位置與價值立場進入田野。優秀的研究不是假裝自己「客觀中立」,而是誠實地交代自己的視角如何影響提問與詮釋,並讓資料有機會推翻自己的預設。這種把研究者自身也納入分析的自覺,正是社會學作為一門「批判而嚴謹」的科學,最迷人也最艱難之處。