嬰兒的大腦如何「決定」要丟掉哪些聲音？知覺窄化、敏感期與語言發展的減法

語言發展的第一步不是加法而是減法——從萬國聽者到母語聽者，從關鍵期的牆到敏感期的斜坡

進階 · 約 13 分鐘 ·#語言發展#知覺窄化#敏感期#統計學習#神經可塑性

嬰兒的大腦如何「決定」要丟掉哪些聲音？

想像一個六個月大的台灣嬰兒，和一個同齡的日本嬰兒，並排坐在實驗室裡。研究者播放英語的 /r/ 與 /l/——對「rake」和「lake」這兩個音。此時，兩個嬰兒都能清楚分辨它們。但只要再等半年，到了十二個月大，日本嬰兒幾乎聽不出兩者的差別了，台灣嬰兒也是。而美國嬰兒卻把這個分辨能力磨得更利。

入門篇談的是「有沒有某個詞，會不會影響你看不看得見某個顏色」——那是語言與成熟認知之間的關係。但這篇我們要往回推，推到語言能力還沒成形的最早期：人類嬰兒並不是慢慢「學會」聽見母語的聲音，而恰恰相反——他們一出生就能聽見所有人類語言的聲音對比，然後在第一年內，有系統地把用不到的那些主動丟棄。語言發展的第一步，不是加法，是減法。

這個「神經承諾（neural commitment）」的故事，會帶我們進入一個更尖銳的問題：如果語言能力的地基是在嬰兒期就鋪好的，那麼「關鍵期（critical period）」到底有多硬？錯過了還能補回來嗎？

從「萬國聽者」到「母語聽者」：知覺窄化

語言與發展進階概念示意圖

語音知覺發展最經典的證據，來自 Patricia Kuhl 與 Janet Werker 等人的一系列研究。Werker 與 Tees（1984）用一個巧妙的「條件式轉頭（conditioned head-turn）」實驗：讓英語環境的嬰兒聽印度語（Hindi）和北美原住民語（Nthlakampx）裡英語沒有的子音對比。結果是清楚的發展曲線——六到八個月大的嬰兒能分辨這些「外語」對比，但到了十到十二個月，分辨能力幾乎消失。

這個現象叫做知覺窄化（perceptual narrowing）。它的重點不在於「嬰兒變笨了」，而在於大腦正在做一件高度適應性的事：根據環境輸入的統計分布，把知覺資源重新分配給母語真正會用到的對比上。

Kuhl 進一步提出母語磁吸效應（native language magnet, NLM）：母語中高頻出現的「原型（prototype）」母音，會像磁鐵一樣把鄰近的相似音「吸」過去，使我們對原型附近的細微差異變得不敏感。這就是為什麼成年的日語母語者很難聽出 /r/–/l/——對日語大腦而言，這兩個音落在同一個磁吸範圍內，被知覺系統當成「同一個東西」處理了。

關鍵在於：這不是被動退化，而是學習的副產品。你對母語愈精熟，對非母語對比就愈遲鈍。發展心理學稱這種「先廣後窄」的軌跡為「維持與喪失（maintenance and loss）」——維持有用的、丟掉沒用的。

看一個例子：統計學習如何雕刻知覺

Kuhl 團隊 2003 年做過一個關鍵實驗，回答了「到底要怎樣的輸入才能維持外語對比」這個問題。

他們讓九個月大的英語嬰兒接觸普通話（華語）。一組嬰兒由真人老師陪讀普通話故事十二堂課；另一組看同一位老師的錄影；第三組只聽錄音。

結果令人意外：只有「真人互動」那一組，普通話的音素對比分辨能力被成功維持下來，表現幾乎像在台灣長大的嬰兒。而錄影組和錄音組，與完全沒接觸普通話的對照組沒有差別。

這個發現有兩層意涵：

第一，嬰兒進行的是統計學習（statistical learning）——大腦自動追蹤輸入中聲音出現的頻率與分布，據此校準知覺類別。Saffran、Aslin 與 Newport（1996）著名的「八個月嬰兒能用音節轉換機率切分詞界」研究，正是統計學習的奠基證據：嬰兒在僅僅兩分鐘的連續語流中，就能偵測到哪些音節常常一起出現（屬於同一個詞），哪些則是跨詞界的低機率組合。

第二，社會互動是學習的閘門。同樣的語音輸入，少了與真人的眼神、輪替、共同注意（joint attention），大腦就「不買單」。這呼應了 Kuhl 所說的「社會閘門假說（social gating hypothesis）」：對人類嬰兒而言，語言學習被社會性動機所「閘控」，沒有社會互動，純粹的聲學輸入不足以驅動學習。

這也是為什麼把幼兒丟在外語電視前，並無法讓他們學會那個語言——這不是道德勸說，是有實驗數據的。

關鍵期：一道牆，還是一道斜坡？

語言發展最具爭議的概念，就是 Eric Lenneberg（1967）提出的關鍵期假說（Critical Period Hypothesis, CPH）：語言習得有一個生理上的時間窗口（大約從兩歲到青春期），錯過了就無法達到母語者水準。

支持證據來自幾個令人心痛的「自然實驗」：

Genie：一名在極端剝奪環境長大、十三歲才被發現的女孩。雖然她後來學會了大量詞彙，卻始終無法掌握正常的句法（syntax）。
第二語言移民研究：Johnson 與 Newport（1989）測試在不同年齡移民美國的華語與韓語母語者，發現「抵達年齡」與英語文法判斷準確度呈現清楚的負相關，且在青春期前後出現轉折。

但「關鍵期」這個詞容易造成誤解。當代研究更傾向用敏感期（sensitive period）取代「關鍵期」，因為證據顯示這比較像是一道逐漸傾斜的斜坡，而非一面突然出現的牆。能力不是「過期作廢」，而是「隨年齡逐步下降」。

而且，不同語言子系統的敏感期並不同步：

子系統	敏感期硬度	說明
語音（accent）	最硬	成人學外語幾乎難免口音
句法（syntax）/構詞	中等	文法直覺受年齡影響明顯
詞彙（vocabulary）	最軟	終生都能高效學習新詞

換句話說，你成年後還是能背幾千個法文單字，但要把法文口音磨到母語水準，幾乎不可能。這種「子系統解離」本身就是反對「單一硬性關鍵期」的有力證據。

動手試試：用你自己的經驗檢驗敏感期

請回想你自己的語言經驗，做一個小小的內省檢驗：

你的母語裡，有沒有哪個第二語言的音，你到現在都覺得「聽起來都一樣」？（例如華語母語者常分不清英語 /æ/ 和 /ɛ/，如 bad 和 bed。）這就是你嬰兒期「知覺窄化」留下的痕跡。
你能輕鬆學會新單字，但無論練多久，講外語時總有人聽得出你的口音嗎？這正是「詞彙軟、語音硬」的敏感期解離。
如果你會雙語，且其中一種是幼年習得、另一種是青春期後習得，試著比較：哪一種語言你更能「憑直覺」判斷句子文法對不對，而不需要刻意去想規則？

這個內省不是嚴謹實驗，但它能讓抽象的敏感期理論，變成你身上可觸碰的證據。重點是理解：你今天的語言能力地貌，有很大一部分是嬰兒期的大腦替你「預先決定」的。

不只是輸入：語言發展是雙向建構

如果只強調「環境輸入塑造大腦」，會落入一種單向、被動的圖像。但實際上，語言發展是個體與環境的雙向建構。

Noam Chomsky 的普遍文法（Universal Grammar, UG）傳統強調的是「天賦」那一端：他著名的「刺激貧乏論證（poverty of the stimulus）」指出，孩子接觸到的語料其實充滿錯誤、片段、且不完整，卻能在三、四歲就掌握複雜的句法規則，這暗示人類天生帶有某種語言習得的「先驗結構」。

而 Michael Tomasello 等人的基於使用的取徑（usage-based approach）則把重心放回互動：語言不是抽象規則的解碼，而是從具體的溝通意圖中，透過共同注意與意圖讀取（intention reading）慢慢「長」出來的。孩子先學會整塊的「公式（formula）」，再從中抽取模式。

這兩派的爭論至今未息，但當代發展心理學的共識是：兩端都不可偏廢。先天的學習偏向（learning biases）讓嬰兒「知道該注意輸入中的什麼」，而豐富的社會互動則提供了讓這些偏向得以運作的養分。前面 Kuhl 的「真人 vs 錄影」實驗，恰恰是這個雙向觀點的最佳註腳——大腦有準備好學習的機制，但這機制需要社會互動來「啟動」。

重點回顧

語言發展的第一步是減法，不是加法：嬰兒生來能分辨所有人類語言的語音對比，第一年內透過「知覺窄化」主動丟棄母語用不到的對比。對外語的「聽不出來」，是母語精熟的代價。
統計學習＋社會閘門：嬰兒用統計學習追蹤輸入分布來校準知覺類別（Saffran 1996），但這個學習被社會互動所「閘控」——錄影和錄音無效，唯有真人互動才能維持外語對比（Kuhl 2003）。
關鍵期更像斜坡而非牆：當代用「敏感期」取代「關鍵期」，能力隨年齡逐步下降而非突然作廢。
子系統解離：語音的敏感期最硬（口音難改）、句法中等、詞彙最軟（終生可學）。這正是反對「單一硬性關鍵期」的證據。
雙向建構：先天的學習偏向（Chomsky 的天賦端）與社會互動養分（Tomasello 的使用端）缺一不可。

深入探討（研究所視角）

1. 知覺窄化是「語言專屬」還是「領域普遍」機制？

一個深刻的問題是：第一年內的知覺窄化，究竟是語言系統特有的，還是反映更一般的知覺學習原則？證據指向後者。Pascalis、de Haan 與 Nelson（2002）發現嬰兒對臉孔也有平行的窄化——六個月嬰兒能分辨不同猴子的臉，九個月時就喪失了，正如語音對比的喪失。這暗示窄化是一個領域普遍（domain-general）的知覺調校原則：大腦根據環境統計，把資源集中到生態上重要的區辨上。這對 Chomsky 式「語言是獨立模組」的強天賦論構成挑戰——至少在知覺層次，語言可能借用了一套更普遍的學習機制。研究所層次值得追問：句法的習得是否也能用領域普遍的統計學習解釋（如 Bayesian 程式歸納模型），還是必須訴諸語言特有的先驗結構？

2. 敏感期的神經可塑性機制：為何會「關閉」？

從神經科學看，敏感期的開閉與抑制性神經迴路的成熟有關。Takao Hensch 的研究指出，敏感期的開啟由 GABA 能抑制性中間神經元（特別是 parvalbumin 細胞）的成熟所觸發，而其「關閉」則與髓鞘化（myelination）及神經周圍網（perineuronal nets, PNNs）的形成有關——後者像一層「分子鷹架」把已建立的迴路固定下來，限制進一步的可塑性。這提供了一個迷人的轉譯前景：動物模型中，以酶（如 chondroitinase ABC）分解 PNNs 可重新開啟可塑性。這引出倫理與理論交織的問題：如果敏感期在分子層次「可被重啟」，那麼「關鍵期是不可逆的」這個古典命題，是否需要從「發展生物學的硬限制」重新定義為「可被調控的動態狀態」？

3. 雙語的「兩條軌道」與認知優勢爭論

雙語發展為敏感期理論提供了天然實驗場。同步雙語（simultaneous bilingual）兒童似乎能維持兩套語音系統而不互相磁吸，但繼起雙語（sequential bilingual）的第二語言則受抵達年齡強烈調節。更具爭議的是所謂「雙語認知優勢（bilingual advantage）」——早期研究（如 Bialystok）主張雙語者在執行功能上更佳，但近年大樣本與前註冊（pre-registered）的複製研究（如 Paap & Greenberg 2013）大量未能複製此效應，引發「發表偏誤（publication bias）」的方法學反省。這是一個絕佳的案例，提醒研究生：一個直覺上「應該為真」的效應，在嚴格的複製檢驗與發表偏誤校正下，可能遠比文獻表面所示脆弱。讀文獻時，務必區分「效應存在」與「效應穩健」。

4. 從個體到計算模型

當代的橋接工作試圖用計算模型統合上述現象。例如，以理想觀察者（ideal observer）框架把知覺窄化形式化為對輸入分布的貝氏推論；或用神經網路模擬「先廣後窄」的表徵變化。這些模型的價值，不在於「證明大腦就是這樣算的」，而在於提供可證偽的精確預測——例如，若窄化純由輸入統計驅動，則操弄輸入分布應能精準預測窄化的時程與程度。對有志於認知科學的學生而言，這種「行為現象 → 形式模型 → 可檢驗預測」的循環，正是這個領域最迷人的方法論核心。

← 上一篇

沒有「藍色」這個詞，你還看得見藍色嗎？語言與思考的關係

--

3

32.3%

140.05

82.02%

62,201

AI 回覆桌面通知

聊天訊息通知

聲音通知

更多設定

嬰兒的大腦如何「決定」要丟掉哪些聲音？知覺窄化、敏感期與語言發展的減法