嬰兒的大腦如何「決定」要丟掉哪些聲音?知覺窄化、敏感期與語言發展的減法
語言發展的第一步不是加法而是減法——從萬國聽者到母語聽者,從關鍵期的牆到敏感期的斜坡
嬰兒的大腦如何「決定」要丟掉哪些聲音?
想像一個六個月大的台灣嬰兒,和一個同齡的日本嬰兒,並排坐在實驗室裡。研究者播放英語的 /r/ 與 /l/——對「rake」和「lake」這兩個音。此時,兩個嬰兒都能清楚分辨它們。但只要再等半年,到了十二個月大,日本嬰兒幾乎聽不出兩者的差別了,台灣嬰兒也是。而美國嬰兒卻把這個分辨能力磨得更利。
入門篇談的是「有沒有某個詞,會不會影響你看不看得見某個顏色」——那是語言與成熟認知之間的關係。但這篇我們要往回推,推到語言能力還沒成形的最早期:人類嬰兒並不是慢慢「學會」聽見母語的聲音,而恰恰相反——他們一出生就能聽見所有人類語言的聲音對比,然後在第一年內,有系統地把用不到的那些主動丟棄。語言發展的第一步,不是加法,是減法。
這個「神經承諾(neural commitment)」的故事,會帶我們進入一個更尖銳的問題:如果語言能力的地基是在嬰兒期就鋪好的,那麼「關鍵期(critical period)」到底有多硬?錯過了還能補回來嗎?
從「萬國聽者」到「母語聽者」:知覺窄化

語音知覺發展最經典的證據,來自 Patricia Kuhl 與 Janet Werker 等人的一系列研究。Werker 與 Tees(1984)用一個巧妙的「條件式轉頭(conditioned head-turn)」實驗:讓英語環境的嬰兒聽印度語(Hindi)和北美原住民語(Nthlakampx)裡英語沒有的子音對比。結果是清楚的發展曲線——六到八個月大的嬰兒能分辨這些「外語」對比,但到了十到十二個月,分辨能力幾乎消失。
這個現象叫做知覺窄化(perceptual narrowing)。它的重點不在於「嬰兒變笨了」,而在於大腦正在做一件高度適應性的事:根據環境輸入的統計分布,把知覺資源重新分配給母語真正會用到的對比上。
Kuhl 進一步提出母語磁吸效應(native language magnet, NLM):母語中高頻出現的「原型(prototype)」母音,會像磁鐵一樣把鄰近的相似音「吸」過去,使我們對原型附近的細微差異變得不敏感。這就是為什麼成年的日語母語者很難聽出 /r/–/l/——對日語大腦而言,這兩個音落在同一個磁吸範圍內,被知覺系統當成「同一個東西」處理了。
關鍵在於:這不是被動退化,而是學習的副產品。你對母語愈精熟,對非母語對比就愈遲鈍。發展心理學稱這種「先廣後窄」的軌跡為「維持與喪失(maintenance and loss)」——維持有用的、丟掉沒用的。
看一個例子:統計學習如何雕刻知覺
Kuhl 團隊 2003 年做過一個關鍵實驗,回答了「到底要怎樣的輸入才能維持外語對比」這個問題。
他們讓九個月大的英語嬰兒接觸普通話(華語)。一組嬰兒由真人老師陪讀普通話故事十二堂課;另一組看同一位老師的錄影;第三組只聽錄音。
結果令人意外:只有「真人互動」那一組,普通話的音素對比分辨能力被成功維持下來,表現幾乎像在台灣長大的嬰兒。而錄影組和錄音組,與完全沒接觸普通話的對照組沒有差別。
這個發現有兩層意涵:
第一,嬰兒進行的是統計學習(statistical learning)——大腦自動追蹤輸入中聲音出現的頻率與分布,據此校準知覺類別。Saffran、Aslin 與 Newport(1996)著名的「八個月嬰兒能用音節轉換機率切分詞界」研究,正是統計學習的奠基證據:嬰兒在僅僅兩分鐘的連續語流中,就能偵測到哪些音節常常一起出現(屬於同一個詞),哪些則是跨詞界的低機率組合。
第二,社會互動是學習的閘門。同樣的語音輸入,少了與真人的眼神、輪替、共同注意(joint attention),大腦就「不買單」。這呼應了 Kuhl 所說的「社會閘門假說(social gating hypothesis)」:對人類嬰兒而言,語言學習被社會性動機所「閘控」,沒有社會互動,純粹的聲學輸入不足以驅動學習。
這也是為什麼把幼兒丟在外語電視前,並無法讓他們學會那個語言——這不是道德勸說,是有實驗數據的。
關鍵期:一道牆,還是一道斜坡?
語言發展最具爭議的概念,就是 Eric Lenneberg(1967)提出的關鍵期假說(Critical Period Hypothesis, CPH):語言習得有一個生理上的時間窗口(大約從兩歲到青春期),錯過了就無法達到母語者水準。
支持證據來自幾個令人心痛的「自然實驗」:
- Genie:一名在極端剝奪環境長大、十三歲才被發現的女孩。雖然她後來學會了大量詞彙,卻始終無法掌握正常的句法(syntax)。
- 第二語言移民研究:Johnson 與 Newport(1989)測試在不同年齡移民美國的華語與韓語母語者,發現「抵達年齡」與英語文法判斷準確度呈現清楚的負相關,且在青春期前後出現轉折。
但「關鍵期」這個詞容易造成誤解。當代研究更傾向用敏感期(sensitive period)取代「關鍵期」,因為證據顯示這比較像是一道逐漸傾斜的斜坡,而非一面突然出現的牆。能力不是「過期作廢」,而是「隨年齡逐步下降」。
而且,不同語言子系統的敏感期並不同步:
| 子系統 | 敏感期硬度 | 說明 |
|---|---|---|
| 語音(accent) | 最硬 | 成人學外語幾乎難免口音 |
| 句法(syntax)/構詞 | 中等 | 文法直覺受年齡影響明顯 |
| 詞彙(vocabulary) | 最軟 | 終生都能高效學習新詞 |
換句話說,你成年後還是能背幾千個法文單字,但要把法文口音磨到母語水準,幾乎不可能。這種「子系統解離」本身就是反對「單一硬性關鍵期」的有力證據。
動手試試:用你自己的經驗檢驗敏感期
請回想你自己的語言經驗,做一個小小的內省檢驗:
- 你的母語裡,有沒有哪個第二語言的音,你到現在都覺得「聽起來都一樣」?(例如華語母語者常分不清英語 /æ/ 和 /ɛ/,如 bad 和 bed。)這就是你嬰兒期「知覺窄化」留下的痕跡。
- 你能輕鬆學會新單字,但無論練多久,講外語時總有人聽得出你的口音嗎?這正是「詞彙軟、語音硬」的敏感期解離。
- 如果你會雙語,且其中一種是幼年習得、另一種是青春期後習得,試著比較:哪一種語言你更能「憑直覺」判斷句子文法對不對,而不需要刻意去想規則?
這個內省不是嚴謹實驗,但它能讓抽象的敏感期理論,變成你身上可觸碰的證據。重點是理解:你今天的語言能力地貌,有很大一部分是嬰兒期的大腦替你「預先決定」的。
不只是輸入:語言發展是雙向建構
如果只強調「環境輸入塑造大腦」,會落入一種單向、被動的圖像。但實際上,語言發展是個體與環境的雙向建構。
Noam Chomsky 的普遍文法(Universal Grammar, UG)傳統強調的是「天賦」那一端:他著名的「刺激貧乏論證(poverty of the stimulus)」指出,孩子接觸到的語料其實充滿錯誤、片段、且不完整,卻能在三、四歲就掌握複雜的句法規則,這暗示人類天生帶有某種語言習得的「先驗結構」。
而 Michael Tomasello 等人的基於使用的取徑(usage-based approach)則把重心放回互動:語言不是抽象規則的解碼,而是從具體的溝通意圖中,透過共同注意與意圖讀取(intention reading)慢慢「長」出來的。孩子先學會整塊的「公式(formula)」,再從中抽取模式。
這兩派的爭論至今未息,但當代發展心理學的共識是:兩端都不可偏廢。先天的學習偏向(learning biases)讓嬰兒「知道該注意輸入中的什麼」,而豐富的社會互動則提供了讓這些偏向得以運作的養分。前面 Kuhl 的「真人 vs 錄影」實驗,恰恰是這個雙向觀點的最佳註腳——大腦有準備好學習的機制,但這機制需要社會互動來「啟動」。
重點回顧
- 語言發展的第一步是減法,不是加法:嬰兒生來能分辨所有人類語言的語音對比,第一年內透過「知覺窄化」主動丟棄母語用不到的對比。對外語的「聽不出來」,是母語精熟的代價。
- 統計學習+社會閘門:嬰兒用統計學習追蹤輸入分布來校準知覺類別(Saffran 1996),但這個學習被社會互動所「閘控」——錄影和錄音無效,唯有真人互動才能維持外語對比(Kuhl 2003)。
- 關鍵期更像斜坡而非牆:當代用「敏感期」取代「關鍵期」,能力隨年齡逐步下降而非突然作廢。
- 子系統解離:語音的敏感期最硬(口音難改)、句法中等、詞彙最軟(終生可學)。這正是反對「單一硬性關鍵期」的證據。
- 雙向建構:先天的學習偏向(Chomsky 的天賦端)與社會互動養分(Tomasello 的使用端)缺一不可。
深入探討(研究所視角)
1. 知覺窄化是「語言專屬」還是「領域普遍」機制?
一個深刻的問題是:第一年內的知覺窄化,究竟是語言系統特有的,還是反映更一般的知覺學習原則?證據指向後者。Pascalis、de Haan 與 Nelson(2002)發現嬰兒對臉孔也有平行的窄化——六個月嬰兒能分辨不同猴子的臉,九個月時就喪失了,正如語音對比的喪失。這暗示窄化是一個領域普遍(domain-general)的知覺調校原則:大腦根據環境統計,把資源集中到生態上重要的區辨上。這對 Chomsky 式「語言是獨立模組」的強天賦論構成挑戰——至少在知覺層次,語言可能借用了一套更普遍的學習機制。研究所層次值得追問:句法的習得是否也能用領域普遍的統計學習解釋(如 Bayesian 程式歸納模型),還是必須訴諸語言特有的先驗結構?
2. 敏感期的神經可塑性機制:為何會「關閉」?
從神經科學看,敏感期的開閉與抑制性神經迴路的成熟有關。Takao Hensch 的研究指出,敏感期的開啟由 GABA 能抑制性中間神經元(特別是 parvalbumin 細胞)的成熟所觸發,而其「關閉」則與髓鞘化(myelination)及神經周圍網(perineuronal nets, PNNs)的形成有關——後者像一層「分子鷹架」把已建立的迴路固定下來,限制進一步的可塑性。這提供了一個迷人的轉譯前景:動物模型中,以酶(如 chondroitinase ABC)分解 PNNs 可重新開啟可塑性。這引出倫理與理論交織的問題:如果敏感期在分子層次「可被重啟」,那麼「關鍵期是不可逆的」這個古典命題,是否需要從「發展生物學的硬限制」重新定義為「可被調控的動態狀態」?
3. 雙語的「兩條軌道」與認知優勢爭論
雙語發展為敏感期理論提供了天然實驗場。同步雙語(simultaneous bilingual)兒童似乎能維持兩套語音系統而不互相磁吸,但繼起雙語(sequential bilingual)的第二語言則受抵達年齡強烈調節。更具爭議的是所謂「雙語認知優勢(bilingual advantage)」——早期研究(如 Bialystok)主張雙語者在執行功能上更佳,但近年大樣本與前註冊(pre-registered)的複製研究(如 Paap & Greenberg 2013)大量未能複製此效應,引發「發表偏誤(publication bias)」的方法學反省。這是一個絕佳的案例,提醒研究生:一個直覺上「應該為真」的效應,在嚴格的複製檢驗與發表偏誤校正下,可能遠比文獻表面所示脆弱。讀文獻時,務必區分「效應存在」與「效應穩健」。
4. 從個體到計算模型
當代的橋接工作試圖用計算模型統合上述現象。例如,以理想觀察者(ideal observer)框架把知覺窄化形式化為對輸入分布的貝氏推論;或用神經網路模擬「先廣後窄」的表徵變化。這些模型的價值,不在於「證明大腦就是這樣算的」,而在於提供可證偽的精確預測——例如,若窄化純由輸入統計驅動,則操弄輸入分布應能精準預測窄化的時程與程度。對有志於認知科學的學生而言,這種「行為現象 → 形式模型 → 可檢驗預測」的循環,正是這個領域最迷人的方法論核心。