為什麼一隻烏賊能教我們理解智慧？

計算神經科學把大腦當成資訊處理系統，用數學模型回答「大腦在算什麼、怎麼算、為什麼這樣算」，並與人工智慧雙向對話。

大學基礎 · 約 14 分鐘 ·#計算神經科學#神經編碼#人工神經網路#突觸可塑性#NeuroAI#馬爾三層次

為什麼一隻烏賊能教我們理解智慧？

一九五二年，霍奇金（Alan Hodgkin）與赫胥黎（Andrew Huxley）把細小的電極插進一條烏賊（squid）異常粗大的神經軸突，量測膜電位隨時間的變化。他們做的不只是記錄——他們寫下了一組微分方程式，讓電壓、鈉離子、鉀離子之間的關係變成可以「計算」的數學。把方程式解出來，曲線竟然與真實神經元發放動作電位（action potential）的波形幾乎吻合。

這是一個關鍵的時刻：大腦的某個運作，第一次被一個方程式「預測」出來，而不只是被觀察、被描述。從那一刻起，神經科學多了一個問法。除了問「大腦長什麼樣子、哪裡亮起來」，我們開始問：「大腦在『算』什麼？它用什麼樣的計算規則，把感官輸入變成知覺、決策與行動？」

這就是計算神經科學（Computational Neuroscience）的核心關懷。它假設大腦是一台處理資訊的機器——不是比喻，而是字面意義上的資訊處理系統——並試圖用數學模型與電腦模擬，去逼近這台機器的運算原理。本文要帶你看的，正是「用模型理解大腦」這條路徑：它怎麼開始、發展出哪些層次的模型，又如何與今天的人工智慧（AI）彼此餵養。

計算神經科學概念示意圖

從「描述大腦」到「計算大腦」

傳統神經科學擅長描述。我們可以用組織切片畫出神經元的形態，用功能性磁振造影（fMRI）看哪塊腦區在做數學題時血氧增加，用腦電圖（EEG）記錄睡眠時的腦波節律。這些都極有價值，卻有一個共同的限制：它們告訴你「發生了什麼」，卻不一定告訴你「為什麼是這樣，而不是別的樣子」。

計算神經科學想補上的，是「為什麼」與「如何」。它的基本信念可以用一句話概括：大腦的結構是為了執行某種計算而存在的。如果我們能寫出那個計算的數學形式，就能用模型生成預測，再拿去和真實的神經資料比對。模型對了，我們就更接近理解；模型錯了，差異本身也告訴我們漏掉了什麼。

這裡有一個很有用的思考框架，來自視覺科學家馬爾（David Marr）。他在一九八二年的著作《Vision》中提出，理解任何資訊處理系統都應該分三個層次：

計算層（computational level）：這個系統要解決什麼問題？目標是什麼？
演算法層（algorithmic level）：它用什麼表徵（representation）與步驟來解這個問題？
實作層（implementational level）：這些步驟如何由實際的硬體——對大腦而言就是神經元與突觸——來實現？

馬爾的洞見是：這三層相對獨立。你可以在不知道每顆電晶體怎麼運作的情況下，理解一台計算機在「做加法」；同樣地，我們可以先問「海馬迴（hippocampus）要解決什麼導航問題」，再問它用什麼演算法，最後才追究神經元層級的細節。計算神經科學的工作，常常就是在這三層之間來回穿梭、互相約束。

模型有不同的「解析度」

「用模型理解大腦」聽起來抽象，實際上模型有很多種，差別在於它描述到多細的層次。我們可以大致排出一個由細到粗的光譜。

生物物理模型（biophysical models）最接近真實的生理機制。前面提到的霍奇金—赫胥黎模型就是代表：它用離子通道的開關機率、膜電容、各種離子電流，精確描述單一神經元如何產生動作電位。這類模型參數多、計算量大，但能還原很細膩的電生理現象，也是後來各種簡化模型的源頭。

簡化的點神經元模型（point-neuron models）犧牲一些細節，換取可分析性與運算效率。最經典的是「整合發放模型」（integrate-and-fire model）：把神經元想像成一個會累積電荷的容器，輸入電流讓膜電位上升，一旦超過閾值就「發放」一個脈衝，然後重置。它丟掉了動作電位的精細波形，卻保留了「累積—觸發—重置」這個核心邏輯，因此被廣泛用來搭建成千上萬個神經元的網路模擬。

網路與群體模型（network / population models）關心的不再是單顆神經元，而是一群神經元如何互相連結、產生集體行為。經典的例子是霍普菲爾德網路（Hopfield network），約翰·霍普菲爾德（John Hopfield）在一九八二年用它說明：一群彼此連結的神經元，可以把記憶儲存成網路的「穩定狀態」，當輸入一個殘缺的線索，網路會自動「滾」到最接近的記憶狀態——這正是聯想記憶（associative memory）的數學原型。值得一提的是，霍普菲爾德與辛頓（Geoffrey Hinton）因為這條把物理、神經與機器學習接起來的脈絡，獲得了二○二四年的諾貝爾物理學獎。

規範性／理性模型（normative models）則站在最高的計算層問問題：假設大腦在某個任務上「做得最好」，那最佳解會長什麼樣子？例如，把知覺看成貝氏推論（Bayesian inference）——大腦結合「先驗知識」與「當下的不確定感官證據」，推估外在世界最可能的狀態。這類模型不直接描述神經元，而是描述大腦「應該」如何計算才合理，再回頭檢查神經活動是否符合這個理性標準。

沒有哪一種解析度「最好」。要不要保留離子通道、要不要模擬單顆神經元，取決於你想回答的問題。這也是計算神經科學的一門手藝：選對抽象的層次。

大腦怎麼「編碼」資訊？

如果大腦在計算，那它一定得先把世界「寫」成某種內部的格式。這就是神經編碼（neural coding）的問題：一個神經元的發放，到底代表什麼？

最早的線索來自單細胞記錄。休伯爾（David Hubel）與威澤爾（Torsten Wiesel）在一九五○至六○年代記錄貓的初級視覺皮質（V1），發現某些神經元只有在視野中出現「特定方向的線條」時才強烈發放——有的偏好垂直線，有的偏好斜線。換句話說，單一神經元像是一個「特徵偵測器」，對某種刺激「調諧」（tuning）。他們因此獲得一九八一年諾貝爾生理醫學獎，這項發現也奠定了「皮質透過階層式特徵抽取來理解視覺」的觀念——這個觀念，數十年後幾乎原封不動地出現在深度卷積神經網路的設計裡。

但「一個神經元代表一個特徵」只是故事的一部分。後來的研究強調群體編碼（population coding）：訊息往往不在單顆神經元，而分散在一群神經元的活動模式（pattern）裡。例如運動皮質中，單一神經元對手臂運動方向只有粗略偏好，但把整群神經元的偏好向量加總起來，就能精準預測手臂要往哪裡動——這就是著名的「群體向量」（population vector）概念。群體編碼的好處是抗噪、容錯，少數神經元失常不至於讓整個表徵崩潰。

還有一個長年爭論：訊息是藏在發放的頻率（rate coding，一段時間內發放幾次），還是藏在發放的精確時間（temporal coding，脈衝出現在哪個毫秒）？兩者在不同腦區、不同任務中可能都有角色。聽覺系統對時間極度敏感（我們能用兩耳到達聲音的時間差定位聲源），這暗示時間編碼在某些場景至關重要。計算神經科學的工作之一，就是用模型去釐清：在什麼條件下，哪一種編碼方式對大腦最有效率。

學習，是突觸在更新權重

理解了大腦如何「編碼當下」，下一個問題是：它如何「改變自己」？也就是學習。

計算的觀點下，學習往往等同於調整連結強度——突觸的權重。這個想法的源頭是心理學家赫布（Donald Hebb）在一九四九年提出的原則，常被濃縮成一句話：「一起發放的神經元，會連在一起」（neurons that fire together, wire together）。當突觸前與突觸後神經元反覆同步活動，它們之間的連結就會增強。這條赫布學習法則（Hebbian learning），後來在生理上找到了對應：長期增益效應（long-term potentiation, LTP）與長期抑制效應（long-term depression, LTD），以及更精細的「脈衝時序依賴可塑性」（spike-timing-dependent plasticity, STDP）——突觸增強或減弱，竟然取決於前後神經元發放的先後順序與時間差，差幾毫秒結果就可能相反。

赫布法則是「局部」的——每個突觸只需要看自己兩端的活動就能更新。但要學會複雜的任務，光靠局部規則似乎不夠，於是有了「監督式學習」的觀點：拿系統的輸出和正確答案比較，算出誤差，再把誤差「往回傳」去調整每一層的權重。這就是反向傳播（backpropagation）。它在工程上極為成功，是今天深度學習的引擎；但它在大腦中是否真實存在，一直備受質疑——因為它需要一條精確的「反向通路」傳遞誤差訊號，而真實神經迴路是否具備這種機制，至今仍是熱門的研究問題。這個張力本身，正是計算神經科學與 AI 對話最精彩的地方：工程上好用的演算法，不一定就是大腦用的演算法。

大腦與 AI：互相照亮的兩面鏡子

到這裡，計算神經科學與人工智慧的交纏已經呼之欲出。它們的關係，與其說是「誰啟發誰」，不如說是一段長達數十年、雙向流動的對話。

從大腦流向 AI 的一面：人工神經網路（artificial neural network）的最初靈感，正來自神經元。麥卡洛克（Warren McCulloch）與皮茨（Walter Pitts）在一九四三年提出的形式神經元，是把神經元簡化成「加權求和再過閾值」的邏輯單元。前面提到的休伯爾—威澤爾發現，啟發了福島邦彥（Kunihiko Fukushima）的「神經認知機」（Neocognitron），而後者又是現代卷積神經網路（CNN）的直接前身。連「注意力」（attention）這個今天大型語言模型的核心機制，其名稱與直覺也借自認知與神經科學對選擇性注意的研究。

從 AI 流回大腦的一面：當深度網路強大到能在影像辨識上接近人類，神經科學家做了一件有趣的事——直接拿訓練好的 CNN 各層的活動，去比對獼猴視覺皮質各區的神經反應。結果發現，網路低層的活動類似 V1，高層的活動類似下顳葉皮質（IT cortex），對應得出奇地好。這讓深度網路成為一種新的工具：把它當成「大腦的可操作模型」，在裡面做各種真實實驗難以進行的拆解與假設檢驗。這個方向近年常被歸入更廣義的 NeuroAI。

但必須誠實地說明界線：人工神經網路與真實大腦的差異仍然巨大。生物神經元是發放離散脈衝、消耗極少能量、在連續時間中運作的；它的學習可能根本不靠反向傳播；它還與身體、荷爾蒙、睡眠、情緒深深耦合。把 CNN 當成視覺皮質的模型很有啟發性，但若忘了它只是某個層次的近似，就會落入「大腦就是個深度網路」的迷思。模型是用來思考的工具，不是大腦的替身。

看一個例子

讓我們用一個具體的故事，把前面的概念串起來——海馬迴系統裡的「位置細胞」（place cells）與「網格細胞」（grid cells）。

一九七一年，奧基夫（John O'Keefe）在大鼠的海馬迴記錄到一類神經元：當動物走到環境中某個特定地點時，這顆細胞就劇烈發放，走到別處就安靜。彷彿大腦裡有一張「地圖」，每顆位置細胞負責標記地圖上的一個點。這是純粹的「描述性」發現——我們看到了現象。

但描述只是起點。計算的問題接著浮現：動物在黑暗中、沒有外部地標時，怎麼知道自己走到哪了？合理的猜想是，大腦能整合自身的移動（走了多遠、轉了多少角度）來持續更新位置估計——這在工程上叫「路徑積分」（path integration）。

二○○五年，莫澤夫婦（May-Britt Moser 與 Edvard Moser）在鄰近的內嗅皮質（entorhinal cortex）發現了網格細胞：它的發放不是對應單一地點，而是對應一個鋪滿整個空間的、規律的六邊形格點。多個不同尺度、不同相位的網格細胞疊加起來，理論上可以唯一地編碼任意位置——這簡直就是一套天生的「空間座標系統」。奧基夫與莫澤夫婦因此共享了二○一四年諾貝爾生理醫學獎。

而這裡出現了計算神經科學最迷人的一幕：當研究者訓練一個人工遞迴神經網路（recurrent neural network），單純要求它根據速度訊號去做路徑積分、估計自己的位置時，網路內部「自發地」長出了類似網格細胞的六邊形發放模式（二○一八年，DeepMind 與合作團隊發表於《Nature》的研究）。沒有人告訴網路要長成六邊形——它只是為了把路徑積分這個計算任務做好，最有效率的內部表徵恰好就是網格。

這個例子完整走過了我們談的每一層：從描述（看到位置細胞）→ 提出計算問題（如何路徑積分）→ 發現對應的神經編碼（網格細胞）→ 用規範性模型（人工網路只被要求把任務做好）回頭驗證「為什麼是六邊形」。它也漂亮地示範了大腦與 AI 的雙向對話：神經發現啟發了模型，而模型又回過頭來提供了神經發現背後「為什麼」的一種解釋。

重點回顧

計算神經科學把大腦看成資訊處理系統，目標不只是描述「發生了什麼」，而是用數學模型回答「大腦在算什麼、怎麼算、為什麼這樣算」。
馬爾的三層次框架（計算層、演算法層、實作層）提醒我們：理解大腦要在「解決什麼問題」與「神經元如何實現」之間來回穿梭，選對抽象層次是關鍵手藝。
模型有不同解析度，從貼近生理的霍奇金—赫胥黎模型，到簡化的整合發放模型，到群體網路模型，再到問「最佳解長什麼樣」的規範性模型，各自回答不同尺度的問題。
編碼與學習是兩大主軸：大腦用單細胞調諧與群體模式編碼資訊，並透過突觸權重的可塑性（赫布法則、LTP/LTD、STDP）來學習。
大腦與 AI 是雙向流動的兩面鏡子：神經科學啟發了人工神經網路，而訓練好的網路又成為理解大腦的新工具——但兩者差異仍大，模型是思考的工具，而非大腦的替身。

深入探討（研究所視角）

對有志於進一步鑽研的同學，計算神經科學目前有幾條值得關注的前沿與爭論。

第一，反向傳播在大腦中的「生物合理性」（biological plausibility）。 深度學習靠反向傳播取得壓倒性成功，但它要求權重對稱的反向通路、全域同步的誤差傳遞，這些在解剖學上難以對應。近年一系列工作試圖找出「生物可行的近似」：例如回饋對齊（feedback alignment）顯示，就算反向權重是隨機的、與前向權重不對稱，網路仍能學習；又如平衡傳播（equilibrium propagation）、預測編碼（predictive coding）框架，試圖用局部規則逼近反向傳播的效果。「大腦是否在做某種形式的近似反向傳播」，是 NeuroAI 領域最核心的開放問題之一。

第二，從速率到脈衝、從靜態到動態。 主流深度網路用連續的發放速率與離散的時間步，而真實神經系統用稀疏的脈衝在連續時間中運作。脈衝神經網路（spiking neural networks, SNN）與神經形態運算（neuromorphic computing）試圖還原這層真實性，不只是為了生物逼真，更因為脈衝式、事件驅動的計算可能帶來極高的能源效率——這對被能耗問題困擾的當代 AI 是重要啟示。同時，研究焦點也從「網路學到什麼表徵」轉向「神經群體的動態系統」（dynamical systems）觀點：把運動皮質、前額葉的活動看成高維狀態空間中的軌跡，用吸引子（attractor）、流形（manifold）等語言來理解決策與運動的生成。

第三，表徵相似性與「對齊」的方法學爭論。 拿人工網路比對大腦的研究愈來愈多，但「相似」要怎麼嚴謹地量化？表徵相似性分析（representational similarity analysis, RSA）、中心核對齊（centered kernel alignment, CKA）等指標各有盲點，高相似度也不等於相同的計算機制。如何避免「過度詮釋」一個剛好擬合得好的模型，是這個領域必須面對的方法學自律。

最後，跨維度的整合視野。 把計算神經科學放回 Educational Omics 的脈絡，它與優生物（神經元的離子機制、突觸可塑性的分子基礎）、優心理（知覺、記憶、決策的行為層次）以及 AI（人工神經網路、強化學習）天然相連。對學習科學而言，這條路尤其誘人：如果學習在神經層次就是突觸權重的更新，那麼「什麼樣的教學情境最能驅動有效的權重更新」這個老問題，或許有一天能在計算的層次被重新提問。理解大腦如何計算，最終也可能回過頭來，幫助我們理解人如何學習。

一群神經元的「形狀」，藏著大腦的計算嗎？

--

4

32.3%

140.05

82.02%

62,201

AI 回覆桌面通知

聊天訊息通知

聲音通知

更多設定

為什麼一隻烏賊能教我們理解智慧？