學習最根本的目的在於為了我們更好地適應環境而改變我們的行為。學習帶來的這種改變最終要落實在我們的神經係統。早在1949年,加拿大心理學家赫布認為沿神經傳導的衝動改變著神經元細胞組成的網絡係統,促成新的從激勵到反應的神經路徑以及更高效率的傳遞。這個新的神經係統構建在我們的認知和意識上就是記憶。到1999年,坎德爾在分子生物學上建立起了完整的記憶形成的機製。
我們可以回到海兔的條件反射神經線路結構。中間神經元細胞釋放的血清素與感覺神經突觸前膜上的感受器結合,在突觸前膜裏產生出一種環磷酸腺苷的物質。環磷酸腺苷又激活一種蛋白激酶,促使感覺神經突觸增大穀氨酸的釋放量。蛋白激酶控製突觸前膜上的鉀離子通道的開關,使得突觸前膜電位勢和環磷腺苷濃度保持足夠長的一段時間。神經突觸反應一般隻有幾毫秒的時間。而血清素引起的突觸化學狀態的改變可以長達幾分鍾。這被稱為短期記憶。人類的日常行為已經很複雜。短期記憶幫助我們組織協調這些行為。
坎德爾觀察到,當感覺神經元細在接受到血清素的連接激勵之後,會生成一個或者多個新的突觸,強化與運動神經元細胞的聯係。多次反複的血清素激勵使得突觸前膜裏環磷酸腺苷大量增加。被環磷酸腺苷激活的蛋白激酶遊離進入細胞核,在那裏又激活一種結合蛋白CREB。以前我們提到過,在我們體內,每個細胞裏包含的DNA基因是完全一樣的。但是我們有像心髒和肝髒等不同的器官組織分化。這是因為一些特定的調製蛋白和基因結合,控製了基因的表現。CREB就是這樣一類調節基因轉錄的蛋白。被蛋白激酶激活的CREB又激活了基因的表現功能。基因信息由信使RNA攜帶出細胞核。當信使RNA遊移到受到血清素激勵的突觸前膜時,被另一種結合蛋白激活。這時,整個蛋白合成和物質合成的程序開始啟動。在原有的突觸附近長出了新的突觸。長期記憶就對應於這種神經線路上物理性的改變。這種新的結構可以維持幾個小時,有的長達幾年。我們很多的人生經曆就存在這些突觸節點上。
我們估計每個感覺神經元細胞有大概一千三百個突觸連接在二十五個左右的運動神經元細胞上。其中有五百個突觸具有活性。其它的處於休眠狀態。人腦總共有八百億個神經細胞,神經的突觸節點有大約一百萬億個。這是一個龐大的係統,大腦受到激勵時,這個結構就在神經細胞和節點上進行調整。它的狀態決定了我們的意識和行為。在這個意義上,當前的人工智能具有類似人腦的概念。有人猜測GPT-4語言模型動用了一百萬億個參數進行訓練。它的結構複雜程度已經和人腦相當。再加上當代計算機的數據處理速度,GPT-4的智能很快會超過人類。但是它是基於特定的算法。我不認為這些算法具備了人腦意識最底層的基本邏輯。要不然,我們自己太簡單了。讓GPT-4再訓練幾個月或者一年。我們將有一個雖然不是最終的但是會更確切的答案。無論如何,地球生物史很可能已經進入了一個新的智慧時代。
神經細胞是個可塑性的活體。也許我們沒有意識到,我們的大腦在不停地變化。每天我們都在接受很多信息,經曆很多的事情。我們大腦裏的神經細胞像春芽一樣長出新的神經末梢突觸。而有的神經突觸又像秋葉一樣枯萎。通過長時間的敏感化訓練,感覺神經元細胞的突觸末端可以增加一倍。活性突觸的比率也能增長到百分之六十。而長時間的習慣化訓練之後,突觸數量會減少百分之三十。有的神經連接會徹底喪失。有實驗證明,猴子在經過訓練用手抓食物器皿之後,它的大腦體感皮層中對應於手指的區域明顯變大。用進廢退的現象一直發生在我們的大腦。專門的學習會提高我們對專業的理解和能力。但是,長期受到固化的宣傳和教育會讓我們的思想和思維變得僵硬,俗稱被洗腦。我聽見太多的一些似是而非,言之無物的陳詞濫調,然後又在這些陳詞濫調中習以為常了。為避免陷入這種思維的泥潭,希望我們能夠不斷接受新的事物和激勵,提高多維度思維的活性和自由。也希望我們能夠有自己獨立的判斷力。這種判斷力來自我們切身的體驗,真實的資訊,以及真正的邏輯。
—寫於2023年4月3日(圖片來自網絡)