8 從0重走AI百年之路 - 黎明前的15年(第5集):聯結主義與學習法則:機器如何第一次學會“學習”
哈嘍大家好,我是焱森。歡迎回到「從0重走AI百年之路」的第8期 —— 黎明前的15年系列第五集:聯結主義與學習法則 —— 模擬大腦的最初嘗試。
在上期文稿裏,我們見證了1948到1950年間那場改變世界的思想革命。圖靈用《智能機械》報告為AI繪製了第一張完整的技術藍圖,又用《電腦器與智能》論文提出了圖靈測試,為AI奠定了不可動搖的哲學基石;伯克利則用《巨型大腦》這本超級暢銷書,打破了電腦的神秘感,讓"機器能思考"的概念第一次走進了千家萬戶。
當理論的骨架已經搭建完成,硬體的肉身已經鍛造就緒,思想的障礙也已經被掃清,人工智慧的誕生似乎只剩下最後一步:把紙上的構想變成現實。
但就在這時,科學家們卻面臨著一個根本性的路線分歧:我們到底應該如何建造會思考的機器?
一派科學家認為,智能的本質是邏輯和符號運算。我們應該像編寫數學公式一樣,把人類的知識和推理規則預先編寫進電腦,讓機器按照人類設定的邏輯進行思考。這就是後來統治AI領域長達三十年的符號主義路線。
而另一派科學家則認為,要創造真正的智能,最直接、最自然的方法就是模仿人類大腦的工作方式。大腦不是一個執行預先編寫好程式的計算器,而是一個由數十億個神經元相互連接而成的複雜網路。智能不是來自於邏輯規則,而是來自於神經元之間的連接強度和學習過程。這就是聯結主義路線,也就是今天深度學習的前身。
從1949年到1951年,短短三年間,三位偉大的先行者點燃了聯結主義的火種。赫布提出了第一個可執行的神經學習法則,為神經網路奠定了理論基礎;香農打造出世界上第一只會自主學習的機械小鼠,用最直觀的方式展示了強化學習的威力;明斯基則製造出第一臺人工神經網路學習機,用硬體證明了聯結主義的可行性。
正是這三次開創性的嘗試,為人工智能開闢了一條與符號主義並行的全新道路。今天,我們就回到那個充滿探索精神的年代,看看人類如何第一次親手嘗試模擬大腦的學習過程。
一、如果機器也能像大腦一樣學習呢?赫布《行為的組織》(1949)
1949年,就在伯克利的《巨型大腦》風靡全美國的同一年,加拿大心理學家唐納德·赫布出版了一本名為《行為的組織:一種神經心理學理論》的著作。這本書在當時並沒有引起公眾的關注,但它卻成為了神經科學和人工智慧歷史上最重要的著作之一。
赫布在這本書中提出了一個極其簡單卻又極其深刻的假說,這個假說後來被稱為赫布學習法則,它是所有現代神經網路學習演算法的鼻祖。
1.一個改變世界的簡單假說
在赫布之前,神經科學家們已經知道大腦是由神經元組成的,神經元之間通過突觸相互連接。但沒有人知道,大腦是如何通過這些連接來學習和記憶的。
赫布提出了一個大膽的猜想:
當神經元A的軸突足夠接近神經元B,並持續或反復地激發它時,兩個神經元或其中一個神經元的生長過程或代謝變化就會發生,從而使A激發B的效率得到提高。"
這句話後來被簡化為一句流傳至今的名言:"一起放電的神經元,連接在一起。"(Fire together, wire together.)
這個法則的含義非常簡單:如果兩個神經元總是同時被啟動,那麼它們之間的連接就會變得越來越強。反之,如果它們很少同時被啟動,連接就會變得越來越弱。學習和記憶,本質上就是神經元之間連接強度的變化過程。
這是人類歷史上第一個關於大腦學習機制的可量化、可驗證的理論。它不僅徹底改變了神經科學的研究方向,也為人工智能的聯結主義路線提供了最核心的理論基礎。
2.從大腦到機器:赫布法則的AI意義
赫布本人可能沒有想到,他的心理學理論會對電腦科學產生如此深遠的影響。但對於那些正在思考如何建造會思考的機器的科學家來說,赫布法則就像一道閃電,照亮了前進的道路。
在此之前,人們認為機器的所有行為都必須由人類預先編寫程式。但赫布法則告訴我們:學習不需要預先編寫程式,只需要調整連接強度。
一個由大量簡單單元相互連接而成的網路,只要遵循赫布學習法則,就能夠自動從經驗中學習,自動發現數據中的模式,自動形成記憶。這正是圖靈在《智能機械》報告中所預言的"無組織機器"的工作原理。
直到今天,幾乎所有的深度學習演算法,從反向傳播到Transformer,本質上都繼承了赫布法則的精神。它們的核心思想都是:通過調整神經元之間的連接權重,讓網路能夠更好地完成任務。
3.被低估的先驅
赫布從來沒有把自己看作是一個人工智慧研究者。他一生都致力於研究人類的大腦和行為,甚至對用機器模擬大腦的想法持懷疑態度。
但歷史卻把他推到了AI先驅的位置。正如一位歷史學家所說:"赫布沒有建造任何機器,也沒有編寫任何程式,但他卻為所有後來的AI研究者提供了最重要的靈感。他告訴我們,智能不是來自於複雜的邏輯,而是來自於簡單的連接和學習。"
《行為的組織》出版後的幾十年裏,赫布學習法則一直是聯結主義研究的核心指導原則。即使在聯結主義被符號主義壓制的黑暗年代,這個法則也從未被遺忘。它就像一顆種子,在地下默默等待著發芽的那一天。
二、一只鋼鐵老鼠,第一次證明機器能夠“試錯學習”:香農的機械小鼠THESEUS(1950)
當赫布在書房裏撰寫《行為的組織》時,另一位天才正在貝爾實驗室的車間裏忙碌著。他就是克勞德·香農,資訊理論的創始人,也是人工智慧史上最被低估的先驅之一。
1950年,也就是圖靈發表《電腦器與智能》的同一年,香農向世界展示了一個震驚所有人的發明:一只能夠自主學習走迷宮的機械小鼠,他把它命名為忒修斯(THESEUS),取自希臘神話中走出米諾斯迷宮的英雄。
1.世界上第一臺會學習的機器
忒修斯是世界上第一臺能夠通過試錯來學習的機器。它的構造非常簡單:
一個5x5格的可移動迷宮,牆壁可以隨意調整位置
一只帶有磁鐵的機械小鼠,底部有兩個電機控制前後左右移動
一個由大約100個繼電器組成的控制電路,藏在迷宮的下方
當香農把小鼠放在迷宮的任意位置時,它會開始隨機地四處探索。如果撞到牆壁,它就會後退,然後嘗試另一個方向。每走一步,繼電器電路就會記住這個方向是否可行。
當小鼠最終找到迷宮的終點時,它已經完整地記住了從起點到終點的正確路徑。這時,如果你把它放回起點,它會毫不猶豫地沿著最短路徑直接走到終點,再也不會走任何彎路。
更神奇的是,如果你改變迷宮的牆壁位置,忒修斯會忘記之前的記憶,重新開始探索,並很快學會新的路徑。
2.強化學習的雛形
在今天看來,忒修斯的功能非常簡單。但在1950年,這是一個革命性的突破。因為它是人類歷史上第一臺不是按照預先編寫的程式運行,而是通過與環境的互動來學習的機器。
香農的小鼠完美地體現了強化學習的核心思想:
智能體:機械小鼠
環境:迷宮
狀態:小鼠在迷宮中的位置
動作:上下左右移動
獎勵:到達終點
懲罰:撞到牆壁
小鼠通過不斷地試錯,獲得環境的回饋,然後調整自己的行為策略,最終學會了完成任務。這正是今天AlphaGo、ChatGPT等所有強化學習系統的基本工作原理。
香農在展示忒修斯時說:"這只老鼠不僅能夠記住路徑,還能夠從經驗中學習。它展示了一種非常原始的智能形式,但這種智能形式與人類的學習過程並沒有本質的區別。
3.香農的AI遺產
香農從來沒有成為AI領域的核心人物。他在發明了忒修斯之後,就把注意力轉向了其他有趣的問題:他發明了世界上第一個電腦象棋程式,第一個juggling機器人,甚至還研究過如何用數學方法預測股票市場。
但他對AI的貢獻卻不可磨滅。他不僅用忒修斯展示了強化學習的可行性,還為AI研究提供了最重要的數學工具——資訊理論。今天,幾乎所有的AI演算法都建立在香農資訊理論的基礎之上。
正如馬文·明斯基所說:"如果說圖靈是人工智慧的父親,那麼香農就是人工智慧的舅舅。他沒有直接撫養這個孩子,但他卻給了它最重要的基因。
三、人類第一次親手“搭建大腦”:明斯基的SNARC(1951)
1951年,一個年僅24歲的普林斯頓大學研究生,受香農等前輩啟發,完成了一個更加驚人的發明:世界上第一臺人工神經網路學習機。他就是馬文·明斯基,後來人工智能領域的傳奇人物,達特茅斯會議的組織者之一。
明斯基把這臺機器命名為SNARC,全稱是“隨機神經模擬強化計算器”(Stochastic Neural Analog Reinforcement Calculator)。
1.用真空管模擬大腦
SNARC是一個純粹的硬體神經網路。它由40根真空管、300個繼電器和大量的電阻、電容組成,模擬了40個人工神經元和它們之間的相互連接。
每個神經元都有多個輸入和一個輸出。當輸入信號的總和超過某個閾值時,神經元就會被啟動,輸出一個電脈衝。神經元之間的連接強度可以通過調整電位器來改變。
SNARC的設計靈感直接來自於赫布學習法則。明斯基讓SNARC模擬老鼠走迷宮的學習過程。當機器做出正確的選擇時,它會得到一個"獎勵"信號,這個信號會自動加強相關神經元之間的連接;當它做出錯誤的選擇時,連接就會被削弱。
經過多次試錯,SNARC能夠逐漸學會正確的路徑,就像一只真正的老鼠一樣。
2.一個超越時代的嘗試
在1951年,世界上只有少數幾臺存儲程式電腦,而且它們都被用來解決複雜的數學計算問題。沒有人想到,竟然有人會用昂貴的真空管和繼電器來模擬大腦的神經元。
SNARC的性能在今天看來簡直不值一提。它只有40個神經元,而人類的大腦有860億個神經元。但它的意義卻無比重大:它第一次用硬體證明了,一個由簡單單元相互連接而成的網路,確實能夠通過學習來獲得智能。
明斯基後來回憶說:"SNARC是一個非常粗糙的機器,它經常出故障,而且只能做非常簡單的事情。但它證明了一個原則:聯結主義是可行的。我們不需要預先編寫所有的規則,機器可以自己學習。"
3.一個充滿諷刺的轉折
沒有人能夠想到,聯結主義的這位先驅,後來會成為聯結主義最嚴厲的批評者。
1969年,明斯基和他的同事西摩·佩珀特出版了《感知機》一書。在這本書中,他們用嚴格的數學證明,指出了單層神經網路的局限性:它無法解決異或問題,也無法學習複雜的模式。
《感知機》對聯結主義造成了沉重打擊。在接下來的將近20年裏,聯結主義研究幾乎完全停滯,AI領域進入了符號主義一統天下的時代。這也成為後來AI寒冬的重要誘因之一。
直到1986年,反向傳播演算法的重新發現,才讓聯結主義重新煥發生機。而這時,距離明斯基製造SNARC已經過去了整整35年。
歷史的諷刺之處在於,明斯基並非否定神經網路本身,而是指出了當時神經網路模型的根本局限。但由於那個時代缺乏有效的多層網路訓練方法,這種批評幾乎讓整個聯結主義研究陷入停滯。
四、火種不滅:聯結主義的漫長等待
現在,讓我們回顧一下1949到1951年間發生的這三次開創性的嘗試:
1949年,赫布提出赫布學習法則,為神經網路奠定了理論基礎;
1950年,香農打造出機械小鼠忒修斯,展示了強化學習的雛形;
1951年,明斯基製造出SNARC,用硬體證明了聯結主義的可行性。
這三位先驅的工作,共同點燃了聯結主義的火種。他們證明了,模仿大腦的學習過程是一條可行的AI研究路線。
但在當時,這條路線並沒有得到大多數科學家的認可。符號主義憑藉其清晰的邏輯和立竿見影的效果,很快佔據了AI研究的主導地位。聯結主義就像一顆被埋在地下的種子,在黑暗中默默等待了將近40年。
直到2012年,AlexNet在ImageNet競賽中一鳴驚人,深度學習時代正式到來。這時,人們才突然發現,今天所有的AI技術,本質上都是70多年前那三位先驅思想的延續和擴展。
赫布的學習法則,變成了今天的反向傳播和梯度下降;
香農的強化學習,變成了今天的AlphaGo和自動駕駛;
明斯基的神經網路,變成了今天的GPT和大語言模型。
火種從未熄滅,它只是在等待合適的時機,燃燒成燎原之勢。
到1951年為止,人工智慧誕生前的探索之路已愈發清晰。聯結主義為我們打開了模擬大腦學習的大門,而與此同時,另一條核心路線——符號主義,也正在快速崛起,用邏輯與推理書寫著屬於自己的傳奇。
下期文稿,我們將進入黎明前的15年(第6集):符號邏輯與博弈 —— 搜索與推理的勝利。我們將見證,符號主義如何憑藉清晰的邏輯體系,在博弈與推理領域實現突破性進展:1950年,香農發表《為電腦編寫國際象棋程式》,率先將符號邏輯與博弈結合,為機器博弈奠定基礎;1951年至1952年間,斯特雷奇(Strachey)、普林茨(Prinz)、塞繆爾(Samuel)相繼推出跳棋與象棋程式,讓機器在棋牌博弈中展現出初步的推理能力;1954年,喬治敦-IBM實驗成功實現機器翻譯的初步嘗試,將符號邏輯應用於自然語言處理;1956年,紐厄爾與西蒙研發的“邏輯理論家”(Logic Theorist),更是成功證明了數學定理,成為符號主義的里程碑式成果,用搜索與推理的勝利,為人工智能的正式誕生築牢了另一塊關鍵基石。
最後,我想拋出三個思考題,與大家互動:
1.關於智能本質:赫布法則說“一起放電的神經元連接在一起”,這把智能簡化成了連接的強度。你認為人的情感、意識,真的能通過調整這種簡單的“權重”(Weight)就產生嗎?
2.關於學習方式:香農的機械小鼠通過撞牆來學習走迷宮。如果智能來自“學習”,而不是“規則”,那麼人類的教育本質上是不是也在“訓練神經網路”?
3.關於演化路線:聯結主義(模仿大腦)和符號主義(邏輯規則)在今天是否真正融合?大語言模型(如GPT)更多是哪一派的延續?未來AI是否需要更深地結合兩者,才能實現真正通用智能(AGI)?
我是焱森,陪你從0重走AI百年之路。
咱們下期再見!