如今,人工智能的迅速發(fā)展給人們的日常生活和工作帶來了巨大的影響。要想讓人工智能朝著人類智能的方向持續(xù)邁進,我們就應該讓我們創(chuàng)造的硅基大腦像人類大腦一樣有感知、有記憶、有決策、有行動。問題的難點在于,人類大腦由約1000億個神經元構成,神經元間交流復雜,大腦掌管認知、意識,影響我們生活的方方面面。我們如何破解如此龐大的復雜系統(tǒng)的運行機制呢?
在《心智的10大模型》中,計算神經科學家格蕾絲·林賽深入探討了數(shù)學模型在理解大腦中的關鍵作用。書中通過10個數(shù)學模型,從單個神經元到復雜的神經環(huán)路,再到整個大腦的行為控制,逐步展示了數(shù)學工具如何幫助科學家理解和描述大腦的決策、感覺處理、記憶等過程。本書不僅是一部科學史,也是一本前沿的神經科學指南,為讀者呈現(xiàn)了神經科學與數(shù)學、計算機科學的跨學科融合,啟發(fā)讀者思考大腦建模與心智建模之間的關系及其未來的發(fā)展方向。
神經科學領域新銳科學家、世/界/級類腦智能研究者重磅力作格蕾絲林賽重磅新作。
從860億個神經元到源源不絕的聰明決策,我們的大腦中究竟發(fā)生了什么?關于物理學、數(shù)學和工程學在我們理解大腦中所扮演的角色的科普指南,展示了生物學家如何與物理學家、數(shù)學家和計算機科學家合作,在大腦科學上取得進展,以模擬大腦的一些潛在機制。
給出了有關下一代人工智能的啟發(fā)和思考。
中國科學院院士教授楊雄里教授、清華大學為先書院院長洪波、復旦大學生命科學學院退休教授顧凡及、加州理工學院物理系教授肖恩卡羅爾、哥倫比亞大學理論神經科學教授拉里·阿博特、神經生物學家利亞姆·德魯?shù)戎型庵耸柯?lián)袂推薦!美國知名科技雜志《大眾科學》強烈推薦!
湛廬文化出品。
如何再造一個硅基大腦
洪 波
清華大學為先書院院長、生物醫(yī)學工程學院教授
當今人類的生產生活已經被人工智能的浪潮裹挾,這不是第一次,也不會是最后一次。有智能行為的東西,很容易觸動人類內心的好奇和同情。人們喜歡和自己養(yǎng)的貓狗互動,跟我們喜歡和GPT胡亂聊天,喜歡看機器狗摔倒爬起,其實是一樣的心理。這種心理的背后深層次的原因,是人類總是試圖認識自身的思維和行為,從心理行為層面,從生理機制層面,甚至是從計算機制層面。如果從計算機制層面搞清楚了,那再造一個硅基大腦就有希望了。
物理學家費曼說過:我造不出來的東西,我就還沒理解。(What I cannot create, I do not understand.)反之,如果我們還沒有理解,當然也就造不出來。要造出一個硅基大腦,使它像生物大腦一樣有感知、有記憶、有決策、有行動,我們必須努力觀察和發(fā)現(xiàn)生物大腦運行的機制,并把它們構建成數(shù)學模型,感知、記憶、決策和行動才能在硅基的計算機中復現(xiàn)。
這是一本很有雄心的書,作者林賽試圖用10個數(shù)學模型來回答生物大腦的計算機制究竟是什么。這也是一本安靜的書,不適合那些想從腦科學中淘金,拿去人工智能領域變現(xiàn)的匆匆過客。如果你稍有一點耐心,坐下來一兩小時,試著讀一章,你就會被其中有趣而深刻的故事所吸引,一定會在某個地方受到震撼,得到啟發(fā)。不要擔心數(shù)學模型的深奧,正文里沒有一個公式,即使是附錄里的公式也是極其克制而簡潔的。
疫情防控期間,偶然的機會讀了本書的英文版Models of the Mind,立刻被作者試圖用10大數(shù)學模型總結大腦運行機制的雄心所打動。作者還用講故事的方式,介紹了這些數(shù)學模型背后的科學家以及他們之間的互動,硬核模型背后又平添了人性的溫度。湛廬能選中這本書翻譯出版,對那些試圖理解智能本質的人們是一件幸事。你盡可以把它當作一本大腦建模的旅游攻略,在其中走一遍會大開眼界,最重要的是,下次你想去哪個模型景點深度游的時候,就有了一張系統(tǒng)的文獻地圖和人物關系圖。作者顯然是計算神經科學領域的資深旅行者,對過去一個世紀腦科學和大腦建模的歷史了解得很通透。
這個星球上有兩種智能:生物智能和機器智能。生物智能是從自然界億萬年的生物進化中涌現(xiàn)出來的,是生命體為了自身生存,不斷攝取環(huán)境中的物質和能量,自下而上自監(jiān)督訓練出來的,簡單講是靠投喂物質和能量得到的生物體內活的碳基的神經結構;機器智能是人類受到生物智能,特別是人類自身智能行為的啟發(fā),自上而下設計出來的,需要人為設定目標并監(jiān)督訓練。在當前階段,機器智能主要靠人為提供的計算體系和海量數(shù)據(jù),簡單講是靠投喂信息得到的計算機里無生命的硅基神經網絡。這兩者的差別是不言而喻的,我深信前者更加優(yōu)雅,背后的數(shù)學模型也更加簡潔。
我們通常高估了人類頂層設計的智慧,低估了自然進化的智慧。我們也一定高估了人工智能發(fā)展的快變量――算力和數(shù)據(jù),低估了人工智能顛覆性發(fā)展的慢變量――自然界放在我們眼前的生物智能結構。朝菌不知晦朔,蟪蛄不知春秋,在自然進化的生物智能面前,人類就是朝菌和蟪蛄。 這本書提醒我們,其實今天如日中天的人工智能就是在努力模仿生物神經網絡的核心結構和動態(tài)規(guī)律,只是人工智能的快速迭代,模糊了背后的神經科學背景。
書中的10個模型可以分為兩類:一類是功能輸出型的大腦模型,這類模型對人工神經網絡和人工智能的發(fā)展起到了非常直接的推動作用;另一類是數(shù)學抽象型的大腦模型,為腦科學研究提供了信息論、系統(tǒng)論與概率論的分析視角和工具。我重點提一下7個經典的功能輸出型的大腦模型,它們在過去70年人工智能的發(fā)展歷程中發(fā)揮了關鍵性的作用。
- 單個神經細胞的動力學模型。烏賊粗大的神經纖維給了科學家精確測量細胞膜內外電流的機會,再借鑒電子電路的思想,定量刻畫了一個神經細胞是如何放電的,構建了泄漏整合發(fā)放(Leaky Integrate-and-Fire,LIF)模型和霍奇金-赫胥黎(Hodgkin-Huxley,HH)模型,這成為后來的脈沖神經網絡的出發(fā)點和依據(jù)。一個神經細胞雖然簡單,但是離子通道豐富多變的動力學特性,以及神經細胞樹突的豐富形態(tài),為脈沖神經網絡建模帶來了極大的想象空間。
- 多層前向神經網絡感知機。把單個人工神經細胞拼接起來,形成多層結構,并發(fā)展出相應的學習算法,這樣建成的感知機可以識別手寫體數(shù)字,成為第一個有用的人工神經網絡。感知機看上去像一個玩具模型,但它無愧于一個頂天立地的智能英雄,一方面開啟人工神經網絡的工業(yè)化應用,另一方面把圖靈所提出的可學習可教育的機器變成了現(xiàn)實,使智能理論邁出了一大步。
- 模仿視覺大腦的卷積神經網絡。把貓的初級視覺皮層簡單細胞和復雜細胞處理圖像邊緣的機制,抽象為兩個層次的圖像卷積操作,并模仿視覺通路的層次化結構,不斷重復這樣的分層卷積,最終構建了能夠識別復雜圖像的卷積神經網絡。這個多層結構幾乎復制了猴子和人類的腹側視覺通路。 加上反向傳播算法的發(fā)明,以及此后網絡深度的快速提升,開啟了基于深度學習網絡的智能新時代。
- 模仿海馬等大腦認知模塊的循環(huán)神經網絡。把記憶等大腦內生狀態(tài)抽象為循環(huán)連接的神經網絡,基于神經可塑性的赫布法則,把需要記憶或者臨時處理的信息(及其序列),以吸引子的方式隱藏在復雜的網絡連接系數(shù)中,構建出霍普菲爾德網絡、玻爾茲曼機、連續(xù)吸引子網絡等。這一升級,使人工神經網絡有了動態(tài)的隱空間,網絡的行為也變得更加靈活而智能。
- 大腦運動控制的群體向量模型。猴子運動皮層單個神經細胞總是偏好某個特定方向,大量運動腦區(qū)的神經細胞用放電頻率來投票,共同決定了手的運動。在數(shù)學上,用一個簡單的線性回歸模型,就可以從一群神經細胞放電頻率推算出猴子的手如何運動。這一模型雖然存在爭議,但它幾乎是腦機接口解碼運動參數(shù)的標準算法,非常可靠。有時候我甚至懷疑,這是運動皮層神經細胞在粗暴算法的逼迫之下快速學習和適應的結果,而不是什么解碼。
- 模仿生物獎懲學習行為的強化學習算法。生物體在環(huán)境中尋求獎勵的過程是不斷探索、不斷更新預期的過程,大腦深部的神經細胞會根據(jù)預期誤差的大小,釋放適量的多巴胺,來指導生物體的下一步行動。這種機制對應的數(shù)學模型就是著名的強化學習算法――時間差分學習。如果把游戲終局時的獎勵,通過深度學習網絡投射到玩家當前位置的預期,強化學習會更加精準有效,于是就催生了DeepMind Alpha系列的各種超級智能。
- 生物神經網絡陰陽平衡的機制模型。大腦是由千億個神經細胞連接形成的復雜網絡,這些細胞是如何協(xié)作,確保這個復雜系統(tǒng)不會崩潰的呢?背后是興奮性和抑制性神經細胞之間的陰陽平衡。這兩類神經細胞可能一直處于勢均力敵的拔河狀態(tài),神經活動中觀測到的所謂噪聲和震蕩實際上就是這兩種力量來回拉鋸。這種拉鋸狀態(tài)使得大腦可以快速有效地處理外界的輸入。拔河力量失衡的大腦,就會出現(xiàn)癲癇或者其他精神疾病。
格蕾絲·林賽
紐約大學心理學和數(shù)據(jù)科學助理教授,主要研究領域有三個:建立注意力和學習之間的聯(lián)系模型、驗證系統(tǒng)神經科學的工具、將計算機視覺用于應對氣候變化。
她成果豐碩,出版科普圖書、主持播客節(jié)目Unsupervised Thinking、參與科學寫作與學術傳播活動,還致力于將數(shù)據(jù)科學用于應對氣候變化等跨學科研究。
2011年,她取得匹茲堡大學神經科學學士學位,并獲得德國伯恩斯坦計算神經科學中心研究獎學金,前往該科學中心開展研究工作;20132017年,她在哥倫比亞大學攻讀神經科學博士學位,專注于構建計算模型理解注意力對感知的調制等研究,并于2016年獲得谷歌計算神經科學博士獎學金;20182022年,她先后在哥倫比亞大學理論神經科學中心、倫敦大學學院蓋茨比計算神經科學中心開展博士后研究。
[譯者簡介]
劉錦珂
馬克斯·普朗克研究所神經科學博士。
推薦序一 如何再造一個硅基大腦
洪 波
清華大學為先書院院長、生物醫(yī)學工程學院教授
推薦序二 腦科學的數(shù)學之旅:一場科普的破冰行動
顧凡及
復旦大學生命科學學院退休教授、博士生導師
引言穿越400年時空,開啟心智探索之旅
第1章 我們頭腦中的火樹銀花
帶泄漏整合發(fā)放模型與霍奇金-赫胥黎模型
|19世紀20年代至21世紀10年代|
萊頓瓶與青蛙實驗
歐姆定律與帶泄漏整合發(fā)放模型
烏賊實驗:動作電位是如何形成的
電纜理論:樹突是神經元中一枚有用的齒輪
賦予神經系統(tǒng)研究勃勃生機的正是電學研究
第2章 一團執(zhí)行精密邏輯計算的粉色物質
麥卡洛克-皮茨模型與人工神經網絡
|17世紀70年代至20世紀70年代|
麥卡洛克 - 皮茨模型:將大腦理解為一個遵循邏輯規(guī)則的計算設備
感知機,像人腦一樣思考和學習
小腦的神經元結構與感知機原理:從錯誤中學習的神經網絡
多層感知機:人工智能領域的變革引擎
反向傳播算法:推動人工智能發(fā)展的關鍵突破
霍普菲爾德神經網絡與環(huán)形網絡
|20世紀40年代至20世紀90年代|
印跡與赫布型學習:記憶科學的演進
霍普菲爾德網絡:跨學科的記憶模型
海馬,解開記憶奧秘的關鍵樞紐
環(huán)形網絡:建立優(yōu)質工作記憶系統(tǒng)的得力干將
第4章 花樣百出的神經元制衡戰(zhàn)
平衡神經網絡與神經震蕩
|20世紀30年代至20世紀末|
神經元噪聲:神經元反應的亂糟糟有何大用處
抑制性神經元:使大腦產生思維的關鍵角色
神經元的噪聲之戰(zhàn):興奮與抑制的平衡vs. 大腦的隨機性
平衡網絡:大腦中的興奮與抑制如何共舞
混沌理論:為什么相同的輸入會引發(fā)千變萬化的反應
大腦中的振蕩與混沌:認知活動之謎
第5章 層層堆疊造就的清晰視野
新認知機與卷積神經網絡
|20世紀20年代至20世紀80年代|
模板匹配的變革之路:從機械裝置到計算機
群魔殿:從模板匹配到視覺系統(tǒng)的層次結構
探秘初級視覺皮質:大腦如何解讀復雜的視覺信號
新認知機:師從生物學以拓展計算機視覺
卷積神經網絡:給人工視覺網絡的發(fā)展插上翅膀
跨學科合作,共同探索生物視覺科學的未來
第6章 降本增效的信息處理大法
神經編碼與信息論
|20世紀40年代至20世紀60年代|
信息論的起源:香農領航的通信革命
信息論的應用:應對神經編碼的多樣性與復雜性
有效編碼假說:大腦如何以最優(yōu)方式傳遞和利用信息
大腦就像一套通信系統(tǒng),但這還不夠
第7章 在亂糟糟中合并同類項
動力學、運動學與降維
|20世紀30年代至20世紀90年代|
從抽搐到動作:19世紀的大腦運動控制機制發(fā)現(xiàn)之爭
埃瓦茨的腕力研究:運動皮質編碼與動力學的開端
重新定義運動皮質的角色:不僅僅是編碼
解碼運動皮質:繞過理解直達行動
降維:掙脫神經群體思維的困境
運動皮質的探索之路,道阻且長
第8章 簡單線條揭示的龐雜秘密
圖論與網絡神經科學
|18世紀30年代至21世紀10年代|
圖論:解密復雜網絡結構的數(shù)學之鑰
六度分隔:神經系統(tǒng)領域的降本增效
連接組:從圖論視角探索神秘的大腦世界
連接組與精神疾病:圖論方法的醫(yī)學應用
從爆發(fā)到精雕細琢:如何構建穩(wěn)定高效的神經網絡
超越連接組,探索理解大腦復雜性的多維視角
第 9 章所知所見決定出牌策略
概率論與貝葉斯法則
|16世紀至19世紀10年代|
從骰子到大數(shù)據(jù):貝葉斯法則如何改變世界
從概率到認知:貝葉斯法則在心理學中的崛起
貝葉斯法則如何幫我們解讀感知到的世界
用貝葉斯法則理解大腦的決策過程
貝葉斯大腦假說:靈活與挑戰(zhàn)并存的探索之路
第10章 用當下的驚喜修正對未來的預期
時間差分學習與強化學習
|20世紀50年代至20世紀70年代|
如何規(guī)劃最佳路線:從巴甫洛夫的狗到貝爾曼方程式
從蘭德公司到動態(tài)規(guī)劃:貝爾曼如何改變決策科學
從條件反射到價值函數(shù):強化學習的數(shù)學之旅
從蜜蜂到猴子:神經遞質在學習與成癮中的角色
大腦中的獎勵與學習:馬爾思考給我們的啟示
結語 有沒有一個簡明的大統(tǒng)一理論能解釋大腦?
附錄
致謝
譯者后記