中文版序
鮮活的記憶:數(shù)字奇遇的故事
你將閱讀的這本書問世已有三年。在技術(shù)指數(shù)發(fā)展的背景下,這本書可能會被視為過時。
任何關(guān)于科技預(yù)測的書籍,尤其是在人工智能領(lǐng)域,幾個月甚至幾周內(nèi)就會變得過時。不過,《隨機存取存儲器:數(shù)字技術(shù)革命的故事》(以下簡稱《隨機存取存儲器》)并不是談未來的書。它涵蓋了科技的近期歷史,幫助世界各地的讀者理解產(chǎn)業(yè)所面臨的挑戰(zhàn)和長期趨勢。正如已故的史蒂夫·喬布斯(Steve Jobs)所說,這是將點與點連接起來的書。《隨機存取存儲器》缺少最后一章,尤其缺少人工智能的部分,但目前看來寫這最后一章尚為時過早,因為整個產(chǎn)業(yè)風(fēng)景尚未穩(wěn)定下來。
去年12 月,聊天機器人模型ChatGPT 滿兩歲。像早慧的兒童一樣,它以前所未有的速度掌握多門語言、藝術(shù)和科學(xué),OpenAI 開發(fā)的這個聊天機器人已然把技術(shù)新玩意兒變成全球數(shù)億人日常伴侶。其成長速度無視以前采用的一切指標(biāo)中國的現(xiàn)象級全球社交媒TikTok 花了九個月的時間才達到1 億用戶,而ChatGPT 僅用兩個月就抵達這一里程碑。如今,ChatGPT 用戶每天生成3 000 億個單詞,相當(dāng)于每小時就重寫一次維基百科的英文內(nèi)容這是我在2022 年2 月用法語寫本書時難以想象的人機交互量。湊巧在那個月,OpenAI 發(fā)布了ChatGPT API。今天,與OpenAI 剛剛發(fā)布的GPT-4.5 相比,GPT-3 現(xiàn)在已經(jīng)被5001 000 倍的差距所壓倒。
科幻文學(xué)鼻祖阿瑟·克拉克(Arthur C. Clarke)說得好:任何足夠先進的技術(shù)都與魔法沒有區(qū)別。今天的生成式人工智能系統(tǒng)經(jīng)常顯得很神奇編寫代碼、創(chuàng)建圖像、創(chuàng)作音樂,甚至參與哲學(xué)對話。這樣的神奇感知固然可以理解,卻掩蓋了重塑我們世界的三場同步革命:前所未有的進步速度、所需資源的天文數(shù)字規(guī)模、創(chuàng)新重心的根本轉(zhuǎn)變。這些主題自始至終在本書的技術(shù)探索里回蕩。
先考慮規(guī)模。2023 年11 月,啟動深度學(xué)習(xí)革命的著名人工智能專家李飛飛博士致信美國國會,發(fā)出令人深省的信息。斯坦福大學(xué)是世界領(lǐng)先的人工智能研究機構(gòu)之一,卻僅有300 臺圖形處理器(GPU)。與此同時,微軟原本計劃到2025 年春時部署180 萬臺GPU,如今卻已部署250 萬臺GPU,大大超過原定計劃。業(yè)界與學(xué)界6 000 ∶ 1 的GPU 擁有量鮮明對比,說明前沿人工智能研究如何轉(zhuǎn)移到了學(xué)界之外。2011 年,人工智能博士畢業(yè)生在學(xué)術(shù)界和工業(yè)界平分秋色。如今,70% 的博士加盟私營公司,工業(yè)界吸引人才的資源是學(xué)界無法比擬的。
這種權(quán)力集中的現(xiàn)象最明顯的表現(xiàn)就是產(chǎn)業(yè)和市場里硬件對軟件的依賴。英偉達市值3 萬億美元,目前控制著人工智能芯片市場約70% 的份額,它面臨AMD、Intel 和硅谷云服務(wù)供應(yīng)商的激烈競爭,其市場主導(dǎo)地位已經(jīng)從2023 年巔峰時的80% 降至如今的70%。這一變遷與本書第十章的軟件飆升,硬件式微相呼應(yīng)。那一章預(yù)料,即使在看似虛擬的行業(yè)中,對物理基礎(chǔ)設(shè)施的控制仍然是至關(guān)重要的。雖然英偉達的主導(dǎo)地位有所下降,但主要的云技術(shù)服務(wù)商仍然嚴(yán)重依賴它的芯片,微軟將數(shù)據(jù)中心GPU 預(yù)算的近60% 用于采購英偉達芯片,而谷歌和亞馬遜分別將預(yù)算的45% 和40% 用于采購英偉達芯片。微軟宣告2025 年用800 億美元投資計算力基礎(chǔ)設(shè)施,蘋果未來五年在這個領(lǐng)域投資達500 億美元。同時,在一個122 天內(nèi)建成的數(shù)據(jù)中心里,xAI 公司在19 天內(nèi)就部署了10 萬臺GPU。半導(dǎo)體的風(fēng)景線快速演變,Anthropic 等公司開發(fā)定制芯片以減少對英偉達的依賴。這樣的演變正是本書描繪的鏡像:眾多公司為奪取競爭優(yōu)勢而追求縱向集成的動力學(xué)。
能源需求同樣驚人,這個主題與第九章數(shù)字經(jīng)濟的悖論三角共鳴。訓(xùn)練一個前沿的大語言模型消耗的電力相當(dāng)于一個10 萬人口城市一天的用電量。從這個角度來看待這一點,僅微軟的人工智能運營所需的電能預(yù)計就相當(dāng)于56 個核反應(yīng)堆輸出的電能,比兩年前核電站輸出電能翻一番。中國認(rèn)識到這一挑戰(zhàn),正在加速建造40 多座核反應(yīng)堆,其中許多專用于人工智能和技術(shù)區(qū)。中國正在實施本書探討的戰(zhàn)略舉措長期基礎(chǔ)設(shè)施的清晰謀劃。零碳算力的競賽已變得與算法競賽一樣至關(guān)重要,引導(dǎo)了東西方通用的創(chuàng)新。中國貴州省率先實施的數(shù)據(jù)中心液體冷卻技術(shù)降低能耗35%,微軟的水下數(shù)據(jù)中心實驗還在繼續(xù)發(fā)展。
以百度的機器人文心一言(Ernie Bot)4.0 和字節(jié)跳動的專有模型為例,中國在多模態(tài)AI 方面的進步,以及最新言語技術(shù)方面的突破證明,不同的監(jiān)管環(huán)境如何加速人工智能特定方面的發(fā)展。《中華人民共和國數(shù)據(jù)安全法》和《中華人民共和國個人信息保護法》為數(shù)據(jù)利用創(chuàng)建了一個結(jié)構(gòu)化的框架,使創(chuàng)新和戰(zhàn)略利益得以平衡。這種監(jiān)管方法,與本書第七章從操作系統(tǒng)到系統(tǒng)的運行所描述的更為分散的西方景觀形成對比。
競爭從硬件和數(shù)據(jù)延伸到人才,這是本書探討創(chuàng)新在地理上集中分布的主題。頂級人工智能研究人員的薪水高達八位數(shù),重要的實驗室在人才聚集的地方建立業(yè)務(wù)。谷歌DeepMind 從巴黎往上海擴張以利用區(qū)域優(yōu)勢;微軟在倫敦、新加坡一些城市和特拉維夫建設(shè)基地;OpenAI 在巴黎、東京和倫敦開設(shè)實驗室。字節(jié)跳動、阿里巴巴和新興的深度求索等中國公司在全球范圍內(nèi)建立了人工智能實驗室,它們認(rèn)識到創(chuàng)新無國界這一現(xiàn)實呼應(yīng)了第九章數(shù)字經(jīng)濟的悖論三角里的數(shù)字創(chuàng)新的地理悖論。
2025 年1 月,深度求索(DeepSeek)發(fā)布的DeepSeek v3 是一
個分水嶺,顯示中國公司在出口限制下仍能迅速進步。憑借開發(fā)需要較少計算資源的新算法,DeepSeek 證明,控制反而激發(fā)靈活的創(chuàng)新這是本書反復(fù)考察的模式。隨著美國科技股市場的矯正,近10 000 億美元的價值灰飛煙滅。特朗普總統(tǒng)宣布星門計劃(Project Stargate)5 000 億美元的投資之后幾天就發(fā)生這樣的震蕩,說明AI 的發(fā)展繼續(xù)塑造著產(chǎn)業(yè)地緣政治的維度。
但在這些挑戰(zhàn)中,效率的突破帶來了希望。法國的Mistral Large
2 語言模型、美國Anthropic 公司的 Claude 3.7 十四行詩模型和京泰(Kyutai)的莫希(Moshi)等大語言模型,展示了堪比更大模型的性能,其能耗卻僅為兩年前所需能量的1/200。京泰是法國一家非營利
組織,由億萬富翁澤維爾·尼爾(Xavier Niel)資助,他們致力于開
放研究和原型開發(fā),其開創(chuàng)性的莫希對話代理系統(tǒng)能夠直接將語音處理成語音,無需中間的文字轉(zhuǎn)換步驟,大幅減少了延遲,創(chuàng)造了更加自然的互動體驗。清華大學(xué)的研究人員開創(chuàng)了模型壓縮的新方法,實現(xiàn)了顯著的效率提升。產(chǎn)業(yè)界努力應(yīng)對環(huán)境影響時,這些進步至關(guān)重要這與本書第五章九鍵鍵盤的統(tǒng)治所討論的資源消耗主題直接相關(guān)。
人工智能對我們數(shù)字世界的影響已經(jīng)十分深遠(yuǎn)。最近的統(tǒng)計表明,人工智能生成了40%45% 的新在線文本內(nèi)容、60% 的共享圖片,以及越來越多與人類媒體的創(chuàng)作難以區(qū)分的視頻內(nèi)容。在中國,微信、支付寶和抖音等平臺上的AI 服務(wù)每天處理數(shù)萬億次互動,而高(Goldman Sachs)現(xiàn)在可以在幾秒鐘內(nèi)生成復(fù)雜的法律文件(如S-1 申報書),而不是之前需要幾天或幾周的時間。高盛23% 的員工是工程師,這一事實說明了本書第八章云端書商亞馬遜中描述的轉(zhuǎn)變傳統(tǒng)產(chǎn)業(yè)如何圍繞數(shù)字能力完成自身的重組。
如何區(qū)分人類生成的內(nèi)容與人工智能生成的內(nèi)容,這一挑戰(zhàn)隨著每一次進步而變得更加復(fù)雜,引發(fā)了關(guān)于數(shù)字空間中真實性和信任性的基本問題。2025 年2 月的巴黎人工智能行動峰會試圖通過國際合作來解決這些問題,制定了負(fù)責(zé)任的人工智能巴黎框架,吸引西方國家和中國的廣泛參與。這一框架代表了本書結(jié)語:狂人的縱向集成中倡導(dǎo)的技術(shù)治理的合作方針。
這種人工智能能力集中在私人手中的情況引發(fā)了關(guān)于創(chuàng)新未來的重大問題。斯坦福大學(xué)的人工智能研究所警告,大學(xué)曾經(jīng)是GPS、MRI 和互聯(lián)網(wǎng)等變革性技術(shù)的發(fā)源地,如今卻有被邊緣化的風(fēng)險,大學(xué)在人工智能的發(fā)展中處于次要地位了。美國創(chuàng)建人工智能法案(Create AI Act)的實施,承諾投入320 億美元用于國家人工智能研究基礎(chǔ)設(shè)施建設(shè)。這是姍姍來遲覺悟的標(biāo)志:將人工智能開發(fā)完全交給私人科技巨頭可能會損害公共利益本書對廣泛的技術(shù)發(fā)展模式表示關(guān)切。
2025 年2 月,美國科技公司聯(lián)盟宣布星門計劃(Project
Stargate),擬投資5 000 億美元。該倡議進一步顯示當(dāng)前人工智能開發(fā)的規(guī)模。這一前所未有的私人投資在計算基礎(chǔ)設(shè)施上的投入遠(yuǎn)遠(yuǎn)超過了大多數(shù)國家的科研預(yù)算,強化了本書所描述的創(chuàng)新重心轉(zhuǎn)移。與此同時,中國通過下一代人工智能規(guī)劃持續(xù)投資硬件和算法開發(fā),確保即使監(jiān)管和貿(mào)易壁壘增加,人工智能創(chuàng)新仍能保持全球分布的局面。
高度專業(yè)化AI 系統(tǒng)的出現(xiàn)也加速了。谷歌DeepMind 的AlphaFold 3以前所未有的規(guī)模準(zhǔn)確預(yù)測了蛋白質(zhì)相互作用,徹底改變了藥物的研發(fā);而北京基因組研究所也開發(fā)了類似的系統(tǒng),優(yōu)化了亞洲遺傳數(shù)據(jù)。這些專門的應(yīng)用顯示,AI 的影響遠(yuǎn)遠(yuǎn)超出消費應(yīng)用,延伸到了科學(xué)研究和醫(yī)療保健領(lǐng)域在這些領(lǐng)域中,數(shù)據(jù)、計算能力和專業(yè)知識的結(jié)合創(chuàng)造了新的卓越中心。
理解這些發(fā)展所需要的不僅僅是技術(shù)知識。本書有一句壓軸話:
三學(xué)科是一切教育的基礎(chǔ)。任何改革都不應(yīng)消除、減少三學(xué)
科的教育,更不能使之分離。只有它們結(jié)合時,我們才能理解這
個世界,它們的結(jié)合使我們進步。三學(xué)科就是數(shù)學(xué)、哲學(xué)和歷史。
三學(xué)科的框架為我們的人工智能革命導(dǎo)航,仍然至關(guān)重要。
數(shù)學(xué)幫助我們掌握技術(shù)基礎(chǔ),哲學(xué)指導(dǎo)我們的道德實踐,歷史揭示了塑造技術(shù)變革的范式本書就此做了巧妙的展示。人工智能以前所未有的速度飛躍發(fā)展。與此同時,人類的智慧也通過對過去的了解而積累起來。
2025 年初,京泰公司的Moshi 模型崛起,體現(xiàn)了多學(xué)科理解的
需求。這個由澤維爾·尼爾支持的法國非營利項目,通過消除傳統(tǒng)轉(zhuǎn)換步驟的新方法,在語音處理方面求得了突破性的性能提升,而不是依賴暴力計算。借鑒不同的知識傳統(tǒng)并公開其研究成果,該團隊創(chuàng)建了一個系統(tǒng),展示了更少參數(shù)下卓越的對話能力由此表明多學(xué)科和開放合作得到優(yōu)化時,創(chuàng)新就會涌現(xiàn)。
《隨機存取存儲器》問世以來,其中所論數(shù)字技術(shù)演進和人工智能革命的觀察業(yè)已得到驗證。它對數(shù)字創(chuàng)新悖論、物理基礎(chǔ)設(shè)施的重要性以及技術(shù)發(fā)展地緣政治維度的分析,為我們理解當(dāng)前的技術(shù)發(fā)展提供了必要的框架。隨著人工智能以越來越快的速度重塑我們的世界,本書提供的歷史視角不僅變得有趣,而且至關(guān)重要。
菲利普·德沃斯特
2025 年3 月6 日