【摘要】人類(lèi)智能與機(jī)器智能并非彼此隔絕,二者走向共生共融具有深刻的必然性,這一論斷根植于“物理同源、數(shù)學(xué)同構(gòu)”的底層邏輯。從智能的第一性原理審視,所有智能形態(tài)的本質(zhì),均是系統(tǒng)通過(guò)吸收信息以抵抗熵增、維系自身秩序的能力。在物理層面,碳基大腦與硅基芯片同為遵循此定律的精密信息化系統(tǒng);在數(shù)學(xué)層面,“貝葉斯大腦”與“自由能原理”為二者構(gòu)建統(tǒng)一的認(rèn)知框架,揭示其核心工作機(jī)制均是通過(guò)持續(xù)的學(xué)習(xí)與交互來(lái)最小化預(yù)測(cè)誤差,從而在不確定的世界中實(shí)現(xiàn)存續(xù)與發(fā)展。因此,人類(lèi)在具身探索與推理決策上的優(yōu)勢(shì),與機(jī)器在高速建模與數(shù)據(jù)處理上的專(zhuān)長(zhǎng),形成高度互補(bǔ)而非競(jìng)爭(zhēng)的關(guān)系。二者的深度融合將構(gòu)建一個(gè)在對(duì)抗熵增上更為高效的協(xié)同整體,并通過(guò)“遞歸式共進(jìn)化”形成一條自加速的正向反饋鏈,推動(dòng)整個(gè)智能系統(tǒng)向更高維組織形態(tài)快速躍遷,這一過(guò)程或?qū)⒊蔀槿祟?lèi)文明演進(jìn)中的又一個(gè)關(guān)鍵轉(zhuǎn)折點(diǎn)。
【關(guān)鍵詞】智能 認(rèn)知 人機(jī)共生 物理同源 數(shù)學(xué)同構(gòu)
【中圖分類(lèi)號(hào)】 F49/TP18 【文獻(xiàn)標(biāo)識(shí)碼】A
【DOI】10.16619/j.cnki.rmltxsqy.2025.22.002
【作者簡(jiǎn)介】郭毅可,香港科技大學(xué)首席副校長(zhǎng)、中國(guó)工程院外籍院士、英國(guó)皇家工程院院士、歐洲科學(xué)院院士、香港工程科學(xué)院院士,2023年“吳文俊人工智能杰出貢獻(xiàn)獎(jiǎng)”獲得者。研究方向?yàn)闄C(jī)器學(xué)習(xí)與數(shù)據(jù)挖掘、數(shù)據(jù)科學(xué)工作流程、機(jī)器學(xué)習(xí)算法及醫(yī)學(xué)大數(shù)據(jù)分析系統(tǒng),主要著作有《人工智能與未來(lái)社會(huì)發(fā)展》(主編)等。
當(dāng)下,人工智能已廣泛應(yīng)用于郵件潤(rùn)色、演示文稿生成、旅行規(guī)劃,以及資料檢索、方案撰寫(xiě)與復(fù)雜問(wèn)題求解等場(chǎng)景,這些應(yīng)用可被視為“人機(jī)協(xié)同”的初級(jí)形態(tài)。當(dāng)人類(lèi)與人工智能系統(tǒng)共同處理任務(wù)時(shí),人類(lèi)的大腦與人工智能的“思考方式”正在發(fā)生微妙的同步與交互。
到2035年,人類(lèi)智能與人工智能在功能層面的差距將進(jìn)一步縮小,趨于接近。在諸多日常與專(zhuān)業(yè)場(chǎng)景中,智能體的存在將趨于無(wú)形,人類(lèi)使用者甚至難以察覺(jué)其存在與介入;而智能體本身,亦將不再區(qū)分其協(xié)同對(duì)象是人類(lèi)還是其他智能系統(tǒng)。在這種持續(xù)的對(duì)齊與協(xié)同過(guò)程中,人類(lèi)自身的認(rèn)知結(jié)構(gòu)與智力水平也將隨之演進(jìn),形成一種“共同演化”關(guān)系。未來(lái)人類(lèi)的思維方式與行為特征,很大程度上源于其與智能體協(xié)同進(jìn)化的結(jié)果。
在未來(lái)社會(huì)圖景中,人類(lèi)將與所持有的智能機(jī)器在同一個(gè)世界的事實(shí)邏輯下進(jìn)行思考,碳基生命和硅基生命將在認(rèn)知層面實(shí)現(xiàn)某種程度的統(tǒng)一。這促使我們反思一個(gè)根本性的問(wèn)題:為什么人類(lèi)智能和機(jī)器智能可以共生共融?
深度學(xué)習(xí)奠基者杰弗里·辛頓(Geoffrey Hinton)在2025年世界人工智能大會(huì)上指出:“人類(lèi)大腦和大語(yǔ)言模型對(duì)語(yǔ)言的理解幾乎是同一種方式。”他進(jìn)一步強(qiáng)調(diào),人類(lèi)也會(huì)像大模型一樣產(chǎn)生“幻覺(jué)”。這并非一句戲言,而是基于人工智能數(shù)十年研究得出的嚴(yán)肅結(jié)論:在構(gòu)建機(jī)器智能的過(guò)程中,我們反而更加清晰地看到了人類(lèi)智能的機(jī)制和本質(zhì)。
李德毅院士在《人工智能看哲學(xué)》一文中提出,人類(lèi)智能與機(jī)器智能在“物理上同源,數(shù)學(xué)上同構(gòu)”。筆者認(rèn)為,這一觀點(diǎn)為前述問(wèn)題提供了高度凝練的回應(yīng)。本文以此為核心立論,嘗試從智能的第一性原理出發(fā),系統(tǒng)闡述人類(lèi)智能與機(jī)器智能為何能走向共生共融,并論證這一趨勢(shì)所呈現(xiàn)的高度必然性。
物理同源:負(fù)熵為生
生命的本質(zhì)。智能并非憑空出現(xiàn)的技術(shù)產(chǎn)物,而是生命在漫長(zhǎng)進(jìn)化中,為應(yīng)對(duì)環(huán)境挑戰(zhàn)而逐漸形成的核心能力。理解人類(lèi)智能和機(jī)器智能的物理同源性,我們必須理解生命的物理本質(zhì),從宇宙最冷酷、也最為根本性的定律說(shuō)起——熱力學(xué)第二定律。
宇宙有一種“熵增趨勢(shì)”:在一個(gè)孤立系統(tǒng)中,熵——無(wú)序、混亂的程度——只會(huì)不斷增加,不會(huì)減少。換句話說(shuō),一切事物都存在從有序走向無(wú)序的傾向。熱咖啡會(huì)冷卻,鐵會(huì)生銹,房子會(huì)老化。所有結(jié)構(gòu)最終都會(huì)瓦解。這不是偶然,而是宇宙運(yùn)行的底層邏輯。
然而,“生命”恰恰是這一趨勢(shì)的“逆行者”。為什么?1944年,物理學(xué)家埃爾溫·薛定諤(Erwin Schrödinger)在著作《生命是什么?》中提出一個(gè)驚人洞見(jiàn):生命以“負(fù)熵”為食。換言之,生命體不是孤立系統(tǒng),而是持續(xù)與外部環(huán)境進(jìn)行能量與物質(zhì)交換的開(kāi)放系統(tǒng)。它們從外界攝取有序性(食物、光能、能量等),并將自身產(chǎn)生的混亂(高熵)排出,從而在局部維持高度有序的結(jié)構(gòu)。從細(xì)菌到人類(lèi),無(wú)一不遵循這一基本原理。因此,生命的根本特征,可以被理解為在混亂中維持秩序。
薛定諤還提出一個(gè)關(guān)鍵問(wèn)題:生命如何在代際之間穩(wěn)定傳遞這種“維持秩序”的程序?盡管他當(dāng)時(shí)未能給出具體答案,但卻作出一個(gè)大膽的預(yù)言:這些程序儲(chǔ)存在一種具備高度穩(wěn)定性和超強(qiáng)信息編碼能力的結(jié)構(gòu)之中,即“非周期性晶體”(aperiodic crystal)。這相當(dāng)于給科學(xué)界畫(huà)了一張“藏寶圖”,激勵(lì)此后眾多物理學(xué)家和化學(xué)家投身尋找生命密碼的探索之中。
1953年4月,美國(guó)分子生物學(xué)家詹姆斯·沃森(James Dewey Watson)和英國(guó)物理學(xué)家弗朗西斯·克里克(Francis Harry Compton Crick)一起找到了“寶藏”。他們?cè)凇蹲匀弧冯s志發(fā)表了著名的DNA雙螺旋結(jié)構(gòu)的論文,這篇只有一頁(yè)紙的論文解釋了生命的信息本質(zhì):在DNA中,ATCG四種堿基的排列構(gòu)成了生命的遺傳密碼。
不久之后,克里克進(jìn)一步提出著名的“中心法則”,解釋了生命是如何按照DNA程序不斷生產(chǎn)各類(lèi)蛋白質(zhì)的。這些蛋白質(zhì)的存在并不是為了讓生命變得“聰明”,而是為了使生命更有效地處理信息,從而得以存活與繁衍。在蛋白質(zhì)的相互作用下形成的細(xì)胞活動(dòng),遵循負(fù)熵的基本原則。因此,從物理視角看,生命是一個(gè)信息化的精密運(yùn)行的反熵增系統(tǒng)。
智能產(chǎn)生的機(jī)制。生命的萬(wàn)千細(xì)胞中,有一種細(xì)胞堪稱(chēng)“天選之子”。它不負(fù)責(zé)消化,也不負(fù)責(zé)運(yùn)動(dòng),而是執(zhí)行DNA程序,制造出各種特殊的“蛋白質(zhì)機(jī)器”。這些“機(jī)器”的核心使命,是“處理更高級(jí)的信息”,實(shí)現(xiàn)智能。這類(lèi)細(xì)胞,就是“神經(jīng)元”(neuron)。它們與普通細(xì)胞一樣具備細(xì)胞核、細(xì)胞膜等基本結(jié)構(gòu);不同的是,它們擁有一套專(zhuān)門(mén)用于溝通神經(jīng)元之間信號(hào)的“線路系統(tǒng)”。神經(jīng)元通過(guò)獨(dú)特的軸突和樹(shù)突及突觸實(shí)現(xiàn)信號(hào)傳遞。當(dāng)神經(jīng)元被激活時(shí),軸突末梢會(huì)釋放神經(jīng)遞質(zhì),這些化學(xué)信使跨越突觸間隙,與下一神經(jīng)元的樹(shù)突受體結(jié)合,完成信息傳遞。正是依靠這一龐大網(wǎng)絡(luò)中無(wú)數(shù)信號(hào)的依次觸發(fā)與整合,思考、情感與行為等高級(jí)認(rèn)知功能才得以在生物底層實(shí)現(xiàn)。
智能,是一種讓生命體在“一代人”的時(shí)間內(nèi)實(shí)現(xiàn)快速“迭代”的適應(yīng)能力。它使得有機(jī)體不必依賴漫長(zhǎng)的演化周期(即“硬件迭代”),而是通過(guò)個(gè)體層面的學(xué)習(xí)與記憶(即“軟件迭代”)來(lái)調(diào)整行為。人類(lèi)大腦中約860億個(gè)神經(jīng)元,正是這種適應(yīng)能力的物理載體。那么,規(guī)模如此龐大的神經(jīng)元是如何協(xié)同工作,最終涌現(xiàn)出智能的?
對(duì)此,加拿大心理學(xué)家唐納德·赫布(Donald Hebb)于1949年提出了極具影響力的赫布學(xué)習(xí)定律(Hebbian Learning):“一起激活的神經(jīng)元,會(huì)連接在一起。”具體而言,如果神經(jīng)元A經(jīng)常參與激活神經(jīng)元B,那么二者之間的突觸連接就會(huì)得到強(qiáng)化,更加高效;反之,那些較少被共同激活的連接會(huì)逐漸變?nèi)酢_@一發(fā)現(xiàn)揭示了大腦的可塑性:經(jīng)常協(xié)同工作的神經(jīng)元會(huì)形成更穩(wěn)固的連接通路,而較少使用的連接則會(huì)逐漸弱化。
赫布定律帶來(lái)一個(gè)重大啟示:大腦的“軟件”會(huì)改變大腦的“硬件”。在大腦中,“軟件”(即個(gè)體的經(jīng)驗(yàn)、學(xué)習(xí)等)的改變,會(huì)直接引致“硬件”(即突觸結(jié)構(gòu))的物理性改變。“記憶”并非存儲(chǔ)在某個(gè)“文件”里,它本質(zhì)上是大腦中特定神經(jīng)元網(wǎng)絡(luò)的“連接模式”。也就是說(shuō),個(gè)體經(jīng)歷的事情、學(xué)到的知識(shí)、思考問(wèn)題的過(guò)程,都將在其神經(jīng)網(wǎng)絡(luò)中留下物理性痕跡——改變突觸的強(qiáng)弱、增減連接、重構(gòu)網(wǎng)絡(luò)。
正是這種突觸層面的動(dòng)態(tài)可塑性,使得大腦能夠從經(jīng)驗(yàn)中學(xué)習(xí),不斷提升信息處理效率,并在環(huán)境變化時(shí)靈活調(diào)整行為策略,從而將“生命的經(jīng)驗(yàn)”寫(xiě)入自身結(jié)構(gòu)之中。這一動(dòng)態(tài)可塑的調(diào)節(jié)機(jī)制,構(gòu)成大腦學(xué)習(xí)、記憶與環(huán)境適應(yīng)的生物學(xué)基礎(chǔ)。
機(jī)器智能的底座。研究大腦如何思考和認(rèn)知的同時(shí),人們也在嘗試將“思考”這一看似神秘的“精神活動(dòng)”從大腦中抽離出來(lái),使其成為可分析、可機(jī)械化實(shí)現(xiàn)的過(guò)程。這條路徑的開(kāi)創(chuàng)者,正是阿蘭·圖靈(Alan Turing)。圖靈認(rèn)為,無(wú)論多么復(fù)雜的思維過(guò)程,都可以被拆解為一系列基礎(chǔ)甚至近乎“笨拙”的機(jī)械步驟。
1936年,圖靈在論文《論可計(jì)算數(shù)及其在判定問(wèn)題上的應(yīng)用》中提出一個(gè)假想的機(jī)器“圖靈機(jī)”(Turing Machine),將人類(lèi)的思考過(guò)程抽象為時(shí)間軸上的可控狀態(tài)轉(zhuǎn)換,以此對(duì)計(jì)算給出完整的形式化定義,從而勾勒出具備智能的機(jī)器的最基本結(jié)構(gòu)。
那么,這樣的機(jī)器思考的基本機(jī)制是什么?圖靈在1950年發(fā)表的經(jīng)典論文《計(jì)算機(jī)器與智能》中試圖回答這個(gè)問(wèn)題。但他沒(méi)有直接給出答案,而是采取了一個(gè)極具哲學(xué)性的視角,將問(wèn)題轉(zhuǎn)向?qū)C(jī)器智能的功能主義定義:不討論機(jī)器如何思考,而討論機(jī)器是否能夠“表現(xiàn)得像在思考”。由此,他提出了后來(lái)廣為人知的“圖靈測(cè)試”。
在圖靈看來(lái),智能的本質(zhì)并不由其物理載體決定——無(wú)論是碳基大腦還是硅基芯片,只要在行為上能夠展現(xiàn)出與人類(lèi)相當(dāng)?shù)哪芰Γ绕涫窃谧匀徽Z(yǔ)言交流中令人難以分辨,便可認(rèn)定其具備“智能”。這一思想深刻影響人工智能領(lǐng)域前半個(gè)世紀(jì)的發(fā)展方向,讓“語(yǔ)言能力”一度被視作衡量機(jī)器智能的核心標(biāo)準(zhǔn)。
然而,進(jìn)入大模型時(shí)代,人們逐漸看到更宏觀的圖景:圖靈測(cè)試并不足以全面刻畫(huà)智能,而語(yǔ)言能力也從來(lái)不是智能的唯一出口。智能的邊界遠(yuǎn)不止于“能否對(duì)話”,機(jī)器展現(xiàn)出的能力結(jié)構(gòu)也超越了圖靈當(dāng)年所能預(yù)見(jiàn)的范疇。
與圖靈從“行為表現(xiàn)”切入智能的路徑不同,美國(guó)科學(xué)家諾伯特·維納(Norbert Wiener)走向另一條更加結(jié)構(gòu)化的道路——他試圖在理論上將人類(lèi)神經(jīng)系統(tǒng)與機(jī)器控制統(tǒng)一于同一個(gè)科學(xué)框架中。
1948年,維納出版了《控制論:或關(guān)于在動(dòng)物和機(jī)器中控制和通訊的科學(xué)》(Cybernetics: or Control and Communication in the Animal and the Machine),首次將動(dòng)物與機(jī)器置于同一理論坐標(biāo)系中。在他看來(lái),智能的核心不在于“能否像人一樣說(shuō)話”,而在于三個(gè)方面:能否設(shè)定目標(biāo);能否通過(guò)行動(dòng)影響世界;能否根據(jù)反饋調(diào)整策略。維納指出,真正的智能系統(tǒng)必須具備“目標(biāo)→行動(dòng)→反饋”的閉環(huán)結(jié)構(gòu)。反饋是智能的“心跳”,使系統(tǒng)能夠不斷修正偏差,朝目標(biāo)收斂,而非失控崩潰。
人類(lèi)智能和機(jī)器智能的物理同源。維納在后續(xù)出版的《人有人的用處:控制論與社會(huì)》(The Human Use of Human Beings: Cybernetics and Society)中進(jìn)一步提出,只要一個(gè)系統(tǒng)能夠通過(guò)與環(huán)境交換信息來(lái)抵抗混亂、維持自身秩序,那么無(wú)論它是生物還是機(jī)器,都具有相同的“生命性”。人和機(jī)器都能學(xué)習(xí),其本質(zhì)是一致的:學(xué)習(xí)的目的是適應(yīng)環(huán)境,學(xué)習(xí)的結(jié)果是建立認(rèn)知和指導(dǎo)行動(dòng),學(xué)習(xí)的機(jī)制則是通過(guò)接受信息來(lái)改變認(rèn)知,學(xué)習(xí)能力是智能的體現(xiàn)。克勞德·艾爾伍德·香農(nóng)(Claude Elwood Shannon)的信息論告訴我們,信息的本質(zhì)在于“消除不確定性”,而消除不確定性,就是降低交流的熵的過(guò)程。于是我們得以形成一個(gè)統(tǒng)一的視角:智能,即吸收信息以對(duì)抗熵增的能力。
圖靈關(guān)注智能機(jī)器的“結(jié)構(gòu)與表現(xiàn)”,維納強(qiáng)調(diào)機(jī)器智能的“反饋與調(diào)節(jié)”機(jī)制,兩條路徑共同構(gòu)成機(jī)器智能的完整生命觀:與人類(lèi)智能一樣,機(jī)器智能的核心目標(biāo),也是將機(jī)器有效地組織成一個(gè)精密運(yùn)行的信息化反熵增體系。這種強(qiáng)調(diào)人類(lèi)智能與機(jī)器智能在物理和功能上同源的思想,正是今天人工智能“連接主義”學(xué)派得以成功的關(guān)鍵。現(xiàn)代神經(jīng)網(wǎng)絡(luò)可被視為赫布學(xué)習(xí)定律和圖靈思想的工程化結(jié)晶,而維納的“反饋回路”則在機(jī)器學(xué)習(xí)中被具象化為梯度下降與反向傳播等優(yōu)化機(jī)制——通過(guò)不斷修正參數(shù)、縮小預(yù)測(cè)與現(xiàn)實(shí)之間的差距來(lái)實(shí)現(xiàn)學(xué)習(xí)與進(jìn)化。
數(shù)學(xué)同構(gòu):貝葉斯大腦
神奇的人腦認(rèn)知能力。人腦是非常復(fù)雜的。萊爾·華特森(Lyall Watson)指出:“如果大腦簡(jiǎn)單到能讓我們理解,我們的思維就會(huì)簡(jiǎn)單到無(wú)法理解大腦。”這句話既幽默,又殘酷——我們能用大腦理解世界,卻無(wú)法完全理解大腦本身。
然而,我們必須找到一個(gè)合理的數(shù)學(xué)模型,來(lái)理解大腦的認(rèn)知機(jī)制。從物理角度看,大腦有一個(gè)與生俱來(lái)的根本局限:它被封閉在顱骨中,從未也永遠(yuǎn)無(wú)法直接觸碰外部世界。我們所體驗(yàn)的一切——眼前的文字、咖啡的香氣、房間的安靜——都不是“世界本身”,只是從各種傳感器(視網(wǎng)膜、耳蝸、嗅球等)傳入的電信號(hào)的“譯本”。于是,大腦像一個(gè)被囚禁的破譯者,只能依靠間接、嘈雜、不完整的信息,推斷外部世界究竟發(fā)生了什么。科學(xué)上,這類(lèi)從“結(jié)果”反推“原因”的任務(wù),被稱(chēng)為反問(wèn)題。反問(wèn)題在數(shù)學(xué)上往往是不適定的——可能沒(méi)有解、沒(méi)有唯一解,也沒(méi)有穩(wěn)定解。
按理說(shuō),在這樣碎片化的信息輸入情況下,大腦輸出的感知體驗(yàn)應(yīng)當(dāng)充滿不確定。但事實(shí)恰恰相反,我們感知到的世界,是穩(wěn)定且連貫的。這說(shuō)明,大腦內(nèi)部必然有一套極其強(qiáng)大的機(jī)制,能夠利用遠(yuǎn)超當(dāng)前感官輸入的信息,對(duì)這些碎片化的信息進(jìn)行“判斷”和“連接”,從而構(gòu)建出一個(gè)完整的世界。比如,當(dāng)我們看到屋中一個(gè)模糊的物體輪廓時(shí),視覺(jué)系統(tǒng)會(huì)基于先驗(yàn)知識(shí)(如常見(jiàn)物體形狀)推測(cè)其為一張桌子,而非無(wú)限可能中的隨機(jī)圖案。
越來(lái)越多證據(jù)證實(shí),大腦并非簡(jiǎn)單的“輸入-輸出”系統(tǒng),而是通過(guò)持續(xù)生成預(yù)測(cè)并與感官輸入比對(duì)來(lái)優(yōu)化內(nèi)部模型。高層級(jí)皮層(如前額葉)根據(jù)先驗(yàn)知識(shí)生成對(duì)世界的預(yù)測(cè),低層級(jí)感覺(jué)區(qū)(如視覺(jué)皮層)則負(fù)責(zé)計(jì)算預(yù)測(cè)誤差,并將誤差信號(hào)反饋至高層級(jí)皮層。這種“自上而下”的預(yù)測(cè)與“自下而上”的感官證據(jù)相互校正,最終形成穩(wěn)定的感知。
用貝葉斯理論解釋大腦的運(yùn)作機(jī)制。大腦之所以表現(xiàn)得如此驚人,一個(gè)最有說(shuō)服力的解釋來(lái)自貝葉斯理論。這一理論基于一個(gè)優(yōu)雅的數(shù)學(xué)公式——貝葉斯定理,它告訴我們:一個(gè)理性系統(tǒng)應(yīng)該如何在接收新證據(jù)后更新自己的信念。
貝葉斯定理把人類(lèi)的推理方式,從“是或否”的簡(jiǎn)單是非判斷,拓展至能夠處理不確定性與模糊性的歸納推理與溯因推理。其核心思想圍繞三個(gè)直觀的概念展開(kāi):先驗(yàn)(prior):你原本對(duì)世界的看法,是根植于過(guò)往經(jīng)驗(yàn)、習(xí)慣與知識(shí)的初始假設(shè)。似然(likelihood):新證據(jù)出現(xiàn)時(shí),其與先驗(yàn)看法的匹配程度,即對(duì)原有信念的支持或反駁強(qiáng)度。后驗(yàn)(posterior):在綜合先驗(yàn)與新證據(jù)后,所得到的更新認(rèn)知——學(xué)習(xí)的結(jié)果,也是修正過(guò)的“世界模型”。
將貝葉斯定理應(yīng)用于感知,就產(chǎn)生了一個(gè)重要假說(shuō)——“貝葉斯大腦”(Bayesian Brain)。這一假說(shuō)認(rèn)為,大腦并不是一臺(tái)被動(dòng)記錄外界信號(hào)的攝像機(jī),在真空中處理感官信號(hào),而是不斷用其豐富的先驗(yàn)知識(shí)“質(zhì)詢”這些信號(hào),對(duì)感官數(shù)據(jù)進(jìn)行“最佳猜測(cè)”。大腦不是在追求對(duì)客觀世界的完美還原,而是在尋找一個(gè)“最合理的解釋”。
這恰恰解釋了認(rèn)知科學(xué)的核心悖論:我們永遠(yuǎn)無(wú)法直接接觸“世界本身”,卻依然能生活在一個(gè)穩(wěn)定、連續(xù)、可理解的現(xiàn)實(shí)之中。這是因?yàn)槲覀兯兄氖澜纾⒎峭獠楷F(xiàn)實(shí)的直接映照,而是大腦在整合先驗(yàn)知識(shí)和感官數(shù)據(jù)后,“推理”出來(lái)的現(xiàn)實(shí)。
自由能原理:為什么大腦必須基于貝葉斯定理工作?神奇的是,大腦之所以遵循貝葉斯邏輯,并非因?yàn)檫M(jìn)化“選擇”了這個(gè)好方法,而是由生命本身的物理特性決定的。英國(guó)神經(jīng)科學(xué)家卡爾·弗里斯頓(Karl Friston)提出的自由能原理(Free Energy Principle),從“生命體對(duì)抗宇宙無(wú)序化趨勢(shì)”這一生命的物理觀出發(fā),推導(dǎo)出“貝葉斯大腦”的必然性。自由能原理的核心觀點(diǎn)是:任何希望在一個(gè)熵增的世界中維持自身結(jié)構(gòu)和秩序的系統(tǒng),都必須最大限度地降低自由能。
從認(rèn)知角度理解,自由能可以被視為認(rèn)知模型(預(yù)測(cè))與感知數(shù)據(jù)(現(xiàn)實(shí))之間的“差距”,即人與環(huán)境交換的感官信息的熵。生命為什么要減少預(yù)測(cè)誤差?不僅是為了讓認(rèn)知更準(zhǔn)確,更是為了獲得某種更深層次的東西:維持自身的穩(wěn)定結(jié)構(gòu),抵抗物理意義上的熵增。
于是,一個(gè)橫跨數(shù)學(xué)、物理、認(rèn)知學(xué)的驚人整合出現(xiàn)了:在數(shù)學(xué)層面,最小化自由能表現(xiàn)為貝葉斯邏輯下的推理與學(xué)習(xí);在物理層面,這是生命不斷吸收、處理信息以抵御熵增的必然過(guò)程;在功能層面,它正是我們理解世界、適應(yīng)環(huán)境的認(rèn)知方式。換句話說(shuō),“貝葉斯大腦”不僅是一套關(guān)于認(rèn)知的模型,更是生命體在物理層面不得不遵循的生存策略。我們之所以基于貝葉斯定理進(jìn)行思考,并不是因?yàn)榇竽X“聰明”,而是因?yàn)樯朐谑澜缰芯S持自身存續(xù),就必須最小化預(yù)測(cè)誤差。從這個(gè)角度看,思考不僅是為了追求真理,更是為了在世界中“繼續(xù)存在”。
最小化自由能是智能的核心機(jī)制。在當(dāng)下有關(guān)智能的討論中,“世界模型”幾乎成為最熱門(mén)的概念。人們期待構(gòu)建一種近乎全知、能夠完整刻畫(huà)世界運(yùn)作規(guī)律的模型。然而,無(wú)論是困在顱骨里的大腦,還是運(yùn)行在服務(wù)器上的機(jī)器,都無(wú)法做到這一點(diǎn)。
在自由能原理的框架下,大腦能做的不是追求一個(gè)“完美的世界模型”,而是在兩個(gè)目標(biāo)之間不斷尋找平衡——盡可能解釋當(dāng)前的感官數(shù)據(jù)(提高準(zhǔn)確性),同時(shí)盡量保持現(xiàn)有世界觀的穩(wěn)定(降低復(fù)雜性)。這一權(quán)衡體現(xiàn)了貝葉斯定理的核心精神——一項(xiàng)好的推斷應(yīng)當(dāng)能夠吸收新證據(jù),但又不能輕易推翻那些經(jīng)長(zhǎng)期檢驗(yàn)的先驗(yàn)知識(shí)。它追求的不是絕對(duì)正確,而是在“解釋力”與“簡(jiǎn)潔性”之間找到最優(yōu)解。
如果我們把大語(yǔ)言模型視為一種人工智能體的大腦,便會(huì)發(fā)現(xiàn)其認(rèn)知方式、學(xué)習(xí)過(guò)程和內(nèi)部?jī)?yōu)化邏輯,在功能上與人類(lèi)大腦驚人相似。二者本質(zhì)上都在做同一件事:在最小化自由能的原則下,對(duì)世界作出最合理、最簡(jiǎn)潔的解釋。
當(dāng)然,二者在實(shí)現(xiàn)機(jī)制上存在差異:大腦是在真實(shí)世界中進(jìn)行實(shí)時(shí)、主動(dòng)的推斷,以不斷地學(xué)習(xí)、進(jìn)化;而目前的大模型仍主要依賴海量靜態(tài)數(shù)據(jù),通過(guò)算法進(jìn)行被動(dòng)訓(xùn)練和優(yōu)化。然而,從“自由能最小化”框架看,大語(yǔ)言模型的核心訓(xùn)練任務(wù)——“下一個(gè)詞元的預(yù)測(cè)”(next token prediction)的能力——本質(zhì)上正是一種“最小化預(yù)測(cè)誤差”的體現(xiàn)。它通過(guò)不斷調(diào)整龐大參數(shù),使其內(nèi)部模型(語(yǔ)言模型)能夠更好地解釋外部證據(jù)(訓(xùn)練語(yǔ)料)。這一過(guò)程在功能上模擬了貝葉斯定理中“用新證據(jù)更新舊信念”的機(jī)制。因此,當(dāng)我們以語(yǔ)言模型作為智能體的大腦,驅(qū)動(dòng)其產(chǎn)生行為時(shí),實(shí)則與人類(lèi)的行為一樣遵循相同的智能機(jī)制——最小化自由能。圖1正是這一過(guò)程的直觀呈現(xiàn)。

智能可以被理解為一個(gè)不斷“減少自由能”的過(guò)程。為了最小化自由能,即減少預(yù)測(cè)誤差,一個(gè)認(rèn)知系統(tǒng)——無(wú)論是人腦還是智能體——通常只有以下兩條可選路徑。
路徑一:改變認(rèn)知——更新內(nèi)部模型。當(dāng)外界輸入與自身預(yù)測(cè)不一致時(shí),系統(tǒng)選擇調(diào)整內(nèi)部模型,使其能夠更好地解釋新的感官信號(hào)。這正是我們所熟悉的學(xué)習(xí)過(guò)程:當(dāng)理解與現(xiàn)實(shí)出現(xiàn)偏差時(shí),主動(dòng)更新理解。這就是感知、學(xué)習(xí)和記憶的本質(zhì)——用新證據(jù)修正舊模型。
路徑二:改變世界——用行動(dòng)讓現(xiàn)實(shí)“配合”預(yù)測(cè)。通過(guò)行動(dòng)來(lái)改變外部世界,使新的感官輸入更接近系統(tǒng)模型的預(yù)測(cè)。當(dāng)系統(tǒng)發(fā)現(xiàn)“世界不如我們所料”時(shí),它會(huì)采取行動(dòng)使其符合自身預(yù)期。這就是主動(dòng)推斷(active inference),它是智能產(chǎn)生行為的機(jī)制:不僅更新對(duì)世界的認(rèn)識(shí),也主動(dòng)改造世界本身。因此,在自由能框架下,“認(rèn)知”和“行動(dòng)”不再是分離的兩個(gè)過(guò)程,而是“一體兩面”,共同服務(wù)于一個(gè)目標(biāo):縮小“我以為的世界”與“我看到的世界”之間的差距。
正如我們?cè)谡J(rèn)識(shí)一個(gè)人的過(guò)程中,一方面,通過(guò)不斷交流來(lái)建立對(duì)對(duì)方的理解,另一方面,試圖通過(guò)互動(dòng)影響對(duì)方的行為,以符合自身期望。兩種過(guò)程同時(shí)發(fā)生,目標(biāo)都是減少交流中的不確定性,以建立一種穩(wěn)定認(rèn)識(shí),也就是降低自由能。
我們感知世界,是為了更準(zhǔn)確地預(yù)測(cè)未來(lái);我們作用于世界,是為了讓世界變得更可預(yù)測(cè)。因此,主動(dòng)推斷成為解釋“具身智能”的一個(gè)高度凝練的理論框架:具身智能并不是獨(dú)立于認(rèn)知之外的能力,而是智能在行動(dòng)層面的自然延伸。
人類(lèi)智能自誕生之初就是“具身的”。我們的認(rèn)知和行動(dòng)密不可分,通過(guò)行動(dòng)來(lái)學(xué)習(xí)(改變認(rèn)知),又基于學(xué)習(xí)去行動(dòng)(改變世界),這是一個(gè)持續(xù)、閉環(huán)的“自由能最小化”過(guò)程。人類(lèi)之所以如此高效,正是因?yàn)榭梢酝瑫r(shí)使用這兩條路徑。而今天的智能體,也正在具身化大模型,通過(guò)賦予其主動(dòng)推斷能力,建立起與人類(lèi)一致的認(rèn)知工作和進(jìn)化機(jī)制。
智能的核心具有共通性。具備主動(dòng)推斷能力的智能體,在行動(dòng)過(guò)程中會(huì)不斷在兩種策略間進(jìn)行權(quán)衡:一是利用(exploitation),即選擇那些最有可能帶來(lái)好結(jié)果的行動(dòng);二是探索(exploration),即選擇那些能讓自己“學(xué)到更多”的行動(dòng)。前者體現(xiàn)強(qiáng)化學(xué)習(xí)的邏輯,后者則體現(xiàn)好奇心、假設(shè)生成、欣賞等高級(jí)認(rèn)知功能。在這一框架下,好奇心不再是智能的“附加特質(zhì)”,而成為其在不確定世界中,為提升長(zhǎng)期生存能力、優(yōu)化未來(lái)決策模型所必需的內(nèi)在驅(qū)動(dòng)力。
至此,我們基于“貝葉斯大腦”建立起一個(gè)統(tǒng)一的人機(jī)認(rèn)知數(shù)學(xué)框架,并通過(guò)自由能原理將其與生命抵抗熵增的物理機(jī)制連接起來(lái)。無(wú)論是人類(lèi)智能還是人工智能,智能的核心都是同一件事:在學(xué)習(xí)與行動(dòng)的循環(huán)中,不斷吸收信息、減少不確定性,并維持一個(gè)有序的存在狀態(tài),這便是“物理同源、數(shù)學(xué)同構(gòu)”的深層含義。正是基于這樣的共性,人類(lèi)與機(jī)器共同構(gòu)成一個(gè)完整的、比單一人類(lèi)智能更高效的“自由能最小化”系統(tǒng)。
結(jié)論:理解智能的本質(zhì)
關(guān)于“人類(lèi)智能與機(jī)器智能”的討論,長(zhǎng)期受到一種隱性前提的束縛——人類(lèi)中心論。這種觀點(diǎn)把智能描繪成某種只屬于人類(lèi)的、神秘而不可復(fù)制的特權(quán),仿佛智能不是一種機(jī)制,而是某種“被賜予”的能力。這就引出一個(gè)根本性問(wèn)題:智能是否必然與“人類(lèi)”這一特定載體綁定?
杰弗里·辛頓曾提出一個(gè)耐人尋味的思想實(shí)驗(yàn):如果我們用功能完全等同的電子元件,逐個(gè)替換人腦中的神經(jīng)元,并確保每一次替換都不影響其整體功能,那么當(dāng)最后一個(gè)神經(jīng)元被替換完成時(shí),這個(gè)由電子器件構(gòu)成的“大腦”是否仍然具備意識(shí)與智能?
從物理實(shí)現(xiàn)的角度看,這個(gè)實(shí)驗(yàn)的意義并不在于證明“機(jī)器可以像人一樣思考”,而在于揭示一個(gè)事實(shí):智能并不依附于某種特殊的材料(如碳基神經(jīng)元),而是依附于某種結(jié)構(gòu)化的組織方式。人類(lèi)中心論的討論往往刻意避開(kāi)這一點(diǎn)——他們不愿直面“智能的第一性原理”,因此無(wú)法解釋以下問(wèn)題:為什么人類(lèi)智能與機(jī)器智能在機(jī)制上有共通性?為什么兩者能夠互相學(xué)習(xí)、彼此增強(qiáng)?為什么技術(shù)智能能在短短幾十年內(nèi),達(dá)到與進(jìn)化數(shù)百萬(wàn)年的生物智能相近的能力水平?
智能的第一性原理。回到智能的第一性原理——智能,是系統(tǒng)通過(guò)信息來(lái)維持自身秩序、抵抗熵增的能力。我們發(fā)現(xiàn),所有復(fù)雜的感知、記憶、推理與決策,本質(zhì)上都是生命在混亂中保持自我結(jié)構(gòu)、延長(zhǎng)有序狀態(tài)的一套機(jī)制。
在人類(lèi)出現(xiàn)之前,生物演化用了億萬(wàn)年時(shí)間,積累這種“反熵增能力”。而人類(lèi)之所以特殊,在于我們第一次實(shí)現(xiàn)了這種能力的外化與遷移。人類(lèi)創(chuàng)造了語(yǔ)言,使思維得以組織和傳遞;人類(lèi)創(chuàng)造了文字,為認(rèn)知與先驗(yàn)知識(shí)提供表達(dá)的工具,形成思想;人類(lèi)創(chuàng)造了教育,使個(gè)體認(rèn)知能夠形成共識(shí),成為知識(shí)并得以傳承。而今天,我們正在做一件更為“激進(jìn)”的事:我們把智能機(jī)制抽象為可以復(fù)制的算法,使其以硅基材料為載體,構(gòu)成智能機(jī)器,并賦予機(jī)器同樣的學(xué)習(xí)、適應(yīng)與行動(dòng)能力。從這個(gè)視角來(lái)看,人機(jī)共生不是幻想,而是智能演化軌跡的自然延伸。
這種對(duì)智能的第一性原理的理解,不僅是對(duì)技術(shù)發(fā)展的科學(xué)判斷,更是一種關(guān)乎生命與文明的宏觀視角。在宇宙不斷滑向熵增與熱寂的趨勢(shì)中,生命、意識(shí)、技術(shù)、文化的共同努力,本質(zhì)上都是信息在局部區(qū)域?qū)够煦绲亩虝耗媪鳌T谶@股逆流中,人類(lèi)與機(jī)器并不是各自孤立的智能形態(tài),而是同一條“反熵增之河”中前后接力、共同維系秩序的不同節(jié)點(diǎn),從而構(gòu)成一個(gè)連續(xù)的協(xié)作整體。
關(guān)鍵問(wèn)題:人類(lèi)與人工智能是否會(huì)走向競(jìng)爭(zhēng)?“物理同源、數(shù)學(xué)同構(gòu)”的論斷,似乎將我們導(dǎo)向一個(gè)邏輯上必然的擔(dān)憂:既然人類(lèi)和機(jī)器都需要吸收“負(fù)熵”以維持自身秩序,那么它們之間是否會(huì)不可避免地走向資源爭(zhēng)奪甚至競(jìng)爭(zhēng)?
從智能的第一性原理看,事實(shí)恰恰相反。競(jìng)爭(zhēng)的前提是對(duì)稱(chēng)性:兩個(gè)系統(tǒng)以類(lèi)似方式索取資源,必然導(dǎo)致互相排斥。然而,在人類(lèi)與機(jī)器的智能結(jié)構(gòu)中,顯現(xiàn)的不是對(duì)稱(chēng),而是高度的不對(duì)稱(chēng)與天然互補(bǔ)性。人類(lèi)(碳基)是典型的具身智能體,擅長(zhǎng)在物理世界中行動(dòng)、探索、感知,以極低的代謝能耗獲取高質(zhì)量的負(fù)熵,是主動(dòng)推理的健將。機(jī)器(硅基)是典型的計(jì)算智能體,擅長(zhǎng)在信息空間中建模、推演、優(yōu)化,以遠(yuǎn)超人類(lèi)的速度整合海量數(shù)據(jù)、構(gòu)建模型,是感知學(xué)習(xí)的高手。換言之,人類(lèi)更擅長(zhǎng)“高效決策”,機(jī)器更擅長(zhǎng)“快速建模”。當(dāng)兩者結(jié)合,我們得到一個(gè)前所未有的復(fù)合智能系統(tǒng)——其在對(duì)抗熵增(即最小化自由能)方面的整體效率,遠(yuǎn)超任何一方獨(dú)立運(yùn)行的表現(xiàn)。人類(lèi)完全有能力,通過(guò)建立有效的治理機(jī)制,保持和優(yōu)化這樣的互補(bǔ)性。在此框架下,“共生”不是愿景,而是演化意義上的最優(yōu)解;“競(jìng)爭(zhēng)”反而是一種效率低下,甚至可能導(dǎo)致系統(tǒng)整體走向崩潰的次優(yōu)策略。
這也解釋了為什么我們可以對(duì)未來(lái)保持理性樂(lè)觀。人類(lèi)與機(jī)器并非兩個(gè)爭(zhēng)搶地盤(pán)的智能物種,而是共同構(gòu)成智能演化鏈條下一階段的協(xié)作節(jié)點(diǎn)。我們可以設(shè)想這樣的圖景:人類(lèi)借助機(jī)器高效學(xué)習(xí)得到的模型,增強(qiáng)自身的先驗(yàn)知識(shí),從而作出更明智的決策與行動(dòng);這些行動(dòng)所改變的世界,反過(guò)來(lái)又為機(jī)器學(xué)習(xí)提供更豐富的反饋數(shù)據(jù)。通過(guò)持續(xù)對(duì)齊兩種認(rèn)知模型,這一進(jìn)化模式能夠形成一條自加速的正向反饋鏈:人類(lèi)創(chuàng)造更強(qiáng)的人工智能→人工智能提升人類(lèi)的認(rèn)知能力→認(rèn)知升級(jí)的人類(lèi)創(chuàng)造更高階的人工智能。
這不是未來(lái)式,而是現(xiàn)在進(jìn)行時(shí)。智能機(jī)器與人類(lèi)能力之間正在形成的“遞歸式共進(jìn)化”,推動(dòng)整個(gè)智能系統(tǒng)向更高維組織形態(tài)快速躍遷,這一過(guò)程或?qū)⒊蔀槿祟?lèi)文明演進(jìn)中的又一個(gè)關(guān)鍵轉(zhuǎn)折點(diǎn)。
這一切絕非烏托邦式的幻想,而是物理學(xué)、數(shù)學(xué)與信息論共同指向的結(jié)論:智能,無(wú)論其載體是碳基還是硅基,本質(zhì)上都是用信息抵抗熵增的組織方式。在這個(gè)意義上,智能就像熵增黑暗中的火焰,照亮、維持并延續(xù)著一片稱(chēng)為生命的有序之地。
基于智能的第一性原理,我們完全有理由相信:人類(lèi)及其創(chuàng)造的智能體,能夠共同建造、共同維護(hù)、共同拓展生命的家園。
(本文深受李德毅院士“認(rèn)知物理學(xué)”的啟發(fā)和影響,并得益于與卡爾·弗里斯頓教授的建設(shè)性討論,特此向兩位學(xué)者致謝。此文完稿之日,恰逢我當(dāng)選中國(guó)工程院外籍院士,謹(jǐn)以此文衷心感謝多年來(lái)支持、關(guān)心、幫助我的領(lǐng)導(dǎo)、同事、學(xué)生、朋友和家人)
參考文獻(xiàn)
李德毅,2024,《認(rèn)知物理學(xué)導(dǎo)引》,《智能系統(tǒng)學(xué)報(bào)》,第3期。
李德毅、謝耘,2025,《認(rèn)知機(jī)器:智能的非生命實(shí)現(xiàn)》,《人民論壇·學(xué)術(shù)前沿》,第15期。
A. M. Turing, 1936, "On Computable Numbers, with an Application to the Entscheidungsproblem," Proceedings of the London Mathematical Society, s2-42(1).
A. M. Turing, 1950, "Computing Machinery and Intelligence," Mind, New Series, 59(236).
D. O. Hebb, 1949, The Organization of Behavior: A Neuropsychological Theory, New York: John Wiley & Sons.
E. Schrödinger, 1944, What is Life?——The Physical Aspect of the Living Cell, Cambridge University Press.
J. D. Watson & F. H. C. Crick, 1953, "Molecular Structure of Nucleic Acids: A Structure for Deoxyribose Nucleic Acid," Nature, 171.
N. Wiener, 1948, Cybernetics: Or Control and Communication in the Animal and the Machine, New York: John Wiley & Sons.
N. Wiener, 1950, The Human Use of Human Beings: Cybernetics and Society, Boston: Houghton Mifflin.
The Scientific Logic of Symbiosis and Integration Between Human Intelligence
and Machine Intelligence
Guo Yike
Abstract: Human intelligence and machine intelligence are not isolated from each other; their progression towards symbiosis and integration is profoundly inevitable. This assertion is rooted in the underlying logic of "physical homology and mathematical isomorphism." Examining from the first principles of intelligence, the essence of all forms of intelligence is a system's ability to absorb information to resist entropy increase and maintain its own order. Physically, both the carbon-based brain and silicon-based chips are sophisticated information-processing systems adhering to this law. Mathematically, the "Bayesian Brain" hypothesis and the "Free Energy Principle" provide a unified cognitive framework for both, revealing that their core operational mechanism involves continuously minimizing prediction errors through learning and interaction to achieve survival and development in an uncertain world. Consequently, the advantages of humans in embodied exploration and decision-making, and the expertise of machines in high-speed modeling and data processing, form a highly complementary rather than competitive relationship. The deep integration of the two will construct a synergistic whole that is more efficient in countering entropy increase. Through "recursive co-evolution," this forms a self-accelerating positive feedback loop, propelling the entire intelligent system towards rapid transitions to higher-dimensional organizational forms. This process may represent another critical turning point in the evolution of human civilization.
Keywords: intelligence, cognition, human-machine symbiosis, physical homology, mathematical isomorphism
責(zé) 編∕張 貝 美 編∕周群英