中醫,其實可以看成一個被訓練了五千年的大模型

晉中 (2026-03-08 19:04:16) 評論 (16)
互聯網上有一些話題,隻要輕輕碰一下,就會像在幹草堆裏扔進一根火柴。中醫就是其中之一。無論你站在哪一邊,都能在幾分鍾內感受到空氣裏迅速升溫的火藥味。有人拍案而起,有人憤而退群,有人覺得對方無知,有人覺得對方頑固。爭論往往不是為了理解,而是為了證明自己是對的。

我並不想加入這場吵架。隻是過去幾年裏,人工智能的大模型迅速崛起,它帶來的不僅是技術革命,也是一種認識世界的新方式。它像一束新的光,照在許多舊問題上,讓我們第一次有機會從另一個角度重新理解那些爭論了很久的東西。中醫就是其中之一。

如果把中醫看成一個“被訓練了五千年的大模型”,許多原本難以溝通的分歧,或許會出現新的解釋路徑。那些看似玄妙的概念,那些爭論不休的理論,那些難以用現代科學語言描述的經驗,也許能在這個類比中找到新的位置。

這篇文章想做的,是把這個角度講得更清晰一些。

大模型到底是什麽

要理解這個類比,得先把大模型本身的運作方式看得更清楚一些。

很多人以為大模型就是一個巨大的資料庫,裏麵存著無數知識,需要的時候隨手取用。事實並非如此。大模型的核心不是記憶,而是從海量文本中提取模式、壓縮規律,並在需要時生成新的語言。它更像是一套在高維空間中不斷調整的模式識別係統。

這一切從“嵌入”開始。計算機無法直接理解文字,它必須把詞語轉化為數字,並放入一個維度極高的空間裏。在這個空間中,詞語之間的距離代表它們在語義上的接近程度。模型並不是通過字麵理解“國王”和“女王”,而是通過它們在空間中的相鄰位置捕捉到它們的關係。

這些數字隨後進入神經網絡。以早期一代著名大模型為例,它由幾十層結構疊加而成,每一層都在對輸入進行不同層次的加工。你可以把它理解為一個由無數節點構成的複雜網絡,信息在其中流動、被放大或削弱,最終形成輸出。

訓練的過程並不神秘。模型的任務是根據上文預測下一個詞。剛開始時,它幾乎什麽都不會,隻能隨機輸出。每次預測錯誤,係統都會根據誤差調整網絡中的權重,讓模型在下一次更接近正確答案。這個過程重複無數次,模型逐漸從混亂中提取出規律。

最關鍵的變化發生在模型規模足夠大之後。它讀過的文本越多,參數越多,內部結構越複雜,它就越能捕捉到語言背後的深層模式。某個時刻,它突然具備了原本不具備的能力:理解上下文、進行推理、寫出結構完整的文章,甚至掌握它從未被專門訓練過的技能。這種“湧現”現象至今仍難以完全解釋。

注意力機製是另一個重要部分。它讓模型在處理長文本時知道哪些詞更關鍵,哪些關係更重要。它不是簡單地從頭到尾掃描,而是像閱讀者一樣,把注意力集中在決定意義的地方。

如果把這些過程抽象出來,大模型的本質是一套在高維空間中不斷自我修正的模式識別係統。它通過大量數據和反複訓練形成一種穩定的內部結構,使它能夠生成看似“理解”過的語言。

它不是在複述人類的話,而是在模擬一種理解世界的方式。

中醫:一部訓練了五千年的大模型

現在,讓我們試著把這套框架挪到中醫上。

乍一看,這種類比似乎有些突兀:兩千多年前的《黃帝內經》,怎麽會和今天依靠顯卡堆出來的大模型放在同一個語境裏?但如果把中醫理解為一種在漫長曆史中不斷積累、不斷篩選、不斷修正的模式識別係統,這個類比就不再顯得牽強。

中醫的“語料庫”來自五千年的臨床實踐。病例記錄、醫案、方書、驗方,師徒之間的口耳相傳,醫家在真實世界中反複觀察到的症狀組合與治療結果,這些都構成了一個規模龐大而持續增長的經驗體係。這個語料庫的時間跨度極長,類型也極為豐富,是現代任何單一醫學數據庫所難以比擬的。

中醫的“訓練方式”不是算法,而是代代醫者在臨床中的試錯與篩選。某些症狀總是一起出現,某些方藥對某些模式穩定有效,這些規律在漫長的時間裏被反複驗證,最終沉澱為“證”的概念。它不是理論推演的產物,而是長期經驗壓縮後的結果。

中醫的理論體係——陰陽、五行、髒腑、經絡、辨證論治——可以看作是這個經驗係統的結構化表達。陰陽五行像是中醫的五維語義空間,把紛繁複雜的症狀、髒腑、藥物、情誌映射到一個抽象坐標係裏,使它們之間的關係變得可描述、可推演。髒腑經絡像是中醫的網絡層次,從皮表到髒腑,從氣血到神誌,層層遞進,構成一個關於人體功能的多層結構。辨證論治則像是推理策略,把患者的症狀投射到這個空間裏,找到最接近的模式,再映射到相應的幹預方法。

方劑配伍則像是對係統的調參。辛溫、苦寒、甘平,各自調節不同的功能通路,組合在一起形成對整體狀態的調整。它不是針對單一靶點的幹預,而是對多個節點的聯合調節。

如果把中醫看成一個“以陰陽五行為嵌入空間、以髒腑經絡為結構層次、以辨證論治為推理方式、經過五千年臨床數據訓練的人體功能關係模型”,它的許多特征就變得清晰了。它不是玄學,而是一套在真實世界中不斷被驗證和修正的經驗模型。

《黃帝內經》:中醫的基礎模型 1.0

順著這個思路往下走,《黃帝內經》就像是中醫大模型的第一個基礎版本。

它並不是某一位作者在某個時間點完成的作品,無論我們如何考證其具體作者和成書過程,它對後世中醫範式的塑形作用已經是事實。它的底層材料來自更早的巫醫傳統、方技經驗和養生術,而它的理論框架則建立在陰陽五行和氣一元論之上。

其中最值得注意的是它的問答體結構。

黃帝發問,岐伯作答。

這種形式並非為了文學效果,而是一種天然的知識組織方式。它把複雜的醫學經驗拆解成一組組“問題—推理—結論”的片段,讓後世醫者在反複背誦和使用中逐漸掌握其中的思維路徑。現代 AI 中的“知識蒸餾”依靠問答對傳遞推理方式,而《黃帝內經》的問答體恰好承擔了類似的功能,隻不過它的訓練對象不是模型,而是人。

後世醫家正是在這種結構中學會了“如何思考”:先看陰陽,再看五行,再看髒腑,再看病機,最後落到方藥。它不是一套死記硬背的規則,而是一種穩定的推理方式。

正因為有了這樣一個基礎框架,中醫在兩千多年裏保持了驚人的連續性。無論時代如何變化,地域如何不同,疾病譜如何演變,中醫的核心結構始終沒有偏離這套邏輯。後來的各種流派——傷寒、溫病、滋陰、補土——都在這個框架內調整,而不是另起爐灶。

但這種穩定性也帶來了另一麵。基礎模型的強大往往意味著路徑的固化。許多中醫師把《黃帝內經》視為不可逾越的經典,從文化角度可以理解,但從知識演化的角度看,這是一種範式鎖定。第一個成功的模型會深刻影響後續所有發展的方向,它提供了秩序,也設定了邊界。

中醫診療:一種獨特的“功能孿生”

再引入一個現代概念:數字孿生。

數字孿生的核心思想,是為一個真實係統建立一個能夠隨時間變化而更新的數字模型,通過不斷輸入新的信息,讓模型與實體保持同步,從而理解其狀態、預測其變化,並在必要時進行幹預。

中醫診療的過程,其實與這種思路有某種相似之處。

望聞問切收集的不是孤立的指標,而是患者生命狀態的整體呈現。醫者在獲取這些信息後,會在腦中形成一個關於患者氣血運行、髒腑關係和整體平衡的功能性模型。所謂“肝氣鬱結”並不是一個可以直接看到的實體,而是醫者在這個模型中識別出的偏移:哪些環節失衡,哪些通路受阻,哪些功能出現了過強或過弱的變化。

治療的過程,本質上是對這個功能模型進行調整。醫者根據辨證結果選擇方藥或針灸,通過外部幹預影響模型中的關鍵節點,使其逐漸回到更穩定的狀態,而身體的實際反應則會隨之發生變化。

在這樣的理解下,穴位和經絡並不是解剖意義上的結構,而是功能網絡中的節點和通路。刺激某些部位會引發相對穩定的反應鏈,這些反應鏈在長期經驗中被不斷確認,最終形成了經絡的概念。它們的真實性不取決於能否被解剖刀找到,而在於它們在功能網絡中是否具有穩定的作用位置,是否能在臨床上產生可重複的效果。

從這個角度看,中醫構建的不是人體的物理孿生,而是人體的功能孿生。它關注的是關係、變化和調節,而不是結構、形態和位置。

認識論的衝擊:AI教會了我們什麽

近兩年 AI 的突飛猛進,不隻是技術突破,更在認識論和本體論層麵帶來了深刻衝擊。這些衝擊,恰好為我們重新理解中醫提供了全新視角。

AI 的出現像一麵鏡子,把我們長期以來習以為常的科學觀照得更加清晰,也照出了它的局限。它讓我們第一次意識到,世界的複雜性遠遠超出我們以往的想象,而知識的形態也遠比我們以為的多樣。

大模型的成功,首先動搖了科學還原主義的霸權。傳統科學依賴“分解—理解—預測”的路徑:要理解一個係統,必須拆解到最小單元,找到嚴格的因果鏈條。分子生物學、神經科學、藥理學,都是在這種範式下發展起來的。它們的成就巨大,幾乎重塑了我們對生命的理解。

但大語言模型的成功證明,複雜現象可以通過海量參數與數據關聯直接“湧現”出能力,而無需還原為可解釋的因果鏈。我們無法通過拆解每一個神經元來理解 GPT 為何能寫詩,它的有效性並不依賴於我們對它進行還原論式的解釋。這意味著“有效性”可以與“可解釋性”脫鉤。一個係統可以產生高度有效的輸出,而它的內部機製可以是不透明的黑箱。

這不正是中醫數千年的處境嗎?五千年臨床實踐、數億人次驗證、曆代醫案記載——這些本身就是大規模、長周期的真實世界驗證。中醫有效,但不一定非要按照還原論的標準“解釋清楚”才算數。

AI 重新校準了因果關聯與統計關聯的關係。在沒有顯式因果建模的前提下,大模型就能僅憑統計關聯做出很強的預測。這宣告了“無因果的智能”在功能上的可行性。

中醫的“證”就是這種統計模式的產物。古人沒有分子生物學,無法建立因果鏈條,但他們通過長期觀察發現:某些症狀總是同時出現,某些方藥總是對某些症狀有效。這種統計關聯被反複驗證後,就固化為“肝氣鬱結證”“腎陰虛證”等概念。它們不是因果機製的描述,而是高維症狀空間的聚類標簽——但在這個標簽下,幹預可以產生穩定效果。

AI 讓“功能實在”獲得了本體論辯護。大模型的智能無法歸結到某個局部,它存在於整體結構的關聯之中。這種智能看不見摸不著,但你能跟它對話,它能幫你寫代碼、解數學題——它的“實在”體現在輸入輸出的穩定映射關係上。

這為中醫的功能概念提供了強有力的辯護。穴位、經絡的真實性,不取決於解剖刀能否找到,而在於刺激合穀穴是否穩定產生口腔區域的鎮痛效果。這種可重複的功能關聯,就是它們“實在”的證據。

用哲學的術語說:穴位和經絡不是解剖實體的影子,而是中醫視角下人體真實運作的功能單元,是理解生命複雜係統的另一種實在維度。

範式衝突與功能實在:中醫爭論的真正核心

圍繞中醫的爭論持續了幾十年,甚至上百年。爭論雙方都自信滿滿,都覺得自己掌握了真理,都覺得對方荒謬可笑。可如果把爭論的聲音關掉,隻看背後的邏輯,會發現雙方其實不在同一個世界裏。中醫黑的世界是還原論的世界,真實必須可拆解、可測量、有物理對應物;中醫粉的世界是整體論的世界,真實存在於作用和關係之中。兩種世界觀的起點不同,推演路徑不同,最終形成庫恩所說的“範式不可通約性”。雙方甚至無法用同一套標準評價彼此,自然永遠爭不出結果。

爭論的激烈,往往不是因為誰對誰錯,而是因為雙方的“可見性”不同。愛因斯坦說過,理論決定我們能觀察到什麽。海森堡也說過類似的話。康德更是把這個洞見推到極致:人類無法直接認識物自體,所有觀察都被先驗範疇過濾。還原論的先驗範疇讓研究者看到細胞、分子、結構;整體論的先驗範疇讓醫者看到經絡、氣機、髒腑生克。這些都是“真實”,隻是真實的層次不同。爭論的根源之一,就在於雙方看到的世界本來就不一樣。

另一層根源來自對“實在”的不同理解。還原論認為實在必須有物理載體,必須能被顯微鏡、解剖刀、儀器設備捕捉到;功能論則認為實在可以存在於關係之中,隻要它能產生穩定的作用,就是真實。AI 的出現讓後者第一次獲得了強有力的辯護。大模型的智能不是某個節點的屬性,而是網絡整體關係長期訓練後的產物。穴位和經絡也是如此,它們的實在性不取決於解剖刀能否找到,而在於按壓足三裏是否穩定調整胃腸功能。這種可重複的功能關聯,就是它們的實在。

爭論還源於對“科學”的不同理解。中醫黑把科學等同於還原論,把雙盲試驗視為唯一的有效性標準;中醫粉把科學視為一種工具,而不是唯一的真理來源。雙盲試驗要求同質樣本,而中醫的治療恰恰是個體化幹預。用去情境化的工具檢驗高度情境化的係統,就像用尺子量溫度。不是尺子不好,而是它不適合測溫度。中醫並非完全可以用目前主流的還原論科學框架來評價,它依托的是另一套處理複雜性的知識邏輯。是否稱之為“科學”,很大程度取決於你采用怎樣的定義。

爭論的深處,還藏著對“解釋”的不同期待。還原論希望解釋是可拆解、可測量、可重複的;整體論希望解釋能指導實踐、能捕捉複雜性、能反映動態關係。AI 再次提供了一個新的參照。大模型的有效性並不依賴可解釋性。我們無法通過分析每個神經元來說明它為何能寫詩,但這並不妨礙它寫出結構完整、情感連貫的句子。中醫也是如此,它的有效性不取決於我們能否用還原論解釋它。

爭論的更深一層,是對“知識合法性”的不同判斷。還原論認為知識必須來自實驗室,必須經過嚴格的控製變量和統計檢驗;整體論認為知識可以來自長期經驗,可以來自真實世界的反複驗證。中醫的知識來自五千年的臨床實踐,來自無數醫者的生命經驗,來自代代相傳的模式識別。這不是科學意義上的“證據”,但它是一種真實世界的長期驗證。

爭論的最深處,是對“身體”的不同理解。還原論把身體看成由器官、組織、細胞組成的機器;整體論把身體看成一個動態平衡的係統,一個不斷調節、不斷適應、不斷變化的生命體。兩種理解都沒有錯,隻是角度不同。疾病在還原論中是獨立於個體的實體,在整體論中則是個體在特定情境下的失衡狀態。這兩種定義決定了兩種完全不同的診療方式,也決定了兩種完全不同的醫學語言。

把這些層層疊疊的根源放在一起,就會發現,中醫黑與中醫粉的爭論並不是“誰對誰錯”的問題,而是“範式衝突”的問題,是“本體論差異”的問題,是“認識論鴻溝”的問題。爭論的意義不在於分出勝負,而在於理解彼此的世界。而 AI 的出現,讓我們第一次有機會從一個新的角度理解這種衝突。它提醒我們:智能可以存在於關係之中,功能可以獨立於實體,模式可以獨立於因果,解釋可以獨立於機製。它提醒我們:世界比我們想象的更複雜,知識比我們想象的更豐富,真理比我們想象的更多元。它提醒我們:中醫不是偽科學,也不是超科學,而是另一種理解生命的方式,是另一種處理複雜性的方式,是另一種構建知識的方式。

範式革命的殘酷現實

說到這裏,一個更根本的問題浮現出來:中醫能實現“範式升級”嗎?能從 v1.0 升級到 v2.0,融入現代科學的主流框架嗎?

這個問題聽起來像是技術問題,像是隻要找到足夠多的證據、做足夠多的實驗、引入足夠多的現代方法,中醫就能順利完成現代化。但如果把視線拉遠一點,就會發現這其實是一個認識論和本體論層麵的深層衝突。

庫恩在《科學革命的結構》裏說得很清楚:範式轉變不是新舊範式的融合,而是新範式徹底取代舊範式。地心說被日心說取代,燃素說被氧化說取代,牛頓力學被相對論修正——沒有一個是通過“融合”實現的。新範式的勝利,意味著舊範式的消亡。

中醫麵對的是更棘手的情況:陰陽五行與原子論、還原論之間,存在根本的本體論鴻溝。

中醫的本體是“過程—關係—整體”:氣、陰陽、五行、升降出入。

現代科學的本體是“實體—機製—層次”:粒子、分子、細胞、基因。

這是兩種根本不同的“看世界的方式”。中醫把生命理解為一套不斷變化的過程,核心是關係、流動和調節;現代科學則把生命拆解為可以分辨、可以測量的實體單元,強調結構、機製和層次。兩者的基本單位不同,一個是動態的功能過程,一個是靜態的物質構成,它們之間不存在可以直接對接的數學映射關係,就像兩套各自自洽的幾何體係,描述的都是空間,卻無法簡單互換。

正因為如此,想把這兩種體係強行統一在同一個框架裏,並不是一個現實的目標。它們各自形成於不同的曆史背景,服務於不同的問題,也依賴不同的思維方式。與其追求某種理論上的整合,不如承認它們在理解生命時所處的維度不同,各自有其適用的範圍和價值。

現代科學的高度專業化讓情況更複雜。二十世紀初,一位科學家可能同時懂解剖、生理、藥理;二十一世紀,光是神經科學就分成計算神經、分子神經、係統神經幾十個方向。構建一個同時容納陰陽五行與分子生物學的宏大框架,需要的跨學科能力——中醫經典、現代生物學、複雜係統論、科學哲學、高性能計算——全球範圍內可能隻有屈指可數的人具備。即使有,學術激勵機製也不支持這種“不務正業”的宏大綜合。

因此,更現實的路徑,是作為主流之外並行的體係長期存在。

這聽起來像是一種失敗,但換個角度看,這恰恰是認識論的成熟:承認人類知識體係天然是複數的。不同層次、不同粒度、不同適用域的描述可以並存,而非必須塞進同一個框架。經典力學和量子力學在各自適用域內都有效,沒必要強行統一;現代醫學和中醫也一樣。

中醫不是現代醫學的前身,也不是它的對立麵,而是另一種理解生命的方式。它的價值不在於是否符合還原論的標準,而在於它是否能有效地處理生命的複雜性。

從“語言模型”到“數學模型”:可計算中醫的前景

即便兩種範式難以徹底統一,也不妨礙我們在各自的框架內繼續把事情做得更細致一些。對中醫而言,一個更現實的方向不是去回應外部的質疑,而是讓這套長期積累的經驗在可計算、可驗證的層麵上變得更清晰、更結構化。

這也引出了一個新的問題:如果我們把中醫理解為一個經過漫長時間訓練的大模型,它是否有可能從今天主要依賴文獻與經驗的“語言模型”,逐步走向一種由結構和關係驅動的“數學模型”?換句話說,中醫能否從描述性的體係,進一步發展為可計算的體係?

這個問題很關鍵,因為它指向中醫現代化的真正突破口。

先看清現狀。今天市麵上所有的“中醫大模型”,本質上都是語言模型。它們讀《黃帝內經》、讀《傷寒論》、讀曆代醫案,然後學會用中醫的語言回答問題。你問它“頭痛怎麽治”,它能引經據典給你一段漂亮的回答——聽起來頭頭是道,但它的底層機製依然是“下一個詞預測”,而不是真正的“辨證推理”。

這類模型有用嗎?有用。它們可以輔助教學、科普中醫知識、幫助年輕醫生拓寬思路。但它們有本質局限:它們不懂“證”之間的數學關係,不懂方劑劑量如何影響療效,不懂人體作為複雜係統的動力學方程。它們是在“說中醫”,不是在“算中醫”。

未來的“可計算中醫模型”應該是另一回事。

它的目標,是把中醫從“語言空間”映射到“數學空間”——把陰陽五行轉化為可計算的變量,把髒腑經絡轉化為可建模的網絡,把辨證論治轉化為可優化的算法。這不是用 AI “包裝”中醫,而是用數學“重構”中醫。

這個方向上,已經有一些值得關注的探索。

有研究團隊構建了多維度中醫藥知識圖譜,整合中藥、化學成分、生物靶點、疾病等信息,用圖神經網絡建模方劑的配伍機製。有意思的是,他們引入了“性味歸經”作為虛擬節點,讓模型能夠量化分析“君臣佐使”的配伍關係——比如發現某些藥物組合在治療特定症狀時具有高注意力權重,並通過質譜分析驗證其中的活性成分。

這實際上是用數學語言“翻譯”中醫的配伍理論。模型不是在背誦古方,而是在學習藥物之間的關係結構。

另一個更具野心的方向,是把統計物理的模型引入中醫髒腑功能研究,構建麵向證候演化的計算預測模型。思路是:把人體髒腑看作一個相互作用的係統,用數學方程描述它們之間的動態關係,再通過臨床數據擬合參數,最終實現“預測”——在疾病發生之前,預判證候的演化路徑。

如果這條路走得通,“上工治未病”就不再是一句口號,而是可計算、可驗證的數學模型。

還有一種更接地氣的方法:用無監督學習從臨床數據中自動發現“證”的結構。傳統中醫的辨證規則是“主症 + 次症”的經驗總結,但不同醫家對權重的把握不同。隱結構分析的方法,可以把主症、次症的語義約束加入算法,從數據中學習出符合中醫理論的量化辨證規則——分值與語義一致,不出現過大、過小或負分的邏輯矛盾。

這就是用數據“校準”中醫的診斷規則。不是推翻古人的經驗,而是讓經驗變得更精確、更可重複。

這些探索的共同點是什麽?是結構化。

語言模型處理的是“詞序列”,數學模型處理的是“變量關係”。前者靠統計關聯,後者靠數學方程。前者可以“說得頭頭是道”,後者可以“算得清清楚楚”。

未來中醫的理想形態,可能是“雙層結構”:

底層是數學化的功能模型:用微分方程描述氣血運行,用網絡模型描述髒腑關係,用動力學描述證候演化。

上層是語言化的知識模型:用陰陽五行解釋,用辨證論治指導,用方劑配伍幹預。

兩者結合,既保留中醫的經驗智慧,又具備現代科學的可計算性。

這不是對中醫的背叛,而是對中醫的延續。中醫的本質不是某些具體概念,而是一種理解生命複雜性的方式。數學化隻是讓這種方式更清晰、更可驗證、更可傳承。

不過,從現實的學術生態和數據條件來看,這條路注定漫長而曲折。

尾聲:五千年的模型與未來的模型

寫到這裏,討論已經走到了一個相對完整的階段。回望前文,像是在沿著一條緩慢展開的路徑,把中醫與大模型之間那些看似遙遠的聯係一點點串聯起來。許多問題並沒有現成的答案,但它們的結構變得更清晰了,也更容易理解為什麽這些爭論會持續這麽久。

從某種意義上說,中醫是一套經過五千年臨床實踐不斷訓練出來的大模型,它的參數不是數字,而是經驗;它的結構不是代碼,而是概念;它的訓練不是依靠顯卡,而是依靠無數醫者在真實世界中的反複觀察與修正。

它並不完美,也不具備包治百病的能力,但它提供了一種理解生命複雜性的方式,一種看待身體的方式,一種處理不確定性的方式。

AI 大模型的出現,讓我們第一次能夠用一種新的語言去理解中醫,而不是用舊的偏見去否定它。它讓我們看到,知識並不隻有一種形態,解釋世界的方式也不隻有一種路徑。

也許未來的某一天,我們會看到一個真正意義上的“中醫數學模型”,它既能繼承古人的經驗框架,又能融入現代科學的結構化方法。也許那一天還需要很長時間,也許永遠不會完全到來。

但這並不妨礙我們在今天,嚐試用更寬廣的視角去理解中醫,理解爭論背後的邏輯,理解知識體係之間的差異。

人類認識世界的方式從來不是單一的。不同的模型,不同的範式,不同的語言,都在試圖觸摸同一個複雜而難以窮盡的生命係統。

中醫是其中之一,AI 也是其中之一。

它們之間的對話,才剛剛開始。