希爾伯特旅館裏,住著AI的某種真相

文章來源: - 新聞取自各大新聞媒體,新聞內容並不代表本網立場!
(被閱讀 次)

" 無窮 " 和 " 無窮 +1",哪個更大?

已經吸收了不知道多少數據的 AI 模型,和比他多學習一條數據的模型,哪個更智能?

想聊聊這個問題,出於一個偶然的機會。很早之前我在測試 ChatGPT 的時候,突然想問他個刁鑽問題,於是就問它:" 希爾伯特旅館悖論,對現實世界有什麽影響?"

說實話,ChatGPT 答的驢唇不對馬嘴,還硬拗出幾點,有他一貫的特色。但其中一段回答值得琢磨。他答:" 希爾伯特旅館對於計算機科學是有幫助的,因為當我們處理無限大的數據集時,希爾伯特旅館可以作為我們思考方式。"

無限大的數據集,這東西顯然不存在。但當大模型訓練用的數據參數達到某種天文數字,當真人反饋機製成為常態,模型在使用過程中會接觸難以估量的數據。這難道不是某種無限嗎?

但人類能控製無限嗎?

今天這個話題,其實更接近某種科幻討論,或者一些關於 AI 未來的腦洞。可能大家讀完之後也不清楚在說什麽。但也無妨,我們就當一起舒展一下大腦,放鬆一下最近被 ChatGPT 弄得挺焦躁的心情。

一起去希爾伯特旅館,度個假吧。

歡迎來到,悖論旅館

這家旅館坐落在名叫 " 數學 " 的熱帶風情度假勝地,有的人來了不想走,有的人一想到它就口幹舌燥。

希爾伯特旅館,其實是德國數學家大衛 · 希爾伯特在討論無窮這個概念時,舉的一個生動例子。它既是一個數學遊戲,也經常躋身知名的若幹悖論之一。

它的具體意思是說,假設一家旅館有無窮個房間,但是都住滿了。這時候又來了一位旅客要訂房間,酒店主人就可以不慌不忙,讓 1 號房間客人移到 2 號,2 好移 3 號……以此類推,反正房間數量是無窮的,這樣新的旅客就可以住 1 號房間。

而這時,又來了一車旅客。酒店主人依舊如法炮製,讓每個房間的客人都向後移動 N 個房間,最終把新來的客人安置進去。

以此類推,接下來會發生什麽呢?假如新來了無窮個客人。那麽酒店老板隻需要讓每位客人都移到單號房間。比如 2 號房間移到 3 號房間,3 號房間移到 5 號房間,把偶數房間都空出來,那麽無窮個客人依舊可以住進去。

即使來了無窮多個旅行團,每個旅行團有無窮多位旅客,希爾伯特酒店依舊有辦法,隻需要把非 2n ( n ∈ N+ ) 號房間就都空出來就行了。

希爾伯特旅館之所以是個悖論,因為它標明了這樣一件事:無窮是無法比較的。

無窮 +1 等於無窮;無窮 +N 等於無窮,無窮加無窮,無窮乘無窮,那還是無窮,無窮是紋絲不動的,又是隨時變化的,無窮是可以包含若幹個無窮的。

總之,無窮是難以名狀的。

無窮這玩意,會有點怪

聽上去,希爾伯特旅館悖論好像沒啥用。其實不然,人類在很多領域幾乎都必然麵對 " 無窮 " 這個問題,至少在理論推導和概念驗證環節,麵對無窮幾乎是必然的。一個事物可以比另一個更無窮,但它們倆都還是無窮。這樣的思路可以進行很多假設,也可以解釋很多問題。

比如說,在物理學當中,希爾伯特旅館悖論可以來解釋量子物理學中的很多現象,其中最典型的就是量子場論中關於虛粒子的假設。關於虛粒子是否真實存在,抑或是一種純粹的假設工具,這個問題有著非常多的爭論,但它確實可以用來解釋引力、光子、膠子等物理定義,進而為解釋真空中的能量情況,分析宇宙輻射做出幫助。前提在於,我們需要用希爾伯特旅館的思維,來理解存在於無窮中的虛粒子。

在計算機科學中,數據存儲是個基本問題,而在設計數據結構的時候,就需要考慮如果有海量數據需要存儲,結構上究竟如何調動能夠保證效率最優,故障率最低。這時就需要假定數據集是無窮的,希爾伯特旅館也就用上了。

無窮很怪,這個概念還經常被用在文學創作,尤其是科幻小說當中。科幻是對未來的推演,但如果某件事可以增長到無窮,它往往會出現反常識的狀態。比如說永生不死的人,它可能首先就會失去對時間的概念,因為無窮的時間已經沒有意義了,進而表現出完全失去人類的一切特征,畢竟人類的所思所為,都是在時間有限這個前提下驅動的。又比如瞬間移動,它會不會讓空間失去意義,進而讓人失去辨別空間的需求和能力,進而出現從來不想停留下來的人,而始終都在超高速移動的人,究竟還是人嗎?

一件事如果逼近甚至抵達無窮,它就會超出控製,出現反常識,反邏輯的一麵。這個邏輯,對於 AI 似乎也適用。

用這個邏輯,解釋智能湧現

這幾年伴隨著預訓練大模型的興起,越來越多的人開始談 " 智能湧現 "。一般來說,所謂 " 智能湧現 " 現象,是指當模型規模突破某個未知的界限後,就會突然湧現出驚人的智能。比如模型會表達出訓練者預想不到的邏輯感、流暢性,甚至是人類稱之為情商的東西。

事實上,智能湧現作為一個目標,並不是今天才有。早在上世紀 70 年代,專家機器人的理論構想就是在輸入足夠多的知識後,讓計算機展現出一種無所不知,無所不曉的效果,從而幫助人類解決各種問題。隻是礙於當時的算力與數據承載能力,最終這個設想無法落地。

而在今天雲計算 + 大數據的組合下,更大規模的數據集可以應用到 AI 訓練中,加上深度學習在算法上實現了更好的數據吸納能力,才最終產出了 ChatGPT 為代表的智能湧現現象。

智能湧現到底是怎麽實現的,這一點就像深度學習的黑箱性一樣,始終沒有特別合理的解釋。但 " 智能湧現 " 這個詞卻不是 AI 專有的,這個詞更早是一個生物學詞匯,是用來描述螞蟻、魚群表現出的集體智能行為。一隻螞蟻挺傻的,一條魚也不聰明,但當大量螞蟻聚集到一起,所表現出的那種分工明確、體係森嚴、結構精巧的組織行動方式,簡直讓人歎為觀止。是螞蟻的大腦進化了嗎?恐怕並不是,而是在螞蟻聚集到一定規模後,突破了某種希爾伯特旅館式的智能邊界。

從這個角度看,大模型這條 AI 之路,或許終極目標並不是模仿人類。它不需要進化出直覺、情感、自由意識這些人類獨有的東西。但它會積累無窮多的數據和知識,當我們無法觀測和預估大模型裏擁有多少知識,那麽它就有無窮的知識。AI 模型就變成了一座類希爾伯特旅館,它可以吞噬更多知識,吞噬更多無窮,最終可以表現出人類想要的智能,也可能表現出更多人類不想要,或者沒準備好想要的東西。

或許我們改換個思路,最終的通用人工智能 AGI、強人工智能 Strong AI,可能內在機製並不類似於人類,而是更近乎螞蟻,近乎魚群,近乎希爾伯特旅館。

我們總是討論 AI 像不像人,能不能做人類所做的,人類有哪些獨有能力,巴拉巴拉巴拉。這是因為我們不住在希爾伯特旅館裏,我們住在一個有限的世界,住在短暫的生命和易朽的軀殼裏,住在一個絕大部分構成物是水的大腦裏。但 AI 不是,它相比人類更加貼近無窮。他能通過圖靈測試,他最終能做到一切。但我們並不知道為什麽,因為 AI 並不想成為人,他隻是剛好住在希爾伯特旅館裏。

" 智能湧現 " 或許是個征兆,它告訴我們,AI 的進化目標不是人類,而是《星際爭霸》裏的蟲族。

美麗泉水 發表評論於
這個存粹是嘩眾取寵。無窮是可以通過一定規則比較大小的。例如實數集合就包含了有理數集合。
elune 發表評論於
假定條件就不對,無窮就無法住滿,去掉這一條,後麵的就不用舉例了
nzder7 發表評論於
這顯然不是人寫的文章,也不是機器人寫的文章,總而言之就是不知所雲的一篇東西。