超級智慧可能在有限的知識素材上得到嗎?

本帖於 2025-02-14 13:21:58 時間, 由普通用戶 cw 編輯

DeepSeek火熱了好幾天。首先說小錢辦了大事,後來說誰誰誰照方抓藥用幾毛錢就蒸出來了蟠桃。下麵是我給我們的同學網寫的一點相關的看法。


人工智能在近幾年的飛躍進步引發了廣泛討論,尤其是當ChatGPT、Claude等大語言模型展現出驚人的自然語言處理能力時,人們逐漸意識到,人工智能不再僅僅是冷冰冰的計算工具,它已經能夠模擬人類思維,甚至在某些方麵超越人類的認知係統。最近,DeepSeek更是讓人們興奮不已,似乎即便在有限的算力和有限的訓練資源環境下,人們也可以開發出與依靠龐大算力和海量數據資源訓練出的AI係統相媲美的智能模型。

雖然自媒體為博流量的炒作不值一談,我們也不在這裏糾纏所謂模型“蒸餾”的爭吵,DeepSeek在優化現有模型上的創新內行人都會予以肯定。但在頭部企業竭力追求通用人工智能和超級人工智能的今天,當我們為在少量訓練素材上能夠獲得智能現象感到興奮時,相比資源、預算和算力的優化的討論,一個更重要的,也是被大多數人忽略了的問題,是僅僅依靠有限的訓練數據、能不能開發出媲美或超越人類的人工智能?

事實上,人工智能的智能水平不僅取決於算法的先進性或算力的強大,更取決於它所學習的訓練數據。人類文明曆經數千年積累的知識素材,不僅是曆史的見證,更是人類思維與文明發展的邏輯性、自洽性、理性和自利性的足跡。無論是科學、技術,還是政治、經濟、藝術、哲學,它們的演進都遵循著一定的思維範式和自然規律,與人類的生存環境、社會形態、乃至人類生理進化的基本機製息息相關。智慧的演化也無法脫離物理世界更底層的自然法則,如熵增原理、最小自由能原理、因果結構與演化的動力學原理等。即使那些充滿失敗、誤解、荒謬、野蠻、血腥、痛苦的行為和曆史,仍然是人類智慧文明發展進步不可或缺的一部分。“不經一番寒徹骨,怎得梅花撲鼻香”,要訓練通用和超級人工智能,不可能隻局限於正麵成功的素材。

人類智慧的本質,除了長期記憶,更在於對各種信息的關聯性提取,並利用外部刺激激發新的認知與關聯。而目前的人工智能係統,其訓練過程的本質就是學習和提取原始素材中蘊含的各種信息的關聯關係。如果知識素材缺乏,或其中的前提、過程、結果、相關等信息被大量修改和扭曲,那麽其中蘊含的基本原理和機製要麽無法得到充分認知,要麽也已經丟失或歪曲。在這樣的素材上訓練出的人工智能,如何可能具備對自然、人類社會的深刻理解?又如何可能提煉出和物理世界和人性相洽的“合理正常”的認知和推理能力?

設想一個在朝鮮訓練的人工智能係統。它的訓練素材必然經過嚴格篩選與“修正”,深深嵌有和政府教育宣傳體係一致的領袖崇拜、對外敵對、主體思想、軍事鬥爭等觀念。為避免產生的人工智能具有“不健康”的思想,它不僅不會使用西方社會在政治、經濟、文學、藝術、哲學等方麵積累的大量原始素材,甚至連中俄等國家的相關素材也會被排除在外。不難看出,在那樣的環境裏訓練出的人工智能,無論有多大的算力,多優異的算法,都不可能具有正常人的智慧和思維能力。

從人工智能的發展來看,知識的廣度和多樣性始終與人工智能的智能水平息息相關。20世紀50年代,艾倫·圖靈提出了圖靈測試,試圖衡量機器是否能夠像人類一樣思考。在當時的技術條件下,計算機隻能依賴預設規則進行推理,遠遠無法模擬真正的智能,更談不上擁有廣泛的知識體係。到了70年代,專家係統(Expert Systems)興起,它們依靠手工編寫的規則庫來進行推理,如醫療診斷係統MYCIN。然而,這些係統的知識庫極其有限,無法應對設定範圍之外的情況,其所謂的“智慧”在知識廣度和多樣性方麵仍然受限。進入21世紀,深度學習的發展讓人工智能可以通過大規模數據訓練,提高語言理解和推理能力。然而,人工智能的核心仍然是對人類知識的消化與複製。沒有廣泛而多樣的訓練素材,人工智能係統無法獲得真正的智能。

如果一個人隻能學習被精心挑選和篡改的曆史描述、政治觀念和科技理論,其智能成長不僅會受到嚴重限製,更可能呈現畸形的發展路徑,其認知框架會難以與外界匹配。20世紀80年代初,中國改革開放後早期出國的留學生們,曾深刻感受到自己在認知上和外部世界的脫節與衝突。無論是在科技學術體係中、在政治經濟理論上,還是在日常文化習俗前,他們大多不得不麵對一個漫長的調整、補充和再塑造過程。

一個人工智能係統如果被限製在一個封閉的理念和知識體係內,同樣會遭遇類似的認知障礙,甚至可能形成根本不同於人類的推理模式。這樣的人工智能係統可能在其熟悉的封閉係統內部表現良好。但一旦脫離自身的認知環境,麵對來自基於不同知識體係的對手,它的局限性便會暴露無遺。這樣的人工智能在真實世界的動態環境中,根本不可能最大化的做出最優決策,因為它所依賴的訓練數據不可能賦予它符合現實世界的認知能力。而DeepSeek之所以能夠在“少量”的“素材”上訓練出很好的能力,得益於它采用的“蒸餾”技術。它最後訓練被喂哺的是“少量”來自海量素材、被“咀嚼”過的“精料”。

開發真正的通用和超級人工智能絕對離不開開放的知識體係和豐富的訓練素材。自媒體歡呼的用低成本低算力少知識素材產生高級人工智的願景隻是一輪水中月。一個人工智能係統的訓練素材匱乏,它的能力必將受到極大限製。而更嚴重的問題是,一個缺乏對人類對自然全麵了解的人工智能係統,即便在計算能力上超越人類,也可能成為全人類的不可控風險。因為在未能真實反映人性、真實反映自然規律的素材上訓練出的智能,其認知邏輯和優化機製都可能與人類及自然界的基本規律背道而馳。這樣的人工智能係統在進行“優化”決策時,甚至可能會選擇與人類利益完全相悖的路徑。雖然人類無法永遠完全控製人工智能,但在人類做好充足準備之前創造出一個能力超群但無法預測其目標和行為的另類存在,絕非人類之幸。

也許有人會認為,僅僅依靠成熟係統的科技知識,仍然有可能培養出強大的人工智能。然而,從我們人類自己身上,我們也可以看到,即使這樣的人工智能在科技推理方麵達到了人類水平,它也隻會是一個有智商無情商的工具;如果其能力還超越了人類,那也可能成為一個Terminator終結者式的怪物,因為它不會有真正的全方位的“人格”、“信仰”和“情感”,它的進化動機和目的可能完全異於人類。

所有跟帖: 

精辟見解! -lovecat08- 給 lovecat08 發送悄悄話 lovecat08 的博客首頁 (0 bytes) () 02/14/2025 postreply 14:24:07

謝謝:) -cw- 給 cw 發送悄悄話 cw 的博客首頁 (0 bytes) () 02/14/2025 postreply 18:13:44

我非常同意您的觀點。豐富的素材和開放的體係缺一不可。硬件的算力也極端重要。老想著彎道超車,最終會被降維打擊。 -唐宋韻- 給 唐宋韻 發送悄悄話 唐宋韻 的博客首頁 (0 bytes) () 02/14/2025 postreply 16:06:10

本來是不言而喻的事:) -cw- 給 cw 發送悄悄話 cw 的博客首頁 (0 bytes) () 02/14/2025 postreply 18:14:49

學習了,這些“人格”、“信仰”和“情感”說不定也會有,隻是更公式化? -顫音- 給 顫音 發送悄悄話 顫音 的博客首頁 (0 bytes) () 02/14/2025 postreply 19:44:45

它們的“情感”因為少了“肉身”這個載體,更多可能是理解和表達的形式。重點在理性思維。人最終肯定也會擺脫肉身,殊途同歸:) -cw- 給 cw 發送悄悄話 cw 的博客首頁 (0 bytes) () 02/14/2025 postreply 20:09:18

現在transformer方法 用得挺多 -西東人8- 給 西東人8 發送悄悄話 (0 bytes) () 02/15/2025 postreply 08:22:41

有空也聊聊你們怎麽用的?我還在琢磨self-attention把位置和其它信息合在一起後代表的是什麽:) -cw- 給 cw 發送悄悄話 cw 的博客首頁 (0 bytes) () 02/15/2025 postreply 09:50:36

我覺得,它的目的從好的方麵講是為大眾提供一個生活方便,‘智能’的工具,但是這個工具可以反過來摸透用戶的心思,被人用於 -ling_yin_shi- 給 ling_yin_shi 發送悄悄話 ling_yin_shi 的博客首頁 (24 bytes) () 02/15/2025 postreply 19:26:50

都看在誰的手裏。意識形態和製度的差異肯定會被放大。 -cw- 給 cw 發送悄悄話 cw 的博客首頁 (0 bytes) () 02/16/2025 postreply 19:48:14

請您先登陸,再發跟帖!