愚翁隨記

自言自語，　自娛自樂。　　　

首頁文章列表博文目錄

個人資料

晉中

給我悄悄話

博客訪問：

來，咱們也聊一聊AI

(2024-12-14 12:15:34) 下一個

一直琢磨著聊幾句AI，但一直沒有時間，今天得空趕緊嘮叨幾句。

這一波的AI大浪是OpenAI的ChatGPT激發的，ChatGPT 的Chat 就是聊天對話，後麵的GPT就是 Generative Pre-trained Transforme，直譯成中文就是“生成型預訓練變換器”。這個東西是OpenAI公司把神經網絡的trasfomer大模型＋大算力＋大數據這三個東西結合起來，大力出奇跡訓練出來的。OpenAI既摸到了這條路，其它公司就蜂擁而上，砸了很多錢很多人搞出了幾百種大大小小的大模型，有語言大模型，圖形大模型，音頻大模型，視頻大模型，還有把幾種合起來的多模態大模型。

在ChatGPT發布後，那些喜歡好高騖遠的各路專家就出來幻想用這種生成式預訓練的神經網絡去實現所謂的AGI，就是通用人工智能。也有專家用機器人意識覺醒，超級智能機器人統治地球，反過來奴役人類這樣的科幻場景去嚇唬老百姓。

現在是ChatGPT出來的兩周年剛過，貌似很多人還沒有認識到，但已經有跡象表明，沿著生成式預訓練的神經網絡去實現所謂的AGI這條路是走不通的，就是所謂Scaling Law(規模定律)已經走到了頭，大模型＋大算力＋大數據三個大力中的大數據差不多已經用完了，這兩天AI圈的熱門消息就是第一個提出AI技術中大力可以出奇跡的原OpenAI的聯合創始人和前首席科學家Ilya Sutskeve發表了一個演講，說預訓練將結束，數據壓榨到頭了。其實我個人認為，就算大模型＋大算力＋大數據的三個大力可以繼續增長，沿著這條路也走不到AGI，我們需要基本原理上的突破，從這裏深究下去我也不懂，涉及到哲學；心理學，腦科學和語言學等等。

下麵再嘮一嘮這一波的AI技術突破的應用和後果。

最初的ChatGPT的應用就是問答式聊天，其它的如文生圖，文生音樂也差不多，就是一問一答。大約半年以後，就出了OpenAI GPTs，就是把自己的知識庫和ChatGPT結合起來，成為應該特定知識領域的對話機器人，比如把中醫知識加進去，就可以回答中醫問題，去年有很多小公司和個人搶跑了這個賽道，結果OpenAI訓練ChatGPT 4的時候，擴大了知識庫，很多專業的知識庫被包括了進去，直接後果就是大潮上漲淹沒了小水窪，很多小GPTs就從銷聲匿跡。但擁有自己獨特知識庫的GPTs還是能繼續存在，代表的就是公司的AI客服係統。

進入今年2024年，大模型的應用就發展到AI Agent，就是智能體。這個智能體，從程序員的眼光看，就是一個程序，在需要的地方調用一下某種大模型，和我們調用一個函數差不多，給它一些輸入，它處理後生成一些輸出，返回給調用者。這樣就能實現比隻用ChatGPT之類的大模型，或專用GPTs更強大的功能。這個智能體的開發和應用很熱鬧，是個非常有"錢"途，非常擁擠的賽道。

這裏先扯遠點說一說背景知識。人工智能的江湖有三大門派，分別是符號主義，連接主義和行為主義。符號主義認為智能是通過符號操作實現的，智能係統應依賴明確的規則和邏輯推理。這種觀點認為人類思維可以通過符號和邏輯來建模。代表的東西就是各類專家係統，車間裏的專用工業機器人也算符號主義AI的應用。連接主義認為智能是通過神經網絡的連接實現的，模擬人腦的工作方式。神經網絡由大量的節點(或"神經元")組成，通過調整節點之間的連接權重來進行學習和推理論，ChatGPT就是它的代表，特斯拉的自動駕駛也是。行為主義認為智能體通過與環境的互動學習和適應。強化學習是行為主義的重要實現方式，通過試錯和獎勵機製來優化行為策略。這個流派硬件構成也可以是神經網絡，它強調的是好好學習，天天向上，要不斷學習，不斷進步，擊敗人類圍棋冠軍李世石的AlphaGo可以算者一類。

話再說回來，現在烈火烹油鮮花著錦似的發展的AI Agent，其實就是再連接主義大突破之後，回到了把三個流派的武功融合起來應用的更高境界。需要用明確的規則和邏輯推理進行控製的時候，智能體(程序)就用明確的規則控製，需要用ChatGPT之類的大模型的時候，就去調用，想調用哪個大模型就調用哪個，想什麽時候調用就什麽時候調用，想調用多少次就調用多少次。還可以調用不同的大模型讓它們互博，交叉驗證。智能體也得不斷學習，不斷進步，比如說到網絡上查找最新的消息，比如現在流行的RAG(Retrieval-Augmented Generation，即檢索增強生成)技術，旨在通過引入信息檢索係統來增強大型語言模型(LLM)的能力。這種技術允許模型在生成回應時引用外部的權威知識庫，從而提高生成的信息的準確性和相關性。總而言之，就是不拘一格的把我們會的功夫都用起來。

前一陣子OpenAI推出的OpenAI o1實際上就是這種混合式人工智能的典型，當你問它一個問題，比如讓它解一個數學問題，它會把這個問題拆分成多個小問題，然後逐一回答，該調用ChatGPT的時候就去調用，需要的話會反複多次調用，還會上網查詢，把查詢到的知識在放到ChatGPT裏再次處理。不能準確理解會回答的問題會進一步拆分，回答出答案會交叉驗證，最後再綜合出答案，這個過程可以顯示出來，讓人感覺到它在思考，最後的答案是深思熟慮的結果。OpenAI o1的表現確實驚豔，回答很多複雜的科學問題時，準確律遠遠超過了直接用ChatGPT回答的一錘子買賣式的回答。

現在這種結合了三大流派思想的混合式人工智能的智能體的研究和開發，天天有新模型新產品推出，不是百家爭鳴，而是萬家爭搶，公司和個人都在爭先恐後，爭分奪秒，跟不上，根本跟不上，連睡覺都是浪費時間，讓人想起幾年前虛擬貨幣熱潮時代淩晨三點俱樂部。

包括薩姆奧特曼，馬斯克，黃仁勳，今年得諾貝爾物理獎得辛頓在內的一些大佬們都認為AIG將很快實現，但我個人覺著AGI的實現還比較遙遠，還需要算法原理上的大突破。但必須強調和可以肯定得是，基於已有AI技術的AI Agent將給這個世界帶來翻天覆地的變化。下麵這段是ChatGPT生成的，如果你覺著和我上麵親手碼的讀起來有點違和感，不要奇怪。

AI Agent即將為這個世界帶來翻天覆地的變化，簡直可以用“重置（reset）人類世界的所有方麵”來形容。想象一下，當你的鬧鍾響起時，AI已經替你挑選好了今日的穿搭，甚至連襪子都配對好了（告別了找不到另一隻襪子的痛苦）。而當你還在享受咖啡香時，AI已經幫你完成了工作報告，給老板的郵件也發送完畢，讓你可以悠然自得地刷刷微博、發發朋友圈。

在廚房裏，AI早已為你準備了一頓色香味俱全的早餐，搭配恰到好處的營養搭配，就像有個星級大廚在為你服務。更有趣的是，當你出門時，AI會提醒你帶上雨傘，甚至告訴你今天那家新開的餐廳有多好吃，順便預訂了一個位置。

開車上班？不再需要，AI已經為你安排好自動駕駛車，順便規劃了一條避開所有堵車的路線。AI甚至會根據你的心情播放音樂，確保你一天的開始充滿愉悅。到了公司，AI還會幫你處理繁瑣的事務，讓你專注於真正需要創意和思考的工作。

而在更大的範圍內，AI Agent也會重新定義各個行業。例如，醫療領域，AI可以幫助醫生精準診斷疾病，甚至預測病情發展；在教育領域，AI會為每個學生量身定製學習計劃，讓每個人都能發揮最佳潛力；在交通領域，AI可以通過智能調度，減少擁堵和事故發生。

總的來說，這個AI Agent不僅僅是一個工具，更像是一個萬能助手，讓生活變得更加輕鬆、有趣和高效。它重新定義了我們與技術的關係，讓未來變得更加充滿希望和可能性。

說完這些煽情的好聽的，還是由我來碼這最後一段，聊幾句AI令人憂慮，悲觀甚至絕望的。上麵這些美好的事務實現的同時，意味著很多人會失去工作，與以往的工業革命不同，支持AI消滅工作機會的同時，不會產生更多或等量的工作機會，消滅掉就是沒了。這樣無疑會造成很嚴重的社會問題，油管上關於UBI(全民基本收入)的討論一天比一天多，個人，公司，社會甚至國家都不得不重換重設，財富，文化，價值觀以至於製度都將經受大變革甚至革命，這一切都不會太久，也就這三、五年內必定會發生的事。

[ 打印 ]

[ 加入書簽 ]

閱讀 () ┆ 評論 (6)

評論

格利 2024-12-15 15:59:45 回複悄悄話好文

矽穀工匠 2024-12-15 14:27:08 回複悄悄話 AI so far has caused collusion of pricing of rental, insurance, medical services. It only serves big capital well.

槍迷球迷 2024-12-15 09:09:20 回複悄悄話 AI跟智力還是有本質區別的。人不需要讀海量的書去獲得思考和解決問題的能力，而是通過讀懂幾本書去舉一反三。目前的AI模型不具備這個能力。更重要的是，人有通過邏輯推理判斷是非的能力，而目前的AI模型沒有。 AI不懂得，回答“不知道”比給出錯誤答案更糟糕十倍。

dhyang_wxc 2024-12-14 20:13:46 回複悄悄話好文。

areYOUsure 2024-12-14 19:49:09 回複悄悄話直到現在，DL/LLM的成功應用也就是語音或者語言，但對一般的圖像沒有特別效果，原因很簡單，你隨機選5個字母，它們成字的概率很小。這就是圖像與語言的本質區別。過去數十年，AI在圖像識別裏一直有人在做，2015年的AlphaGo前都隻是冷門，他們都找不到工作。

這個世界上有三樣永遠能忽悠：量子，智能，保健

voiceofme 2024-12-14 18:41:40 回複悄悄話 "人工智能的江湖有三大派，分別是符號主義，連接主義和行為主義。" 這個觀點有意思。符號主義在80-90年代風行了一陣，連接主義就是deep learning 加 language model. 行為主義看來是增強學習（reinforcement learning）， Google 的alphago走的是這條增強學習的路， META的yann lecun似乎也是強調這點，所以成為現在AI領域裏的out-lier。現在AI主要在鏈接主義這塊，但增強學習一直陰魂不散，比如chatgpt 模型的fine-tuning 就是用到了增強學習。但要走到AGI，符號主義注定是失敗的，連接主義其實是提供通過鏈接（或說模型結構和參數）產生的記憶和表達方式，這些記憶和表達方式可以用來預訓練而產生模型，但怎麽讓這樣產生的模型去繼續學習，還得用到增強學習，就是在實踐中學習成長，不學習就進步不了，要學習了就是潛力無限。openAI 的O1確實在強調RL，但沒有看到它到底是怎麽做的，效果似乎不怎麽好。

登錄後才可評論.

愚翁隨記

來， 咱們也聊一聊AI

來，咱們也聊一聊AI