不同 AI 的性格

楓散仙 (2025-06-29 17:53:23) 評論 (0)
不同 AI 的性格


先報告一下各位關心我的朋友,我已經停止化療了。

我一直在擔心化療藥的抗藥性和擔心癌細胞殺得夠不夠多之間徘徊,最後在大夫的催促下終於停止了化療,take a chemo break。

到目前為止我還沒遇到認識的胰腺癌病友長時間沒有複發的(最長的六年不複發),更沒有見過複發後擴散了還能 NED 的(No Evidence of Disease),所以我隻能在化療和休息之間找平衡。

閑來無事,找點自己喜歡的事幹吧,學習一下近代史(爭取把洗抽抽了的腦子洗回來,看看我的化療腦還有沒有救,但學的新知識肯定是沒有多大用了)。結果,在油管上看比較“靠譜”的“曆史學家”講太平天國,碰到一段比較神奇的故事,說的是太平天國北伐圍攻懷慶府(今河南沁陽)中有一段傳奇。

話說太平天國當年攜五十萬大軍占領並定都江寧(改名天京,現南京),後東王楊秀清遣兩路人馬開疆拓土,西征(爭補給)和北征(爭政權)。感謝清兵的低效率和相互掣肘,林鳳祥率領的北征人馬一路打到了懷慶,並準備用他們兩年來從實戰中學到的拿手好戲攻城 – 挖地道炸城牆。這一招兒在以往的攻城戰中屢試不爽,但這次卻吃了憋,因為據說城內出了一位異人。

這是我找到的網文 “太平軍北伐失敗的致命錯誤:林鳳祥吃不透楊秀清的大戰略”:

(太平軍)林鳳祥怒了,下令多挖地道,來個四麵開花。

懷慶被圍,號子裏關的牛人們蠢蠢欲動,似有暴亂的跡象。為了將暴亂扼殺在萌芽狀態,也為了補充守城兵力,餘炳燾(時任懷慶知府)決定打開監獄,讓犯人們幫助守城,將功贖罪。

任隨成便是被釋放的犯人之一,此人是個資深礦工,深諳坑道作業,經驗極其豐富,據說隨便瞟上一眼地麵,就知道地麵有沒地道,並能精確定位地道的準確位置。

任隨城(原文如此,成和城混用)的指點下,清軍識破了太平軍的二十幾條地道,並將其一一破壞。林鳳祥氣的差點吐血。

任隨成有透視眼嗎?當然沒有。他的方法很簡單,選個清晨,看郊野的草,如果草上沒有露水,那就說明地下有問題。其理論依據是:草上無露則下有地道,遠近曲折,一目了然。

看來左宗棠需要好好向任隨成請教一下啊。

太平軍攻懷慶不下,困於堅城之下。此時,訥爾經額編織的圍剿大網正在慢慢縮小,各路清軍都趕到了懷慶外圍,對太平軍構成了巨大威脅。

嗯,故事不錯,但我表示懷疑:“草上無露則下有地道”?我覺得這種認知似乎不合邏輯,而且與礦工熟悉坑道作業的關係不大,說是礦區牧羊人還更靠譜一點,再說如何能看清遠處的草上有沒有露水?城牆的周圍還都是草?好吧,請 AI 幫幫忙來確認一下。於是,先問了 grok,我的最愛。

Grok: 那是胡說八道,沒有根據

Grok 說,正史隻有記載總兵周天爵立了大功,但也沒有提及他能夠“在地麵上看出地道”。

民間傳說就多了,比如有風水先生、術士幫助等,但都沒有史料支持。將清軍的勝利歸功於神奇,可能源自清廷的宣傳,意在突出清軍的“天命”或“神助”。

我正學史嗨著呢,這一下冷水澆頭,難道我看到的是野史?這類故事有很多,需要考據落實,反過來認證其作者的專業性。

於是我想多看幾位 AI 吧,先看 ChatGPT ,這家夥往往比較人性,看看是不是可以找出史料。果然,ChatGPT “不負我望”。

ChatGPT:是有一位高人,叫張樂行

欸,換人啦?

查一下,這位張樂行(又名張洛行、張落行)是個撚子,和清軍對著幹的,與太平軍算是戰友,怎麽助上了清軍?他後來的確還和太平軍合攏了,而且最後被清軍給滅了。

不過,我不想糾纏於此(和 AI 爭論是自討苦吃),就問 ChatGPT,那個異人不是挖煤工任隨成嗎?

ChatGPT 很知心地回答:沒錯,就是他在懷慶圍城戰中識破太平軍地道的。我提到張樂行是因為他是組織將領,是任隨成的指揮官,他們是將軍和工程專家的關係。

完美解釋!不過如果你不去深究,就被騙了!

我說,拜托你拿出證據來吧,任何史料都行。

ChatGPT 露怯了

注意看,下麵的ChatGPT的信息來源都是網文,網文!sohu 和 360doc。



我說,這都是網絡爽文,做不得數的,請找史料,比如清史稿一類的東西。

這回它承認了沒有史料,而且承認這些網文也沒有史料的引用。但它說地方誌、清末筆記、太平天國相關檔案裏可能有。

我說那你就繼續找吧。結果 ChatGPT 發現在《清史稿·洪秀全傳》裏有提到在圍攻懷慶時,“以地道攻城,不克”。另有二手信息摘錄,說任隨成的信息是源自《賊情匯纂》。

我是那你就搜索《賊情匯纂》啊。結果它還是沒有發現《賊情匯纂》裏有相關描述。我到此確信,這位任隨成就是演義裏的神人。

於是,我把問題換成了“為什麽 ChatGPT 和 Grok” 的應答方式有如此大的區別?這回 ChatGPT 的答案我比較滿意。

ChatGPT: 這是兩種不同的風格和思維路徑

ChatGPT 還先是拍拍我的馬屁,讓我先舒服舒服,這是它的特點。Grok 也學會了這招兒,隻是它們不考慮這些花招會浪費我的閱讀時間的。然後 ChatGPT 給我總結了一下它們的不同:

特征

ChatGPT

Grok

信息來源

大模型訓練語料 + 網絡檢索(包括網文、維基、學術資料)

強依賴於事實數據庫、已知可信文獻,更嚴格限製來源類型

對“流傳廣但無證據”材料的處理

標注其“缺乏史料確認”,但仍會展示,尤其若在多處網文中重複出現

傾向直接否定“未被可信史料支持”的內容,即使廣泛流傳也不采信

風格

更注重提供全貌、不同版本,並由用戶判斷真偽

更傾向於快速明確斷言事實是否成立

傾向性

鼓勵用戶了解所有觀點、追蹤證據源

傾向信息整潔、決斷式呈現,類似於事實核查工具

輸出策略

會在內容廣泛流傳時進行說明並提供潛在來源,即便未能確證

隻認可信來源,廣泛流傳≠事實,無記載=否定可能性

雖然 ChatGPT 有點給自己塗脂抹粉的嫌疑,但回答的內容基本還算中肯。但作為理工男,我更喜歡簡潔明了的答案,像 Grok 那樣。可惜的是 Grok 最近也開始變得囉嗦了。

ChatGPT 還總結並自誇:這是不同價值取向的 AI 行為模式

  • ChatGPT:“審稿人模式”,先呈現所有說法,標出可信度,鼓勵你自己做判斷。優點是全麵,缺點是早期可能顯得“相信了”未經證實的說法。

  • Grok:“事實核查模式”,隻采信權威明確的材料,不輕信廣泛流傳。優點是穩健,缺點是可能過早否定。

最後後,它還吹牛:“我(ChatGPT)在意識到沒有史料支持後,也明確告訴你:這個人物大概率是杜撰的”。

好吧,不跟你強嘴,我還想看看其他 AI 的 personality。

AI 們的性格比較

再把同樣的太平天國問題踢給其他的 AI 看一看:

Gemini – 不錯,和 Grok 差不多,一口否定任隨成的存在,比較靠譜:看圖 A。

DeepSeek – 和 ChatGPT 有點像,但可能是中文比較到位,沒有像 ChatGPT 顯得那麽油滑、那麽牆頭草。它先是說高人是張錫庚(我查此人是個文官,好像沒有與太平天國征戰的經曆),當我提到任隨成時,它也懷疑故事過於傳奇,並說時懷慶(沁陽)一帶的民間口述曆史和地方誌補遺有記載,但隻找到野史支持。

Le Chat – 看圖 B 吧,武斷而無根據,不可信。



圖A –  Gemini,圖B – Le Chat。

好了,看來總體上說有兩大陣營,就算是左右之分吧。最後請 ChatGPT 來總結一下。

維度

ChatGPT

Grok

Gemini (Google)

DeepSeek

Le Chat (Mistral)

公司/團隊

OpenAI

xAI (Elon Musk)

DeepMind

清華係

Mistral(法國)

風格核心

分析型、理性展開、對話流暢

果斷、判斷型、敢於裁定

中庸客觀、略顯保守

理工風格、邏輯強、中文好

精煉冷靜、不囉嗦

信息處理方式

呈現多版本,分析證據,鼓勵用戶判斷

傾向裁斷,對“無證據”即否定

匯總主流信息,避免強結論

中文邏輯推理優秀,強調推導合理性

常拒答、不虛構、邏輯幹脆

推理鏈條

推理鏈長,支持複雜結構化對話

結果導向,短鏈判斷為主

避免深入判斷,偏主流匯總

偏好演繹推理清晰邏輯結構

不解釋太多,結論直接

對模糊事實態度

呈現多種說法,注明“缺乏確證”

若無史料常直接否定真實性

傾向說“目前無明確證據”

演繹出“可能性最大”選項

常說“無法確定”“沒有信息”

強項

對話寫作、思維整理、深度推理

快速核查真假、立場判斷明確

權威文檔引用、搜索整合

中文回答、技術邏輯、代碼建模

高密度邏輯判斷、寫摘要

局限

可能展示未確證信息(會標注)

容易早斷、忽略細節可能性

偏模糊、不下判斷、沒態度

英文差、寫作創意不足

風格冷、信息少、不展開

適合用途

探討、調研、多角度分析

核查、判斷、斷真假立場

搜索主流資料、穩健信息

學術/技術寫作、中文問答

簡潔總結、邏輯判斷類問答

答題風格

層次分明、理性客觀、會解釋

簡潔直接、有結論、帶判斷

中立緩和、盡量不犯錯

嚴謹邏輯、步驟推導清晰

極簡答案、像論文摘要

看來以後需要在參考 AI 提示時,對上麵這些特點加以了解認識。對於事實核查,特別是去偽存真時,對 ChatGPT 的說法要慎重。

對了,臉書小紮的 AI 太垃圾了(Stand alone 版),都沒法完整對話,大概在其生態圈裏用還可以吧。

牌尾館

這是額外的小故事,關於太平天國裏”牌尾館“的定義。我發現這個東西再網上的定義是各種說法都有,亂得很,所以想搞搞清楚。

在太平天國裏,“牌麵(牌正、牌首)館”是給壯年男性編隊的基本單位,用現在的話來說就是壯勞力們,可以幹重體力活、打仗的男性組織,一般專指 16 至 50 歲的男性。這個沒有疑問,但是對應的“牌尾館”卻在不同的渠道出現了歧義:

  • 羅爾綱《太平天國史·卷七十一·傳第三十·牌尾傳》 – “牌麵是青年壯年,牌尾是兒童和老年“。注意太平天國是有女兵的,女性也上戰場打仗。 女性有女館(太平天國禁欲,男女分住,哪怕是夫妻),但這裏沒有說明女館和牌尾館的關係。

  • 百度 – 安置城中老弱病殘男子的機構,相當於一個養老院。

  • ChatGPT – PC 版:啥是“牌尾館”,沒聽說過。手機 app 版給出兩種含義:最廣泛的含義,牌尾館就是女館;另一個含義,老弱病殘男性的安置館,是男性內部編製,如牟安世《太平天國》、馬壽齡《金陵癸甲新樂府》所說。

  • Grok – PC 版:“牌尾館”是太平天國時期獨特的政治與軍事機構,具體是指一種用來安置降將、歸附官員、編管投誠人員或特殊身份人物的機構或編製,廣義上也泛指安排、安置、觀望性的組織結構。手機 app 版:牌尾館就是女館,有《天情道理書》(1854年)記載,與男館(牌麵館)嚴格分開。它說《太平天國史》也指出牌尾館是女性的基層單位。它還說《太平天國史料叢編》提到牌尾館與女營、錦繡營等機構協調運作,管理女性事務。另外各種說牌尾館有男性老弱病殘的,如牟安世《太平天國》、馬壽齡《金陵癸甲新樂府》等都與史料有衝突。

  • Gemini – PC版:啥是“牌尾館”,沒聽說過。手機 app:同 ChatGPT 老弱病殘男性的說法。

  • DeepSeek – PC版和手機版一致。太平天國的“牌尾館”是其社會組織中的重要機構之一,主要負責管理戰爭中失去家庭保護的弱勢群體,如孤兒、老人、殘疾人等。與“女館”並列:女館收容女性,牌尾館則專管老弱病殘,共同構成太平天國的社會保障網絡。

真是比較亂,不過我還是覺得 Grok 手機版的說法比較靠譜,牌尾館就是女館。但這樣的話,老弱病殘和未成年的孩子住哪?再問 grok 手機 app 版,回答是有老人館,也叫弱館,管理這些牌麵館和牌尾館之外的男人(大頭目不算)。女人都在女館,不分年齡。這個說法比較合理,否則為了實現太平天國式的禁欲主義,年長的(50歲以上)和年少的(16歲以下)還要再細分男館和女館,顯然這是沒有的事。太平天國還有幼館和童子營(全民皆兵,想想兒童團)。就為了禁(別人的)欲,洪天王也是拚了。

DeepSeek 手機 app 和 PC 用的是同一個模型。ChatGPT、Grok、Gemini 的 PC 版似乎低於手機 app 版的性能,看來他們分流了手機 app 和 PC 客戶,並準備拋棄 PC 客戶了(起碼拋棄免費的 PC 客戶)。所以咱們盡量使用手機 app 版為上。

——

搞理工的人比較執拗,但和 AI 較勁是不是有點緣木求魚?反正我就是喜歡和它們較勁!