ChatGPT總會有莫名其妙的錯誤,即使是回答現成的結果。比如讓它證明勾股定理

可能你覺得不會證,其實有上百種證明方法,這樣的東西對ChatGPT 來說比隨機的小學應用題還簡單

不就是搜索而已

它給了我利用射影定理的證法。的確是比較簡單的,左右兩邊各用一次,加起來就是勾股定理。

可是,問題是,就這麽幾行東西,裏麵也有錯,它把線段端點字母寫錯了

看起來連個基本的自我邏輯檢查都沒有,純純的每個輸出都是概率模型加權算出來的

不知道是權重給的不合適還是隨機權重,寫出來的線段跟證明結果無關

但是結論是對的

 

所有跟帖: 

它會改錯的(如果你把你認為它錯的地方反饋給它的話)。 -旅行中- 給 旅行中 發送悄悄話 (0 bytes) () 09/08/2025 postreply 10:36:17

就這種改錯的能力就比很多(尤其股市裏)腦筋僵化的人類要好很多。 -旅行中- 給 旅行中 發送悄悄話 (0 bytes) () 09/08/2025 postreply 10:39:52

這種改錯可能是人為故意提供的有目的性的答案, 結果可能更差, 由胡說變成被操縱 -testmobile- 給 testmobile 發送悄悄話 (0 bytes) () 09/08/2025 postreply 10:58:56

當前AI的局限性和資金的追捧不矛盾~ 一方麵是看好未來,一方麵是資金炒作 -ocliving2005_4ever- 給 ocliving2005_4ever 發送悄悄話 (33 bytes) () 09/08/2025 postreply 10:38:41

你用的是免費版吧,試試ChatGPT 5 thinking,幻覺已經大幅度減少了 -Harp- 給 Harp 發送悄悄話 (0 bytes) () 09/08/2025 postreply 10:40:09

本質上應該沒有大區別,不然,應該改名字了。 -TalkToMi- 給 TalkToMi 發送悄悄話 (0 bytes) () 09/08/2025 postreply 10:42:46

在免費版本提供錯亂答案, 在付費版本提高正確答案, 這種設計思路本來就是錯的, 付費和免費版本的區別應是每天使用次數, -testmobile- 給 testmobile 發送悄悄話 (0 bytes) () 09/08/2025 postreply 10:52:52

所以我不相信付費的ChatGPT 5 thinking幻覺會少, 如果是, 就說明這個產品設計師是個蠢蛋 -testmobile- 給 testmobile 發送悄悄話 (0 bytes) () 09/08/2025 postreply 10:54:08

標準模型就是犧牲準確率提高速度,跟讓一個人不思考零秒快答一樣,跟蠢蛋無關。 -lanyin0314- 給 lanyin0314 發送悄悄話 (1483 bytes) () 09/08/2025 postreply 11:01:01

more detailed mode不是提高了正確性, 而是提供更多細節, 現在我的感覺就是說更多廢話 -testmobile- 給 testmobile 發送悄悄話 (0 bytes) () 09/08/2025 postreply 11:05:05

GPT5出來以後,連個大點水花都看不見,就知道這個版本目前為止,沒有質的變化. 大家還在炒作AI, 不過 -ocliving2005_4ever- 給 ocliving2005_4ever 發送悄悄話 (77 bytes) () 09/08/2025 postreply 11:03:09

跟版本無關。很顯然,你以為它在推導,其實它的每一步都在抄襲。所以即使部分有錯甚至已經錯的離譜,下一步抄的是正確答案就回來 -害怕- 給 害怕 發送悄悄話 (498 bytes) () 09/08/2025 postreply 11:11:19

請您先登陸,再發跟帖!