DeepSeek R1推理功夫了得!

本帖於 2025-01-27 21:41:36 時間, 由普通用戶 slow_quick 編輯

注意,要點一下左下角的 DeepThink (R1) 。

我問了這個經典問題:

Say there are more than one finite number of points on a Euclidean plane, and they are not falling on a single straight line.  Proof that there exists a straight line that goes through only two of those finite points.

它洋洋灑灑考慮了好幾分鍾,寫了好幾段怎麽思考,最後居然證明了!

 

所有跟帖: 

我完全不懂AI,就覺得都很神奇 -slow_quick- 給 slow_quick 發送悄悄話 slow_quick 的博客首頁 (0 bytes) () 01/27/2025 postreply 21:40:17

問ChatGPT同一問題,解答快得多也簡潔許多。目前DeepSeek還嫩了點 -slow_quick- 給 slow_quick 發送悄悄話 slow_quick 的博客首頁 (0 bytes) () 01/27/2025 postreply 22:39:25

我仔細閱讀了一下,ChatGPT的證明不完全,差評 -slow_quick- 給 slow_quick 發送悄悄話 slow_quick 的博客首頁 (138174 bytes) () 01/27/2025 postreply 22:46:06

ChatGPT4 推理一般,o1應該沒有問題,AIME考試能到83分。 -pichawxc- 給 pichawxc 發送悄悄話 pichawxc 的博客首頁 (0 bytes) () 01/27/2025 postreply 22:59:05

ChatGPT o1也錯得離譜 -slow_quick- 給 slow_quick 發送悄悄話 slow_quick 的博客首頁 (0 bytes) () 01/28/2025 postreply 09:44:58

DeepSeek R1 雖然囉嗦了點,卻是正確的證明! -slow_quick- 給 slow_quick 發送悄悄話 slow_quick 的博客首頁 (0 bytes) () 01/27/2025 postreply 22:46:57

R1深度思考和推理,所以慢一些 -玻璃坊- 給 玻璃坊 發送悄悄話 玻璃坊 的博客首頁 (0 bytes) () 01/27/2025 postreply 23:17:36

再仔細閱讀一下,Deepseek 也錯了,但更接近 -slow_quick- 給 slow_quick 發送悄悄話 slow_quick 的博客首頁 (0 bytes) () 01/27/2025 postreply 23:58:46

明天空了貼上來大家評論 -slow_quick- 給 slow_quick 發送悄悄話 slow_quick 的博客首頁 (0 bytes) () 01/28/2025 postreply 00:00:36

我昨天是在tablet app上問DS R1,今天換到電腦上browser問同一個問題,它完全錯了 -slow_quick- 給 slow_quick 發送悄悄話 slow_quick 的博客首頁 (151 bytes) () 01/28/2025 postreply 07:23:47

把你的問題Post到 https://lmarena.ai/, 看看哪個模型的回答更好? -未知- 給 未知 發送悄悄話 未知 的博客首頁 (106 bytes) () 01/27/2025 postreply 23:37:19

昨天問了DS幾個電子通訊的數學問題,一個也沒答出來。問它怎麽在噪音中讀取抗幹擾平譜信號,它BS了半天貌似懂連概念都錯了 -顏陽- 給 顏陽 發送悄悄話 顏陽 的博客首頁 (274 bytes) () 01/28/2025 postreply 06:32:37

我的觀察:目前所有AI都是學會了說人話,學術問題絕對可以唬唬外行,但內行一看就不對 -slow_quick- 給 slow_quick 發送悄悄話 slow_quick 的博客首頁 (0 bytes) () 01/28/2025 postreply 07:05:39

一分錢一分貨,曆來如此。驅良幣會發生,更精確講是成本下降。 -上海大男人- 給 上海大男人 發送悄悄話 上海大男人 的博客首頁 (0 bytes) () 01/28/2025 postreply 07:08:58

同樣的問題,chatgpt 回答的如何? -拍浪- 給 拍浪 發送悄悄話 (0 bytes) () 01/28/2025 postreply 07:21:38

似乎比DS差。DS還會BS一下通用理論,CHATGPT好像亂說的連邊都答不上。 -顏陽- 給 顏陽 發送悄悄話 顏陽 的博客首頁 (0 bytes) () 01/28/2025 postreply 08:13:24

很好的體驗,多謝回複。 -拍浪- 給 拍浪 發送悄悄話 (0 bytes) () 01/28/2025 postreply 09:15:44

請您先登陸,再發跟帖!