對於DS是不是全新的model，還是抄襲，甚至偷竊，看了幾個專家的分析，包括OpenAI前資深工程師的分析，我來大概總結

來源: 霧蒙蒙雨霏霏於 2025-01-30 16:14:24 [檔案] [博客] [舊帖] [給我悄悄話] 閱讀數 : (1764 bytes)

回答: 黑的時候要有點常識，質量太差為何微軟和小紮昨天都表示要用到自己的模型中由花點牛牛於 2025-01-30 15:52:28

對於DS是不是全新的model，還是抄襲，甚至偷竊，看了幾個專家的分析，包括OpenAI前資深工程師的分析，我來大概總結一下：DS的確是發明了一種新的model，或者說是在原來的model上有了巨大的改進。用外行能聽懂的話來解釋，其實很簡單，大概的思路是這樣的：原來的模型在每一個節點上，先判斷出下一步有哪些可能性，然後再逐次對下一步的每一種可能性進行同樣的思考和處理，因為每個節點後的可能性是天文數字，所以從深度和廣度上看，近乎於無窮無盡。如果按這種思路去探求，對計算機的算力的要求就成了一個天文數字，所以大家都在瘋狂的買更強大的芯片，蓋更大的數據中心，由此也對電耗產生極大的需求，這種approach實際上是在用brutal force （蠻力）來解決問題。俗話說富人有富人的活法，窮人有窮人的活法。沒有那麽大的財源，加上芯片的禁運，DS極大地改進了原來的model。DS的model是在許多節點上，不是盲目的把下一步的全部的可能性都羅列出來，逐一去seek，而是做一些邏輯推理和判斷，把那些完全不靠譜和不太靠譜的可能性排除，集中精力於那些成功率更大的可能性，這樣一來，巨量的下一步的可能性都被篩除了，於是就有了巨大的 performance improvement，成本也就下來了。可以說DS的model是一個smart model。所以AI industry下一步的發展不是急著去買更大更快的芯片，而是follow DS的思路去改進自己的model，使它變得聰明起來。當然這種思路的改變肯定會對AI industry的布局產生重大影響，進而影響股市。

您的位置：文學城 » 論壇 » 投資理財 » 對於DS是不是全新的model，還是抄襲，甚至偷竊，看了幾個專家的分析，包括OpenAI前資深工程師的分析，我來大概總結

所有跟帖：

• 這個分析有點搞笑，咋會是 brutal force, 那麽多工程師就這點出息？ -TitaniumAtlas- ♀ (0 bytes) () 01/30/2025 postreply 17:08:19

• 這點邏輯,學計算機的都知道. haha. -Htbain5898- ♂ (0 bytes) () 01/30/2025 postreply 17:22:45

請您先登陸，再發跟帖！