對於DS是不是全新的model,還是抄襲,甚至偷竊,看了幾個專家的分析,包括OpenAI前資深工程師的分析,我來大概總結一下:DS的確是發明了一種新的model,或者說是在原來的model上有了巨大的改進。用外行能聽懂的話來解釋,其實很簡單,大概的思路是這樣的: 原來的模型在每一個節點上,先判斷出下一步有哪些可能性,然後再逐次對下一步的每一種可能性進行同樣的思考和處理,因為每個節點後的可能性是天文數字,所以從深度和廣度上看,近乎於無窮無盡。如果按這種思路去探求,對計算機的算力的要求就成了一個天文數字,所以大家都在瘋狂的買更強大的芯片,蓋更大的數據中心,由此也對電耗產生極大的需求,這種approach實際上是在用brutal force (蠻力) 來解決問題。俗話說富人有富人的活法,窮人有窮人的活法。沒有那麽大的財源,加上芯片的禁運,DS極大地改進了原來的model。DS的model是在許多節點上,不是盲目的把下一步的全部的可能性都羅列出來,逐一去seek,而是做一些邏輯推理和判斷,把那些完全不靠譜和不太靠譜的可能性排除,集中精力於那些成功率更大的可能性,這樣一來,巨量的下一步的可能性都被篩除了,於是就有了巨大的 performance improvement,成本也就下來了。可以說DS的model是一個smart model。所以AI industry下一步的發展不是急著去買更大更快的芯片,而是follow DS的思路去改進自己的model,使它變得聰明起來。當然這種思路的改變肯定會對AI industry的布局產生重大影響,進而影響股市。
對於DS是不是全新的model,還是抄襲,甚至偷竊,看了幾個專家的分析,包括OpenAI前資深工程師的分析,我來大概總結
所有跟帖:
• 這個分析有點搞笑,咋會是 brutal force, 那麽多工程師就這點出息? -TitaniumAtlas- ♀ (0 bytes) () 01/30/2025 postreply 17:08:19
• 這點邏輯,學計算機的都知道. haha. -Htbain5898- ♂ (0 bytes) () 01/30/2025 postreply 17:22:45