是我發的,所以你想說什麽呢?

來源: 2025-02-21 07:56:10 [舊帖] [給我悄悄話] 本文已被閱讀:

因為deepseek達到同等效果用的資源比chatgpt少,所以scaling law沒問題? 可是deepseek再把參數提升上去本身效果也遠不是(log)線性的了。