我認為LLM 算法一直會改進,目前Deepseek出現,相當於定製版的LLM,或者硬件中的ASIC,就是針對它要分析的數據做定製的算法。
https://wallstreetcn.com/articles/3738170
文章中提到deepseek用的是在開頭篩選數據源裏的信息,利用A800的芯片特點,提高parallel的處理數據能力,同時側重處理某些類型的數據,而弱在某些方麵的數據處理。總之是看到數據,然後偏科處理,這樣在大多數方麵反應速度不錯,但是全麵分析來看,還有欠缺。對大多數專業的需要精密和準確的判斷工作來說,沒法用,因為它的一個錯誤信息就會導致失去同行的信任。
這種實際上是NVDA必須要麵對的,我在2023年就有類似的判斷,對NVDA是好事,因為GPU需要麵對不同的task做處理。今天是不同的算法,明天可能是不同的task,訓練robot,或者訓練某個行業的智能係統如無人戰鬥機。而這可是avgo這種定製芯片係統的風險。