老鍵腦電波

個人資料

老鍵

博客訪問：

Deepseek 風暴

(2025-01-28 10:40:41) 下一個

我在2025展望貼裏說到AI會有重大突破，成為真真的生產力，但沒想到風暴來得這麽快，中國杭州一家才一年的初創公司推出的deepseek 在周一如五級颶風重創全球科技股板塊，有的跌幅曾高達近40％。據眾多業內行家的專業測試，它的性能總體看齊chatgpt，幾個領域譬如數學高於gpt，我自己試了試，速度太慢，沒耐心做長的對話，以後再試，可能是服務器容量太小給擠爆了，據說還有大量網絡攻擊，和deepseek 大模型本身性能恐怕無關。

但技術性能還不是關鍵，科技進步總是後浪高過前浪，關鍵是deepseek取得這樣傲人的性能據報隻用了chatgpt幾十分子一的成本，包括數量級減少的用於語言大模型學習的圖像處理器數目和能耗，這是十分驚人的, 如chatgpt的早期版本，deepseek大方公開了源碼，如果實力雄厚的大公司用資金，算力和人才杠杆撬動進一步開發，其成果將難以預料，其一；其二，它模型訓練的廉價，極大降低了應用的門檻，譬如某家民間網調公司可以下載它的開碼，適化後在一架laptop上就能訓練特定領域的用戶信息，而無需雲計算。所以，雖然目前的deepseek 並不代表重大的生產力意義上的突破，但它打開的這扇窗，一下讓人看到遠得多寬得多的前景。

必須一提的是，deepseek雖然一時讓科技股跳水，但從中長期來看，絕對是AI科技版的利好消息，AI界注入新血更具活力，更有競爭，不但是公司間的，也是不同技術間的，甚至還有方法論上的比較。

也有人說deepseek故意低報了圖像處理器的使用數量以減少美國在這方麵封鎖的壓力，可能（從圖像處理器巨頭英偉達股暴跌可見一斑），但它即使減少一半算能也是了不起的成就哦。覺得另一方麵這也意味著deepseek 優化其算法的一個動因，這我得為咱中國人驕傲，精打細算苦幹巧幹是我們的美德哈，不是玩笑，我們看其公布的算法技術優化細節，精打細算苦幹巧幹還真挺好地概括了其特點，這以後再細說了。

[ 打印 ]

[ 加入書簽 ]

閱讀 ( ) ┆ 評論

評論

目前還沒有任何評論

登錄後才可評論.