我在2025展望貼裏說到AI會有重大突破,成為真真的生產力,但沒想到風暴來得這麽快,中國杭州一家才一年的初創公司推出的deepseek 在周一如五級颶風重創全球科技股板塊,有的跌幅曾高達近40%。據眾多業內行家的專業測試,它的性能總體看齊chatgpt,幾個領域譬如數學高於gpt,我自己試了試,速度太慢,沒耐心做長的對話,以後再試,可能是服務器容量太小給擠爆了,據說還有大量網絡攻擊,和deepseek 大模型本身性能恐怕無關。
但技術性能還不是關鍵,科技進步總是後浪高過前浪,關鍵是deepseek取得這樣傲人的性能據報隻用了chatgpt幾十分子一的成本,包括數量級減少的用於語言大模型學習的圖像處理器數目和能耗,這是十分驚人的, 如chatgpt的早期版本,deepseek大方公開了源碼,如果實力雄厚的大公司用資金,算力和人才杠杆撬動進一步開發,其成果將難以預料,其一;其二,它模型訓練的廉價,極大降低了應用的門檻,譬如某家民間網調公司可以下載它的開碼,適化後在一架laptop上就能訓練特定領域的用戶信息,而無需雲計算。所以,雖然目前的deepseek 並不代表重大的生產力意義上的突破,但它打開的這扇窗,一下讓人看到遠得多寬得多的前景。
也有人說deepseek故意低報了圖像處理器的使用數量以減少美國在這方麵封鎖的壓力,可能(從圖像處理器巨頭英偉達股暴跌可見一斑),但它即使減少一半算能也是了不起的成就哦。覺得另一方麵這也意味著deepseek 優化其算法的一個動因,這我得為咱中國人驕傲,精打細算苦幹巧幹是我們的美德哈,不是玩笑,我們看其公布的算法技術優化細節,精打細算苦幹巧幹還真挺好地概括了其特點,這以後再細說了。