個人資料
  • 博客訪問:
正文

Deepseek 風暴

(2025-01-28 10:40:41) 下一個

我在2025展望貼裏說到AI會有重大突破,成為真真的生產力,但沒想到風暴來得這麽快,中國杭州一家才一年的初創公司推出的deepseek 在周一如五級颶風重創全球科技股板塊,有的跌幅曾高達近40%。據眾多業內行家的專業測試,它的性能總體看齊chatgpt,幾個領域譬如數學高於gpt,我自己試了試,速度太慢,沒耐心做長的對話,以後再試,可能是服務器容量太小給擠爆了,據說還有大量網絡攻擊,和deepseek 大模型本身性能恐怕無關。

但技術性能還不是關鍵,科技進步總是後浪高過前浪,關鍵是deepseek取得這樣傲人的性能據報隻用了chatgpt幾十分子一的成本,包括數量級減少的用於語言大模型學習的圖像處理器數目和能耗,這是十分驚人的, 如chatgpt的早期版本,deepseek大方公開了源碼,如果實力雄厚的大公司用資金,算力和人才杠杆撬動進一步開發,其成果將難以預料,其一;其二,它模型訓練的廉價,極大降低了應用的門檻,譬如某家民間網調公司可以下載它的開碼,適化後在一架laptop上就能訓練特定領域的用戶信息,而無需雲計算。所以,雖然目前的deepseek 並不代表重大的生產力意義上的突破,但它打開的這扇窗,一下讓人看到遠得多寬得多的前景。

必須一提的是,deepseek雖然一時讓科技股跳水,但從中長期來看,絕對是AI科技版的利好消息,AI界注入新血更具活力,更有競爭,不但是公司間的,也是不同技術間的,甚至還有方法論上的比較。

也有人說deepseek故意低報了圖像處理器的使用數量以減少美國在這方麵封鎖的壓力,可能(從圖像處理器巨頭英偉達股暴跌可見一斑),但它即使減少一半算能也是了不起的成就哦。覺得另一方麵這也意味著deepseek 優化其算法的一個動因,這我得為咱中國人驕傲,精打細算苦幹巧幹是我們的美德哈,不是玩笑,我們看其公布的算法技術優化細節,精打細算苦幹巧幹還真挺好地概括了其特點,這以後再細說了。

[ 打印 ]
閱讀 ()評論 (0)
評論
目前還沒有任何評論
登錄後才可評論.