今年的春節可真是熱鬧啊,吃喝玩樂之餘,如何評價DeepSheek的爭辯,國內外的褒貶雙方鏖戰還在繼續,這讓我想起了張維迎曾對我國科技上的不端現象比喻說:牛頓花了30年時間才發現了萬有引力,而我呢,花了3個月時間明白了萬有引力,但如果我現在說,我用了3個月的時間,走完了牛頓30年才走的路,是不是有點好笑;而且,如果我再反過來嘲笑牛頓,那隻能說明我真的太無知了。
風聲是鳳凰網的公眾號,在大年初三的今天,讀到剛發表的時評“DeepSeek是國運級的突破嗎?....”,裏麵的一段話很有代表性,拷貝如下:
“質疑DeepSeek這種‘小快靈’的技術綻放,是否會如春節煙花般轉瞬即逝,最終被美國AI企業的算力優勢和技術封鎖繼續壓不得動彈。
如果DeepSeek R1僅僅是一個從OpenAI模型中蒸餾現成數據,用中國企業擅長的工程優化來做一個廉價平替的工具,這種擔憂並非沒有道理。
但當我們看到DeepSeek放下種種顧慮,毅然而然選擇了真正的開源時,實際上我反而對其未來充滿了信心。”
這裏有2個關鍵詞:蒸餾,開源。先看“蒸餾”是個什麽東東?查到維基百科:知識蒸餾,而百度百科尚未設有關條目。
維基百科:知識蒸餾是人工智能領域的一項模型訓練技術。該技術透過類似於教師—學生的方式,令規模較小、結構較為簡單的人工智能模型從已經經過充足訓練的大型、複雜模型身上學習其掌握的知識。該技術可以讓小型簡單模型快速有效學習到大型複雜模型透過漫長訓練才能得到的結果,從而改善模型的效率、減少運算開銷,因此亦被稱為模型蒸餾。
該條目有旁注:“本條目近期正在擴充或大幅編修。”,可見“知識蒸餾”是隨著AI的興起而有的新概念,還有待於完善,比如學生透過老師來學技術,是否要得到老師的同意,否則是否侵犯了知識產權?顯然至今還未有規範,所以DeepSheek從OpenAI模型ChatGPT中蒸餾到的現成數據,應該是無可指責的。
美國現在雖氣得跳腳,也隻能待遊戲規則完善之後再說了。其實美國的態度可以理解,因為在風聲時評的這段話裏,如果把中國和美國的位子對調一下,基於“政治正確”的立場,想必中國也會氣得跳腳的。而在有新遊戲規則之後,別說DeepSheek會主動停止從OpenAI蒸餾,就是美國,也必然會像卡我國芯片脖子一樣,再簽署禁令,先先就堵住了DeepSheek獲取知識的渠道,不過那都是下一步的將來式了。
那麽,什麽又是“開源”呢?維基百科:開源軟件,又稱開放源代碼軟件,是源代碼可以任意獲取的計算機軟件,這種軟件的版權持有人在軟件協議的規定下保留一部分權利,並允許用戶學習、修改以及以任何目的向任何人分發該軟件。百度百科:開源程序,被非營利軟件組織注冊為認證標記,並對其進行了正式的定義,用於描述那些源碼可以被公眾使用的軟件,並且此軟件的使用、修改和發行也不受許可證的限製。
可見對“開源”的理解,兩者沒有原則性差別。DeepSeek正是開源的AI平台,在外行人看起來就像誌願者,是在出於好心做慈善一樣,在爭辯中總能占理;雖然“劫富濟貧”的做法,總是沒法令人人都滿意。
更多我的博客文章>>>