英偉達平台上線DeepSeek 留給人工智能4個新問題

文章來源: - 新聞取自各大新聞媒體,新聞內容並不代表本網立場!
被閱讀次數
英偉達網站顯示,DeepSeek-R1模型已作為NVIDIA NIM微服務預覽版在英偉達麵向開發者的網站上發布。英偉達網站介紹稱,DeepSeek-R1模型是最先進、高效的大型語言模型,在推理、數學和編碼方麵表現出色。

英偉達平台上線DeepSeek 留給人工智能4個新問題

DeepSeek留給人工智能4個新問題

從1月20日DeepSeek公司(全稱杭州深度求索人工智能基礎技術研究有限公司)發布DeepSeek-R1算起,十餘天內,在全球範圍內快速掀起關注熱潮,成為AI發展曆史上的現象級事件之一。

至1月27日,在蘋果App Store中國、美國區免費榜上,DeepSeek均成為第一, 超過了來自OpenAI的ChatGPT。



除了鋪天蓋地的溢美之詞之外,最值得關注的兩則評論,分別來自美國總統特朗普和OpenAI首席執行官薩姆·奧爾特曼。

特朗普認為,中國的DeepSeek公司“提出了一種更快、更便宜的人工智能方法,我認為這是積極的”,“(這)給我們(美國)的行業敲響警鍾,我們需要專注於競爭以贏得勝利。”

薩姆·奧爾特曼於1月27日晚在社交媒體上發文,稱“DeepSeek-R1是一款令人印象深刻的模型,尤其是考慮到它能夠以這個價格提供”,“有這樣的新競爭對手確實令人振奮。”

網紅效應總會過去,一番喧鬧之後,DeepSeek至少給AI領域留下四個需要深度思考和直麵的真問題:

DeepSeek能夠從“網紅”到“長紅”嗎?

當DeepSeek已經用低價策略走出一條獨特的路後,AI大模型還會繼續走昂貴之路嗎?

AI大模型到底要走開源還是閉源之路?

以及,如何看待DeepSeek之後的中美AI技術水平差距?換言之,中國真的借DeepSeek之機實現“彎道超車”了嗎?

一鯨落,萬物生,新的局麵,也孕育著新的挑戰。



DeepSeek能否從“網紅”到“長紅”?

近幾天的表現反映出,DeepSeek並不是一個網紅AI產品這麽簡單,全球各界已經歸納出其爆火的幾個原因。

在開發背景方麵,DeepSeek出自中國,而不是AI技術能力更為領先的美國;而且,其開發者也不是中國的互聯網大廠,或者是AI“六小虎”等知名企業,而是一家中國初創公司,有西方網友甚至稱其為“來自東方的神秘力量”。

性價比方麵,DeepSeek能力強、體驗感佳,水平堪比OpenAI相關產品,但價格僅僅是後者的百分之幾。

在發展路徑方麵,DeepSeek與OpenAI“反著來”,成本低,所需算力少,一定程度上打破了AI大模型研發的“高價”神話。同時,與全球AI大模型龍頭企業主要走閉源路線完全不同,DeepSeek技術路線完全開源,再次挑動了“開閉源之爭”話題。

1 月 27 日,現象級國產遊戲《黑神話:悟空》的製作人馮驥評價稱,DeepSeek“可能是個國運級別的科技成果”。

他點評DeepSeek說,“如果有一個 AI 大模型做到了以下(六條)的任何一條,都是超級了不起的突破。但DeepSeek 全部、同時做到了。”他提到的DeepSeek六大亮點,分別為強大、便宜、開源、免費、聯網和本土。

任何一款“網紅”產品的產生都有其獨特的內外部原因,同時,“網紅”的宿命有兩種,即成為“長紅”或止於網紅。

在中國AI業內人士看來,自2023年7月成立起,DeepSeek已有過兩次“高光時刻”。這次在全球火出圈,可以稱得上是DeepSeek的第三次高光時刻。

第一次在DeepSeek籌備成立期間。在2023年5月,正在組建DeepSeek公司的量化基金公司幻方就被媒體曝出可能擁有超過1萬枚英偉達GPU,是幾家頭部大廠之外持有算力資源最多的公司。在當時,中國的AI“六小虎”也還在初創或籌建階段。

業內一般認為,1萬枚英偉達A100芯片是做自訓大模型的算力門檻。從之後美國限製中國進口英偉達芯片的舉措來看,DeepSeek的創始者極有遠見和魄力。

第二次是2024年5月,中美市場上“百模大戰”最激烈的時刻,DeepSeek突然宣布對大模型大幅降價,掀起“價格戰”,其降幅甚至達行業水平9成以上。之後中國AI全行業在兩周內迅速跟進,外界直呼“讓大模型降成白菜價”。

此次DeepSeek走紅之時,其在正式發布的資料中自豪地介紹,DeepSeek-R1 在後訓練階段大規模使用了強化學習技術,在僅有極少標注數據的情況下,極大提升了模型推理能力。在數學、代碼、自然語言推理等任務上,性能比肩 OpenAI o1 正式版。

DeepSeek公布的性能測試比對成果。 圖|DeepSeek官方微信

DeepSeek公布的性能測試比對成果。 圖|DeepSeek官方微信

可以預見,不用很久,DeepSeek將成為中國AI領域正式的“新貴”,估值有望超過“六小虎”水平。但與此同時,DeepSeek麵臨的國內外競爭也將更加激烈。

從技術上看,細觀全球業內人士評價可發現,DeepSeek-R1的水平與OpenAI o1“水平相當”,而不是領先。考慮到OpenAI o1發布已有4個月左右,之後OpenAI仍然在繼續研究和精進,所以DeepSeek的水平能否與即將發布的新模型“水平相當”,或長期保持在較高技術水平上,還未可知。

從國外競爭形勢看,DeepSeek對美國AI行業的刺激很大,未來技術起點高於中國企業的美國AI行業必然會更加進取。

1月21日,特朗普在上任美國總統後第二天,就在白宮宣布了一項名為“星際之門”(Stargate)的人工智能項目,將由美國甲骨文公司、OpenAI和日本軟銀集團聯合出資5000億美元打造。

除了特朗普的“星際之門”計劃會更快速推進之外,近期包括OpenAI在內的AI巨頭已經進行了戰略微調。紮克伯格的Meta已宣布,2025年投資高達650億美元用於與人工智能密切相關的項目,包括新建設一個規模巨大的AI數據中心以及大幅擴充AI領域人才,增加Meta人工智能團隊實際規模。

在國內,各互聯網大廠與AI“六小虎”、“四小龍”,甚至其他較小型的大模型公司,也必然會如美國企業般調整戰略和技術路線,進行新競爭。未來有下一個DeepSeek的出現,也不是沒有可能。

同時,國內外對AI感興趣的資本,以及各家互聯網大廠,普遍有興趣對DeepSeek或投資或合作。如此關鍵和微妙時刻,考驗著DeepSeek掌舵人的智慧。

全球AI發展形勢“一月千裏”,未來對於DeepSeek來說,不再是“不進則退”的局麵,而是“不快則退”。想要從“網紅”到“長紅”,並不容易。



AI大模型還會繼續走“燒錢”之路嗎?

貴、燒錢,是AI大模型效用足夠激動人心的另一麵。

AI大模型最燒錢的部分是算力,需要海量性能最先進的GPU芯片,其運行還需要巨量的電力能源支持;其技術核心是算法,需要大量頂級的人工智能專家和技術人員參與研發。

因此可以看到,美國的AI大模型項目動輒投資數十億美元,大模型計劃動輒投資數百億美元、上千億美元。

但DeepSeek此次對上述模式進行了一次讓人震撼的改變——一家小型初創公司,僅100多名研發人員,在算力受限情形下,使用相對“極低”的訓練費用,訓練出技術水平堪比全球頂極的AI大模型,且實現了“極低”的用戶收費。

據央視網報道,DeepSeek公司R1模型訓練成本僅為560萬美元,遠遠低於OpenAI 、穀歌等美國科技巨頭在人工智能技術上投入的“數億美元乃至數十億美元”。

伴隨著技術的精進,AI大模型研發的成本已經走上快速下行通道,DeepSeek顯然大大加速了降本進程,而且從行業反映看,確實存在進一步加速降本的可能性。

DeepSeek頁麵截圖

DeepSeek頁麵截圖

但是,如果據此認為DeepSeek終結了AI大模型研發的昂貴路線,恐怕為時尚早。

首先,現階段的DeepSeek R1其實隻是AI大模型的一個具有“深度思考”功能的分支,一個分支的低成本還不能代表全部大模型能走上低成本之路。事實上,低成本之路能否走通,還需要全行業進行較長時間的驗證。

其次,包括DeepSeek在內的中外AI大模型行業,真正要實現的目標並不是AI大模型本身,而是AGI——通用人工智能。目前業內尚不能確認AI大模型是否是實現AGI的正確解,更不能確認未來的AGI研發之路是否昂貴。

再次,從市場近期反應看,“終止昂貴之路”一說還沒得到更進一步支持。

芯片巨頭英偉達股價雖然多日下跌,但跌幅尚有限,美國科技股同樣跌幅有限。此外,市場上暫時還沒有傳出AI大模型項目或計劃大幅向下調整預算的消息,而Meta在2025年高達數百億的AI預算甚至是在DeepSeek爆火之後才傳出。



開源,還是閉源?

無論美國還是中國,AI大模型領域的開源、閉源之爭,均持續已久。

DeepSeek是堅定的開源路線支持者。任何人均可自行下載與部署,且提供論文詳細說明了訓練步驟與竅門,甚至DeepSeek APP上提供了用戶可見的AI思考、推理過程。

DeepSeek爆火後,UC伯克利、港科大、HuggingFace等機構根據開源信息,紛紛實現低成本複現,對外稱僅花30美元就能見證“啊哈時刻”(指可以令用戶眼前一亮的時刻)。

原本,閉源路線在中美均有隱隱占優之勢,但DeepSeek橫空出世並爆火,增加了太多變數,勢必會在業內再次引發開源、閉源之爭。

DeepSeek在官方公眾號上稱:“以開源精神和長期主義追求普惠AGI,是 DeepSeek 一直以來的堅定信念。我們非常興奮能與社區分享在模型預訓練方麵的階段性進展,也十分欣喜地看到開源模型和閉源模型的能力差距正在進一步縮小。”

同樣堅持開源路線的Meta 的首席人工智能科學家Yann LeCun近期發文表示,DeepSeek 的成功“並不是中國的人工智能超越了美國,而是開源模型正在超越專有模型”。

其在文中還表示,“DeepSeek受益於開放研究和開源,Meta的Llama也是如此。OpenAI 最初是一家開源人工智能公司,其使命是創造造福全人類的技術,但最近已轉向閉源。”該評論對於閉源路線,隱有火藥味兒。

閉源自有其道理。AI基礎性研發投入巨大,閉源可以讓企業更有動力投入,並利用技術領先獲得市場地位,然後進行市場變現。而開源意味著技術共享,市場收益一般較閉源要小。

其中的典型代表便是蘋果。蘋果智能手機的操作係統和係列軟件是閉源生態,當蘋果市占率實現全球第一時,其“贏家通吃”效應顯著。蘋果之所以能長期拿走全球智能手機大部分利潤,與其閉源生態密切相關。而安卓係統為開源生態,穀歌利用技術共享的方式開放給大量手機廠商,其賺錢方式為技術授權和知識產權收費模式。其利潤遠小於蘋果。



2024年7月5日,百度CEO李彥宏在一場圓桌訪談中對開源與閉源模型進行了討論,並談了堅持閉源路線的理由。他解釋說,同樣參數規模下,開源模型的能力不如閉源,閉源模型可以根據用戶需求提供多種變體,以平衡效果、推理速度和成本;無論是ChatGPT還是百度的文心一言,這些閉源模型的平均水平都比開源模型更強大,推理成本也更低。

對於開源模型,李彥宏也承認其價值。他表示,開源模型在一些學術研究、教學等領域有存在價值,可以用於研究大模型的工作機製,形成理論。

其實開源、閉源模式之爭的背後,是關於如何平衡技術創新、商業利益和市場競爭力的討論,是難以給出標準答案的選擇題,並沒有優劣與對錯。



DeepSeek拉近了中美AI的技術差距嗎?

DeepSeek爆火之後,大量的樂觀評論也隨之而來,認為意味著中美在AI領域的差距到了“微乎其微”的地步,甚至,還有人說中國已實現“彎道超車”。

DeepSeek還引發了資本市場的劇烈反應,有西方媒體稱其為中國大模型“爆擊華爾街”。

1月27日,美國股市開盤後,科技板塊整體下跌,其中美國芯片巨頭英偉達(NVIDIA)暴跌約17%。隨後,美國、歐洲電力供應商的股價也遭受重創(AI大模型預訓練、運行等對能源需求巨大)。

英偉達近期股價走勢

英偉達近期股價走勢

甚至,有經濟分析認為,DeepSeek可能影響全球經濟。例如德銀策略師George Saravelos在最新報告中認為,DeepSeek的出現可能對全球經濟產生“積極的供應衝擊”,甚至可能使美元“麵臨邊際下行壓力”。

客觀、冷靜地看,DeepSeek當然是重要的局部突破,但整體上中國AI領域尤其AI大模型領域與美國還是有著一定差距的。

首先,DeepSeek-R1代表大模型的“深度思考”能力,是通用大模型的一部分能力,因此其水平接近美國市場的頭部同類模型,且是更早(4個月前)發布的模型,是一種局部突破,而非整體突破。

其次,盡管DeepSeek通用大模型V3也廣受好評,但其受好評的前提是其具有極致的性價比,“性能接近”美國頭部產品,且價格更低(是對方的百分之幾)。顯然,這不代表V3真的與ChatGPT在技術上沒有差距。

再次,中國AI行業與美國行業在算法、算力和數據上的差距依然沒有實質性改變。

算法方麵,美國是AI大模型的原創研發國,技術路線和發展方向目前均主要由美國引領。算力方麵,美國目前具有絕對優勢,且隨著美國對英偉達GPU芯片的出口限製日益嚴格,中國受限會愈加嚴重,而國內自主研發雖有重大進展,但尚需追趕和突破時間。數據方麵,中文數據存在數量少且“互聯網孤島”加劇之勢。

最後,從市場表現看中美差距依然較大。與美國相比,我國AI企業數量較多,但核心產業規模明顯偏小。並且,我國AI企業估值與美國AI企業估值有拉大之勢,OpenAI市場估值超過1萬億元人民幣,馬斯克主導的xAI估值已達400億美元,而我國“六小虎”估值普遍為100億至數百億人民幣,互聯網大廠則普遍沒有因為發展AI大模型得到較多的AI賦分。

盡管DeepSeek爆火不能完全代表中美AI技術水平接近,但確實進一步縮短了中美AI的技術差距。至於縮短了多少,或許還需要市場後續發展來給出答案。

查看評論(24)