簡體 | 繁體
loading...
新聞頻道
  • 首頁
  • 新聞
  • 讀圖
  • 財經
  • 教育
  • 家居
  • 健康
  • 美食
  • 時尚
  • 旅遊
  • 影視
  • 博客
  • 群吧
  • 論壇
  • 電台
  • 焦點新聞
  • 圖片新聞
  • 視頻新聞
  • 生活百態
  • 娛樂新聞
您的位置: 文學城 » 新聞 » 焦點新聞 » 梁文鋒,有了“隆中對”

梁文鋒,有了“隆中對”

文章來源: 字母榜 於 2026-05-23 20:20:49 - 新聞取自各大新聞媒體,新聞內容並不代表本網立場!
被閱讀次數

這幾天,DeepSeek700億元融資的熱度還沒散去,另一條線索已經浮出水麵:它正把重心押向AI Coding。

近日,DeepSeek方麵連續發布了兩個新崗位:AgentHarness產品經理和Agent Harness研發工程師。

按照招聘信息的說法,DeepSeek正在把前沿模型能力轉化為Agent產品,模型之外的工作,都被歸入Harness範疇。入職者將加入Harness團隊,參與DeepSeek桌麵端Agent產品的研發全過程。

這幾句話,基本劃出了DeepSeek新業務的邊界。

DeepSeek資深研究員陳德裏在社交平台招人時,標題直接寫到“來DeepSeek從零做Code Harness”,並提到“對標Claude Code,做DeepSeek Code Harness”。

據了解,DeepSeek正在北京組建新的Harness團隊,目標是從零做自己的代碼Agent,內部工作名指向“DeepSeek Code”。

這個方向正踩在大模型商業化最熱的戰場上。

Claude Code已經把AICoding做成了項目級開發工具。Anthropic在2026年2月融資公告中披露,Claude Code年化收入超過25億美元,較2026年初翻倍;Claude Code周活用戶數也較今年年初翻倍。

另一邊,OpenAI在今年2月推出Codex桌麵App,把Coding Agent從命令行帶到多任務桌麵環境。OpenAI企業副總裁Ashley Kramer近期稱,Codex周活用戶在15天內從300萬增至400萬。

Google方麵也在I/O 2026後把Antigravity升級為2.0,外媒稱其從IDE轉向獨立桌麵應用,並加入CLI和SDK,直接瞄準Claude Code和Codex。

在組建Agent團隊之餘,DeepSeek也在模型側開始加速占領市場。其官方價格頁顯示,V4-Pro將在5月31日結束2.5折優惠後,正式維持該優惠價格。在此前的行業視角中,普遍認為V4的長上下文、高性價比特性更適合Agent應用。

700億融資口徑傳出後,DeepSeek像是劉皇叔有了“隆中對”。它一邊招兵買馬、廣納英才,一邊把戰線推向Code Harness。

A

圍繞Code Harness,DeepSeek首先在人才方麵補強。

幾天前,一些知名外媒陸續披露,DeepSeek招募了前Jane Street工程師崔添翼,而這一人才招募的目的,是“為了追趕AIAgent和商業化競爭”。

公開信息顯示,崔添翼加入的是DeepSeek新設的AIHarness團隊。同時還在招聘更多崗位,支持新的旗艦桌麵端Agent產品。

翻開崔添翼的履曆,會發現他有不同於傳統AI研究員招聘的意味。

崔添翼畢業於浙江大學計算機係,在校期間多次參加ACM-ICPC區域賽並獲得金牌;畢業後,他在Jane Street香港和紐約辦公室工作9年;2022年,他聯合創立TSY Capital。

Jane Street是一家全球量化交易公司。崔添翼曾在其香港和紐約辦公室工作近9年,職位是軟件開發者和研究員,覆蓋股票和固收業務。顯然,他的這段經曆覆蓋了交易係統和工程研發,而非傳統的學術派AI研究員。

崔添翼後來聯合創立TSY Capital。這家公司成立於2022年,總部在香港,做的是全球股票市場的程序化交易。

它用機器學習模型生成交易信號,再用Rust自研低延遲交易係統完成執行。

換句話說,這是一位“量化交易老兵”,一方麵讓人聯想到DeepSeek母公司幻方的主營業務領域,同時也表明,他和DeepSeek以及諸多AI公司傳統模型研究員的路徑不一樣。

DeepSeek過去靠基座模型開路出圈,而崔添翼進入Harness Team,說明DeepSeek Code背後需要另一類人:他們不一定是大模型論文作者,但做過真實係統,知道模型輸出落到執行層會出什麽問題。

梁文鋒,有了“隆中對”

從陳德裏的發言中,也能看到DeepSeek這一次招聘思路的轉變。

近日,他在社交平台確認,公司正在組建新的Harness團隊,方向是“對標Claude Code,做DeepSeek Code Harness”。這次招的也不是單純模型研究員,而是產品經理和研發工程師。

崗位描述顯示:Code Harness團隊成員要參與DeepSeek桌麵端Agent產品研發,還要和模型研究團隊協作,把真實任務裏的反饋帶回模型訓練。

順便再多提一下陳德裏,這位DeepSeek研究員不僅僅是R1的核心論文作者之一,也是DeepSeek為數不多經常公開露麵的內部人士。

去年11月烏鎮世界互聯網大會上,他代表DeepSeek參加“六小龍烏鎮對話”。陳德裏談AI短板時說,AI還不具備像人類一樣穩定的智能,模型訓練完後參數固定,無法像人一樣在真實世界中自我迭代。

而在一連串招聘信息熱度中,另一條線索是徐名宇。

最近一段時間,前DeepSeek資深研究員郭達雅的跳槽,揭開了AI行業人才爭奪戰的一角。

相關報道顯示,字節Seed團隊過去一年被挖走近70人,其中就包括Seed Edge長期研究計劃成員徐名宇,目前,他已加入DeepSeek模型結構組,從事模型結構相關研發。

在字節時期,徐名宇曾是論文DeltaFormer的第一作者,論文討論標準Transformer在狀態跟蹤任務上的表達限製,正文點名Python代碼執行、實體跟蹤、棋類等任務,並嚐試用DeltaNet增強Transformer處理狀態空間問題的能力。

徐名宇的加入,補的是DeepSeek Code背後的模型結構能力。崔添翼對應產品和係統工程,徐名宇對應更底層的連續任務能力,兩條線共同指向DeepSeek正在做的Code Agent。

Code Agent進入真實倉庫後,最容易暴露的問題也常常不是寫不出一個函數,而是十幾輪修改後忘記最初目標,跨文件改動後邏輯不一致,測試失敗後不能沿著舊狀態繼續修,這些考驗的都是模型在連續步驟中保存和更新狀態的能力。

另一邊,DeepSeek的Harness招聘,已經把對標對象寫得明明白白。官方披露的招聘信息稱,Agent Harness崗位要求候選人深度使用Claude Code、Cowork、Codex、Cursor、OpenCode、GitHub Copilot、Manus、OpenClaw、Hermes等產品。

顯然,DeepSeek Code的成長路上需要兩類經驗:一類來自真實係統,處理模型輸出後的執行後果;一類來自模型結構,處理多輪任務裏的狀態保持。持續的人才補強,也揭開了這一輪AI人才攻防戰的新一回合。

B

幾周前,DeepSeek核心人物郭達雅轉投字節,被外界視為DeepSeek的一次重要損失。

他的履曆與DeepSeek基座模型的幾塊基石有著緊密聯係。公開報道顯示,郭達雅專注代碼智能和大語言模型推理,參與過DeepSeek-Coder、DeepSeekMath、DeepSeek-Prover、V3、R1等項目。而在DeepSeek-Coder論文裏,他排在第一作者位置。

今年3月前後,郭達雅被曝從DeepSeek離職,隨後加入字節Seed。一些公開報道顯示,他看好Agent方向,而DeepSeek內部當時Agent優先級並不高;加入字節後,Seed內部正啟動圍繞Agent和Coding的組織整合。

回到幾周後的今天,手握數百億融資的DeepSeek,一邊開始奮起直追補課Harness Agent,一邊開始試圖引入更多“郭達雅”充實人才庫。



當然,這場人才攻防戰在郭達雅離職前就早已打響,而DeepSeek從未停止過在Coding等模型垂直方向的人才引入。

近期披露的2026字節跳動獎學金名單中,就有一個值得關注的名字。

據字節方麵披露,字節跳動獎學金至今支持了67位青年研究者;2023年得主路橙、朱琪豪分別是OpenAI Sora2和DeepSeek GRPO的重要研究貢獻者。

其中,朱琪豪是北京大學計算機學院2024屆博士畢業生,專注深度代碼學習。他在DeepSeek團隊中基於博士論文工作,主導開發了DeepSeek-Coder-V1;此後又出現在DeepSeek-Coder-V2和DeepSeekMath/GRPO相關論文中,是DeepSeek代碼模型和強化學習路線裏的早期參與者。

值得關注的是,在DeepSeek-Coder的迭代曆程中,朱琪豪的位置有一個清晰變化。

DeepSeek-Coder V1的作者列表裏,郭達雅排在朱琪豪之前;到了DeepSeek-Coder V2,朱琪豪的名字已在郭達雅之前。

作者順序當然不能直接等同於內部貢獻大小,但對一條連續迭代的技術線來說,毫無疑問傳遞出的信號是,朱琪豪是DeepSeek係列模型Coding能力的絕對核心人物。

另一條不能忽略的是多模態。

在Chatbot形態裏,DeepSeek的多模態短板還不明顯。用戶主要用文字提問,模型隻要在推理、寫作、代碼和長上下文上表現足夠強,就能支撐大部分使用場景。DeepSeek過去一年最強的公眾認知,也確實來自R1、V3、V4,以及低成本API。

但桌麵端Agent會改變這個前提。代碼Agent如果進入開發者電腦,就不隻是在聊天框裏回答問題,還要理解IDE界麵、終端報錯、瀏覽器文檔和截圖反饋。換句話說,讀屏能力會從“加分項”變成基礎能力。

潘梓正,是DeepSeek多模態業務中被公開披露較多的名字。

去年2月,多家媒體轉述了英偉達高級研究科學家禹之鼎的社媒內容。禹之鼎回憶,潘梓正2023年夏天曾在NVIDIA實習,當時NVIDIA考慮給他全職機會,但潘梓正“毫不猶豫”選擇回國加入DeepSeek;那時DeepSeek多模態團隊隻有幾個人。

禹之鼎還提到,潘梓正在DeepSeek-VL2、DeepSeek-V3和DeepSeek-R1等多個項目中發揮了“關鍵作用”。他寫道,潘梓正的案例是近年來他看到的典型例子:很多最優秀的人才來自中國,這些人才不一定隻能在美國公司取得成功,美國研究者也能從他們身上學到很多。

DeepSeek-VL2的能力方向,和Code Harness並不遠。VL2覆蓋視覺問答、OCR、文檔、表格、圖表理解和視覺定位;這些能力放到桌麵端Agent裏,正好對應讀屏、讀報錯、讀網頁文檔和理解界麵元素。

但DeepSeek多模態近期缺少一個真正站到台前的突破。Janus-Pro在2025年1月發布,DeepSeek稱其圖像生成能力超過DALL-E 3和Stable Diffusion;VL2則停留在2024年12月的視覺語言模型更新。

這意味著,DeepSeek已有讀屏和視覺理解的技術底子,但還沒把多模態打成和R1推理、V4長上下文一樣清晰的品牌標簽。如果DeepSeek Code真要做桌麵端Agent,多模態大概率仍是後續補人的方向。

回到陳德裏在去年烏鎮世界互聯網大會上的講話,他在談AI穩定性時說,模型訓練完後參數固定,不能像人一樣在真實世界中自我迭代。他提到的方向,是讓AI具備穩定學習算法,並通過多模態等方式與真實世界建立更多連接。

麵對著大模型發展行業的卡點,DeepSeek內部有著清晰的認知。但回過頭看過去一年的更新緩慢和人才流失,顯然大模型競爭是一個考驗資本厚度和耐力的長期作戰,需要更多“彈藥”供給,700億融資到位後,不隻是Code Harness,也許DeepSeek也將進入多線敘事的快速鋪開產品的邏輯。

C

隻看基座模型,DeepSeek已經站進第一梯隊,但也並非領跑位置。

新一代DeepSeek-V4-Pro在代碼基準和Agentic任務上縮小了與領先閉源模型的差距。DeepSeek V4-Pro在SWE-bench Verified上達到80.6%,接近Claude Opus 4.6。

此外,DeepSeek V4在Vibe Code Bench中成為開源權重模型第一,得分49.9%,也是唯一超過40%的開源權重模型。

但是,強模型和強產品,本質上還是兩件事。Claude Code的商業化數據,是DeepSeek無法繞開的參照。

Anthropic披露Claude Code年化收入超過25億美元後,外界對AICoding的估值邏輯已經變了。它不再隻是模型公司展示能力的Demo,而是可以直接貢獻收入的產品線。

Claude Code的形態也已經超出聊天框。

它能在開發者代碼庫中工作,通過終端、IDE、桌麵端、Slack和網頁使用;在本地終端運行時,會在該文件或運行命令前請求授權。這個設計讓AICoding進化成了項目級的助手。

和Claude Code齊頭並進的,還有OpenAI的Codex、Google Antigravity 2.0,大廠正在把AICoding從編輯器插件推向獨立開發環境。

與此同時,這也是國產模型競爭最激烈的領域之一。

Kimi和智譜近期在Coding領域的跑分,先後進入了第一梯隊。SWE-Bench Pro成績顯示,Kimi K2.6為58.6%,GLM-5.1為58.4%,DeepSeek V4 Pro-Max為55.4%。

SWE-Bench Pro測的是工程修複能力。它選取真實GitHub項目中的Issue和測試用例,讓模型提交補丁,再看測試是否通過。在這組更難的任務裏,Kimi和GLM都跑在DeepSeek前麵。

DeepSeek也不是沒有強項。有評測顯示,V4 Pro在SWE-Bench Verified上達到80.6%。Verified版經過人工篩選,常用來觀察模型處理真實代碼問題的穩定性。



具體打法上,智譜通過GLM Coding Plan進入Claude Code、Cline、OpenCode等已有開發者工具,Kimi也有kimi-cli、Kimi Code等終端和代碼工具入口,同時還通過Cursor Composer等第三方產品進入開發者工作流。

而隨著DeepSeek Code Harness浮出水麵,DeepSeek將與這兩位國產同行一同競爭AICoding的用戶心智。

尤其是當這一輪融資被推到700億元時,DeepSeek正好站在Code Harness這個岔口。

此前,DeepSeek管理層向潛在投資者表示,融資落地後,會優先推進突破性AI研究,而不是短期商業化。

對DeepSeek來說,融資首先意味著算力池可以繼續做大。DeepSeek官網介紹中提到,其依托自研訓練框架、自建智算集群和萬卡算力資源;GitHub上,DeepSeek還開源了麵向AI訓練和推理負載的3FS分布式文件係統。

3FS可以理解成DeepSeek給大模型集群配的一套高速共享硬盤係統。訓練和推理時,GPU需要持續讀取數據、保存模型狀態,3FS負責把分散在多台機器上的SSD整合起來,通過RDMA網絡高速傳輸數據。

DeepSeek稱,這套係統在180節點集群裏跑到過6.6TiB/s的聚合讀取吞吐。

而更大的背景,是國產算力替代正在被V4推到前台。最新發布的DeepSeek V4已適配華為昇騰AI芯片,華為昇騰950超節點將完整支持V4。有行業分析指出,DeepSeek曾與華為、寒武紀合作改寫部分模型代碼,以適配國產硬件。

因此,DeepSeek Code Agent不隻是一個Agent產品,它很有可能是DeepSeek把模型能力、國產算力和用戶場景連起來的前沿入口:一端承接V4在國產硬件上的落地,一端進入開發者的生產流程。

2025年初,DeepSeek靠R1證明,一家中國模型公司可以突然改寫全球大模型敘事。

現在輪到Code Harness回答另一個問題:全球最成功的大模型公司之一,能不能在Agent領域再現一次DeepSeek神話。

`
  • 父親節送什麽?很多北美華人都在買這3款暢銷保健品:美國專利【骨精華】【心血通】【益腦靈】,優惠大促中!
`
查看評論(1)
  • 文學城簡介
  • 廣告服務
  • 聯係我們
  • 招聘信息
  • 注冊筆名
  • 申請版主
  • 收藏文學城

WENXUECITY.COM does not represent or guarantee the truthfulness, accuracy, or reliability of any of communications posted by other users.

Copyright ©1998-2026 wenxuecity.com All rights reserved. Privacy Statement & Terms of Use & User Privacy Protection Policy

24小時熱點排行

燃油車,真的沒人買了?
伊朗打臉川普:繼續控製荷莫茲海峽
華裔白宮通訊主任張振熙爆粗怒噴前國務卿蓬佩奧
曆史中的,統治者通過"講故事"的方式,形成國家意誌
毒楊梅15年前已被警示,可惜他們的詭辯一以貫之






24小時討論排行

習近平點名高市和賴清德威脅和平,川普"當場護航"
黃仁勳與家人在台灣聚餐!爸爸與哥哥都禿頂
緬北“四大家族”現狀:多人被執行死刑
美民意轉向 曾經通吃美政界的親以勢力開始買不動
金正恩「花10年秘密布局」讓女兒接班! 
魯比奧訪問印度被熱懵:太熱了,讓我長話短說
被要求隔離21天才能入美國參加世界杯 剛果隊急了
山西礦難“都到這個關鍵時刻了,難道還要隱瞞嗎?”
網紅號召"青少年占領"全美引爆混亂!商場,餐廳淪戰場
白宮槍手被擊斃!21歲男"自稱耶穌基督"有精神病史
武契奇抵北京:這無疑是我政治生涯中最重要訪問
華郵:北京私下促「延後、縮減對台軍售」
起底山西涉事煤礦:實控人是著名煤老板 億萬富豪
終戰不遠?盧比歐預告:幾小時內可能有"好消息"
北京的指示一到,山西煤礦的遇難者翻了十倍
伊朗隊將世界杯駐地從美國改至墨西哥
文學城新聞
切換到網頁版

梁文鋒,有了“隆中對”

字母榜 2026-05-23 20:20:49

這幾天,DeepSeek700億元融資的熱度還沒散去,另一條線索已經浮出水麵:它正把重心押向AI Coding。

近日,DeepSeek方麵連續發布了兩個新崗位:AgentHarness產品經理和Agent Harness研發工程師。

按照招聘信息的說法,DeepSeek正在把前沿模型能力轉化為Agent產品,模型之外的工作,都被歸入Harness範疇。入職者將加入Harness團隊,參與DeepSeek桌麵端Agent產品的研發全過程。

這幾句話,基本劃出了DeepSeek新業務的邊界。

DeepSeek資深研究員陳德裏在社交平台招人時,標題直接寫到“來DeepSeek從零做Code Harness”,並提到“對標Claude Code,做DeepSeek Code Harness”。

據了解,DeepSeek正在北京組建新的Harness團隊,目標是從零做自己的代碼Agent,內部工作名指向“DeepSeek Code”。

這個方向正踩在大模型商業化最熱的戰場上。

Claude Code已經把AICoding做成了項目級開發工具。Anthropic在2026年2月融資公告中披露,Claude Code年化收入超過25億美元,較2026年初翻倍;Claude Code周活用戶數也較今年年初翻倍。

另一邊,OpenAI在今年2月推出Codex桌麵App,把Coding Agent從命令行帶到多任務桌麵環境。OpenAI企業副總裁Ashley Kramer近期稱,Codex周活用戶在15天內從300萬增至400萬。

Google方麵也在I/O 2026後把Antigravity升級為2.0,外媒稱其從IDE轉向獨立桌麵應用,並加入CLI和SDK,直接瞄準Claude Code和Codex。

在組建Agent團隊之餘,DeepSeek也在模型側開始加速占領市場。其官方價格頁顯示,V4-Pro將在5月31日結束2.5折優惠後,正式維持該優惠價格。在此前的行業視角中,普遍認為V4的長上下文、高性價比特性更適合Agent應用。

700億融資口徑傳出後,DeepSeek像是劉皇叔有了“隆中對”。它一邊招兵買馬、廣納英才,一邊把戰線推向Code Harness。

A

圍繞Code Harness,DeepSeek首先在人才方麵補強。

幾天前,一些知名外媒陸續披露,DeepSeek招募了前Jane Street工程師崔添翼,而這一人才招募的目的,是“為了追趕AIAgent和商業化競爭”。

公開信息顯示,崔添翼加入的是DeepSeek新設的AIHarness團隊。同時還在招聘更多崗位,支持新的旗艦桌麵端Agent產品。

翻開崔添翼的履曆,會發現他有不同於傳統AI研究員招聘的意味。

崔添翼畢業於浙江大學計算機係,在校期間多次參加ACM-ICPC區域賽並獲得金牌;畢業後,他在Jane Street香港和紐約辦公室工作9年;2022年,他聯合創立TSY Capital。

Jane Street是一家全球量化交易公司。崔添翼曾在其香港和紐約辦公室工作近9年,職位是軟件開發者和研究員,覆蓋股票和固收業務。顯然,他的這段經曆覆蓋了交易係統和工程研發,而非傳統的學術派AI研究員。

崔添翼後來聯合創立TSY Capital。這家公司成立於2022年,總部在香港,做的是全球股票市場的程序化交易。

它用機器學習模型生成交易信號,再用Rust自研低延遲交易係統完成執行。

換句話說,這是一位“量化交易老兵”,一方麵讓人聯想到DeepSeek母公司幻方的主營業務領域,同時也表明,他和DeepSeek以及諸多AI公司傳統模型研究員的路徑不一樣。

DeepSeek過去靠基座模型開路出圈,而崔添翼進入Harness Team,說明DeepSeek Code背後需要另一類人:他們不一定是大模型論文作者,但做過真實係統,知道模型輸出落到執行層會出什麽問題。

梁文鋒,有了“隆中對”

從陳德裏的發言中,也能看到DeepSeek這一次招聘思路的轉變。

近日,他在社交平台確認,公司正在組建新的Harness團隊,方向是“對標Claude Code,做DeepSeek Code Harness”。這次招的也不是單純模型研究員,而是產品經理和研發工程師。

崗位描述顯示:Code Harness團隊成員要參與DeepSeek桌麵端Agent產品研發,還要和模型研究團隊協作,把真實任務裏的反饋帶回模型訓練。

順便再多提一下陳德裏,這位DeepSeek研究員不僅僅是R1的核心論文作者之一,也是DeepSeek為數不多經常公開露麵的內部人士。

去年11月烏鎮世界互聯網大會上,他代表DeepSeek參加“六小龍烏鎮對話”。陳德裏談AI短板時說,AI還不具備像人類一樣穩定的智能,模型訓練完後參數固定,無法像人一樣在真實世界中自我迭代。

而在一連串招聘信息熱度中,另一條線索是徐名宇。

最近一段時間,前DeepSeek資深研究員郭達雅的跳槽,揭開了AI行業人才爭奪戰的一角。

相關報道顯示,字節Seed團隊過去一年被挖走近70人,其中就包括Seed Edge長期研究計劃成員徐名宇,目前,他已加入DeepSeek模型結構組,從事模型結構相關研發。

在字節時期,徐名宇曾是論文DeltaFormer的第一作者,論文討論標準Transformer在狀態跟蹤任務上的表達限製,正文點名Python代碼執行、實體跟蹤、棋類等任務,並嚐試用DeltaNet增強Transformer處理狀態空間問題的能力。

徐名宇的加入,補的是DeepSeek Code背後的模型結構能力。崔添翼對應產品和係統工程,徐名宇對應更底層的連續任務能力,兩條線共同指向DeepSeek正在做的Code Agent。

Code Agent進入真實倉庫後,最容易暴露的問題也常常不是寫不出一個函數,而是十幾輪修改後忘記最初目標,跨文件改動後邏輯不一致,測試失敗後不能沿著舊狀態繼續修,這些考驗的都是模型在連續步驟中保存和更新狀態的能力。

另一邊,DeepSeek的Harness招聘,已經把對標對象寫得明明白白。官方披露的招聘信息稱,Agent Harness崗位要求候選人深度使用Claude Code、Cowork、Codex、Cursor、OpenCode、GitHub Copilot、Manus、OpenClaw、Hermes等產品。

顯然,DeepSeek Code的成長路上需要兩類經驗:一類來自真實係統,處理模型輸出後的執行後果;一類來自模型結構,處理多輪任務裏的狀態保持。持續的人才補強,也揭開了這一輪AI人才攻防戰的新一回合。

B

幾周前,DeepSeek核心人物郭達雅轉投字節,被外界視為DeepSeek的一次重要損失。

他的履曆與DeepSeek基座模型的幾塊基石有著緊密聯係。公開報道顯示,郭達雅專注代碼智能和大語言模型推理,參與過DeepSeek-Coder、DeepSeekMath、DeepSeek-Prover、V3、R1等項目。而在DeepSeek-Coder論文裏,他排在第一作者位置。

今年3月前後,郭達雅被曝從DeepSeek離職,隨後加入字節Seed。一些公開報道顯示,他看好Agent方向,而DeepSeek內部當時Agent優先級並不高;加入字節後,Seed內部正啟動圍繞Agent和Coding的組織整合。

回到幾周後的今天,手握數百億融資的DeepSeek,一邊開始奮起直追補課Harness Agent,一邊開始試圖引入更多“郭達雅”充實人才庫。



當然,這場人才攻防戰在郭達雅離職前就早已打響,而DeepSeek從未停止過在Coding等模型垂直方向的人才引入。

近期披露的2026字節跳動獎學金名單中,就有一個值得關注的名字。

據字節方麵披露,字節跳動獎學金至今支持了67位青年研究者;2023年得主路橙、朱琪豪分別是OpenAI Sora2和DeepSeek GRPO的重要研究貢獻者。

其中,朱琪豪是北京大學計算機學院2024屆博士畢業生,專注深度代碼學習。他在DeepSeek團隊中基於博士論文工作,主導開發了DeepSeek-Coder-V1;此後又出現在DeepSeek-Coder-V2和DeepSeekMath/GRPO相關論文中,是DeepSeek代碼模型和強化學習路線裏的早期參與者。

值得關注的是,在DeepSeek-Coder的迭代曆程中,朱琪豪的位置有一個清晰變化。

DeepSeek-Coder V1的作者列表裏,郭達雅排在朱琪豪之前;到了DeepSeek-Coder V2,朱琪豪的名字已在郭達雅之前。

作者順序當然不能直接等同於內部貢獻大小,但對一條連續迭代的技術線來說,毫無疑問傳遞出的信號是,朱琪豪是DeepSeek係列模型Coding能力的絕對核心人物。

另一條不能忽略的是多模態。

在Chatbot形態裏,DeepSeek的多模態短板還不明顯。用戶主要用文字提問,模型隻要在推理、寫作、代碼和長上下文上表現足夠強,就能支撐大部分使用場景。DeepSeek過去一年最強的公眾認知,也確實來自R1、V3、V4,以及低成本API。

但桌麵端Agent會改變這個前提。代碼Agent如果進入開發者電腦,就不隻是在聊天框裏回答問題,還要理解IDE界麵、終端報錯、瀏覽器文檔和截圖反饋。換句話說,讀屏能力會從“加分項”變成基礎能力。

潘梓正,是DeepSeek多模態業務中被公開披露較多的名字。

去年2月,多家媒體轉述了英偉達高級研究科學家禹之鼎的社媒內容。禹之鼎回憶,潘梓正2023年夏天曾在NVIDIA實習,當時NVIDIA考慮給他全職機會,但潘梓正“毫不猶豫”選擇回國加入DeepSeek;那時DeepSeek多模態團隊隻有幾個人。

禹之鼎還提到,潘梓正在DeepSeek-VL2、DeepSeek-V3和DeepSeek-R1等多個項目中發揮了“關鍵作用”。他寫道,潘梓正的案例是近年來他看到的典型例子:很多最優秀的人才來自中國,這些人才不一定隻能在美國公司取得成功,美國研究者也能從他們身上學到很多。

DeepSeek-VL2的能力方向,和Code Harness並不遠。VL2覆蓋視覺問答、OCR、文檔、表格、圖表理解和視覺定位;這些能力放到桌麵端Agent裏,正好對應讀屏、讀報錯、讀網頁文檔和理解界麵元素。

但DeepSeek多模態近期缺少一個真正站到台前的突破。Janus-Pro在2025年1月發布,DeepSeek稱其圖像生成能力超過DALL-E 3和Stable Diffusion;VL2則停留在2024年12月的視覺語言模型更新。

這意味著,DeepSeek已有讀屏和視覺理解的技術底子,但還沒把多模態打成和R1推理、V4長上下文一樣清晰的品牌標簽。如果DeepSeek Code真要做桌麵端Agent,多模態大概率仍是後續補人的方向。

回到陳德裏在去年烏鎮世界互聯網大會上的講話,他在談AI穩定性時說,模型訓練完後參數固定,不能像人一樣在真實世界中自我迭代。他提到的方向,是讓AI具備穩定學習算法,並通過多模態等方式與真實世界建立更多連接。

麵對著大模型發展行業的卡點,DeepSeek內部有著清晰的認知。但回過頭看過去一年的更新緩慢和人才流失,顯然大模型競爭是一個考驗資本厚度和耐力的長期作戰,需要更多“彈藥”供給,700億融資到位後,不隻是Code Harness,也許DeepSeek也將進入多線敘事的快速鋪開產品的邏輯。

C

隻看基座模型,DeepSeek已經站進第一梯隊,但也並非領跑位置。

新一代DeepSeek-V4-Pro在代碼基準和Agentic任務上縮小了與領先閉源模型的差距。DeepSeek V4-Pro在SWE-bench Verified上達到80.6%,接近Claude Opus 4.6。

此外,DeepSeek V4在Vibe Code Bench中成為開源權重模型第一,得分49.9%,也是唯一超過40%的開源權重模型。

但是,強模型和強產品,本質上還是兩件事。Claude Code的商業化數據,是DeepSeek無法繞開的參照。

Anthropic披露Claude Code年化收入超過25億美元後,外界對AICoding的估值邏輯已經變了。它不再隻是模型公司展示能力的Demo,而是可以直接貢獻收入的產品線。

Claude Code的形態也已經超出聊天框。

它能在開發者代碼庫中工作,通過終端、IDE、桌麵端、Slack和網頁使用;在本地終端運行時,會在該文件或運行命令前請求授權。這個設計讓AICoding進化成了項目級的助手。

和Claude Code齊頭並進的,還有OpenAI的Codex、Google Antigravity 2.0,大廠正在把AICoding從編輯器插件推向獨立開發環境。

與此同時,這也是國產模型競爭最激烈的領域之一。

Kimi和智譜近期在Coding領域的跑分,先後進入了第一梯隊。SWE-Bench Pro成績顯示,Kimi K2.6為58.6%,GLM-5.1為58.4%,DeepSeek V4 Pro-Max為55.4%。

SWE-Bench Pro測的是工程修複能力。它選取真實GitHub項目中的Issue和測試用例,讓模型提交補丁,再看測試是否通過。在這組更難的任務裏,Kimi和GLM都跑在DeepSeek前麵。

DeepSeek也不是沒有強項。有評測顯示,V4 Pro在SWE-Bench Verified上達到80.6%。Verified版經過人工篩選,常用來觀察模型處理真實代碼問題的穩定性。



具體打法上,智譜通過GLM Coding Plan進入Claude Code、Cline、OpenCode等已有開發者工具,Kimi也有kimi-cli、Kimi Code等終端和代碼工具入口,同時還通過Cursor Composer等第三方產品進入開發者工作流。

而隨著DeepSeek Code Harness浮出水麵,DeepSeek將與這兩位國產同行一同競爭AICoding的用戶心智。

尤其是當這一輪融資被推到700億元時,DeepSeek正好站在Code Harness這個岔口。

此前,DeepSeek管理層向潛在投資者表示,融資落地後,會優先推進突破性AI研究,而不是短期商業化。

對DeepSeek來說,融資首先意味著算力池可以繼續做大。DeepSeek官網介紹中提到,其依托自研訓練框架、自建智算集群和萬卡算力資源;GitHub上,DeepSeek還開源了麵向AI訓練和推理負載的3FS分布式文件係統。

3FS可以理解成DeepSeek給大模型集群配的一套高速共享硬盤係統。訓練和推理時,GPU需要持續讀取數據、保存模型狀態,3FS負責把分散在多台機器上的SSD整合起來,通過RDMA網絡高速傳輸數據。

DeepSeek稱,這套係統在180節點集群裏跑到過6.6TiB/s的聚合讀取吞吐。

而更大的背景,是國產算力替代正在被V4推到前台。最新發布的DeepSeek V4已適配華為昇騰AI芯片,華為昇騰950超節點將完整支持V4。有行業分析指出,DeepSeek曾與華為、寒武紀合作改寫部分模型代碼,以適配國產硬件。

因此,DeepSeek Code Agent不隻是一個Agent產品,它很有可能是DeepSeek把模型能力、國產算力和用戶場景連起來的前沿入口:一端承接V4在國產硬件上的落地,一端進入開發者的生產流程。

2025年初,DeepSeek靠R1證明,一家中國模型公司可以突然改寫全球大模型敘事。

現在輪到Code Harness回答另一個問題:全球最成功的大模型公司之一,能不能在Agent領域再現一次DeepSeek神話。