中國人工智能公司 DeepSeek 因使用華為昇騰係列芯片進行訓練受挫而推遲了其第二代模型的發布,凸顯了中國政府力推取代美國技術的局限性。FT : DeepSeek 新AI模型或因使用中國芯片而推遲發布 https://t.co/EhzrBld2u8 pic.twitter.com/Lv8sia9PoZ
— RFI 華語 - 法國國際廣播電台 (@RFI_Cn) August 14, 2025
《金融時報》報道引述據三位知情人士透露,DeepSeek 在 1 月份發布其 R1模型後,受到當局的鼓勵,采用華為 ,而不是使用英偉達的處理器。但知情人士表示,這家中國初創公司在使用 華為昇騰係列Ascend 芯片進行 R2 模型訓練的過程中遇到了持續的技術問題,促使其使用英偉達芯片進行訓練,使用華為芯片進行推理。
一位知情人士表示,這些問題是該模型發布日期從 5 月推遲的主要原因,導致其落後於競爭對手。
訓練是指模型從大型數據集中學習,而推理是指使用訓練好的模型進行預測或生成響應(例如聊天機器人的查詢)的步驟。
《金融時報》分析指出,DeepSeek 的困境表明,中國芯片在關鍵任務上仍落後於美國競爭對手,凸顯了中國在技術自給自足方麵麵臨的挑戰。
有報道稱,中國政府已要求中國科技公司解釋其訂購英偉達H20芯片的合理性,以鼓勵它們推廣華為和寒武紀的替代產品。業內人士表示,與英偉達的產品相比,中國芯片存在穩定性問題、芯片間連接速度較慢以及軟件質量較差等問題。
據兩位知情人士透露,華為派了一個工程師團隊前往 DeepSeek 的辦公室,幫助該公司使用其 AI 芯片開發 R2 模型。然而,盡管團隊在現場,DeepSeek 仍無法在昇騰芯片上成功進行訓練。
知情人士表示,DeepSeek仍在與華為合作,以使該模型與昇騰芯片兼容進行推理。
DeepSeek創始人梁文鋒內部曾表示,他對R2的進展不滿意,並一直在努力投入更多時間構建更先進的模型,以保持公司在人工智能領域的領先地位。
另一位知情人士補充說,R2 的發布也因更新模型的數據標注時間長於預期而被推遲。中國媒體報道稱,該模型最早可能在未來幾周內發布。
作為中美地緣政治鬥爭中心的芯片製造商,英偉達最近同意向美國政府提供其在華收入的一部分,以恢複其 H20 芯片在中國的銷售。英偉達在談到使用其芯片的中國企業時表示:“開發者將在構建製勝的人工智能生態係統中發揮關鍵作用。放棄整個市場和開發者隻會損害美國的經濟和國家安全。”
DeepSeek 和華為尚未回應置評請求。