DeepSeek梁文鋒:從量化基金到聊天機器人投資者

文章來源: - 新聞取自各大新聞媒體,新聞內容並不代表本網立場!
被閱讀次數



DeepSeek梁文鋒:從量化基金到聊天機器人投資者

​​​​​​​

中國最新推出的AI聊天機器人DeepSeek(深度求索)震撼了科技界,並迅速取代ChatGPT成為美國下載量最高的免費應用,讓創始人、億萬富翁梁文鋒一夜成名。

這款在上周推出的低成本聊天機器人,據報導其開發預算遠低於競爭對手,讓華爾街震驚,競爭對手也紛紛加緊追趕。

美國總統唐納德·特朗普(Donald Trump,川普)也立即發表看法,稱這是對美國企業的“警鍾”。

“更像極客而非老板”



梁文鋒稱他的核心團隊“沒有海歸人士,都是本地人才……我們必須自己培養頂尖人才。”

DeepSeek由梁文峰於2023年12月創立,並於第二年發布了首個AI大型語言模型。關於這位40歲的創業家,外界知道的並不多。他出生於中國南方城市廣東湛江,畢業於浙江大學,專業為電子信息工程和計算機科學。

根據科技媒體36氪的一篇文章,與他熟悉的人表示他“更像是一個極客(Geek),而不是一個老板”。

梁先生很少公開露麵和受訪,現在他卻因為DeepSeek成為國際焦點。

他是唯一一位被選中參加與國家第二號領導人李強的公開企業家會議的AI界領袖。商界人士被中南海告知要“集中精力突破關鍵核心技術”。

與許多來自矽穀的美國AI企業家不同,梁先生還有金融背景。他是名為“幻方量化”(High-Flyer)的對衝基金的首席執行官,該基金利用AI分析金融數據以做出投資決策,這被稱為量化交易。

2019 年,“幻方量化”成為中國首個募資超過1000 億元人民幣的量化對衝基金。

在幻方量化,梁文峰通過使用AI和以及識別可能影響股價的算法模式賺到了錢。他的團隊熟練使用AI晶片設計師以及近期華爾街寵兒輝達生產的H800晶片來進行股票交易。2023年,他推出DeepSeek,宣布了開發人類水平人工智能的意圖。

據說,梁文鋒親自參與DeepSeek的研究,他利用對衝基金交易的收益來支付頂級AI人才的高薪。該公司擁有來自北京大學、清華大學和北京航空航天大學等中國頂尖學校的博士,而不是來自美國機構的專家。



DeepSeek發行人梁文峰(右)出生於中國南方廣東湛江,畢業於浙江大學,專業為電子信息工程和計算機科學。

與TikTok的母公司字節跳動類似,DeepSeek以向AI工程師提供最高的薪酬而聞名,員工在杭州和北京的辦公室工作。

去年接受中國媒體的訪問時,梁文鋒稱他的核心團隊“沒有海歸人士,都是本地人才……我們必須自己培養頂尖人才。”

梁文鋒還強調,中國的AI產業“不能永遠做跟隨者。”

他補充稱:“我們常說中國和美國的AI之間有一到兩年的差距,但實際的差距在於創新和模仿之間。如果這種情況不改變,中國將永遠是跟隨者。”

當被問及為什麽DeepSeek的模型讓這麽多矽穀人士感到驚訝時,梁文鋒回答說:“他們的驚訝源於看到一家中國公司作為創新者加入他們的遊戲,而不僅僅是跟隨者——這是大多數中國公司所習慣的。”

DeepSeek的競爭力在哪裏

DeepSeek表示,其模型R1是基於現有技術以及開源軟體開發的,這些軟體可以免費供任何人使用和分享。然而,《連線》(WIRED)雜誌報導稱,梁的對衝基金公司“幻方量化”囤積了大量的AI基礎晶片,即圖形處理單元(GPU)。根據《麻省理工科技評論》的估計,他獲得的晶片數量在10,000到50,000顆之間。

這些晶片對於構建能執行各種人類任務的強大AI模型至關重要,包括回答基本問題和解決複雜的數學問題。

2022年9月,美國宣布禁止向中國出售這些高效能晶片,梁文鋒在接受中國媒體的訪問時指出,這是“主要挑戰”。

西方的主要AI模型估計使用了16,000 顆專用晶片。但DeepSeek表示,他們的AI模型R1 僅使用了2,000顆這樣的晶片,以及數千顆低級別晶片,這使得其產品成本更低。

根據開發者的說法,這款聊天機器人的建造成本僅為560萬美元,而ChatGPT的製造商 OpenAI去年花費了50億美元。

包括美國科技界億萬富翁埃隆·馬斯克(Elon Musk)在內的一些人對這一說法表示質疑,認為鑒於受到限製,該公司無法披露實際使用了多少先進晶片。

但專家表示,華盛頓的禁令既給中國的AI行業帶來了挑戰,也帶來了機遇。

雪梨(悉尼)科技大學副教授張越(Marina Zhang) 向BBC說:“這迫使像DeepSeek這樣的中國企業進行創新,讓他們在資源有限的情況下做更多的事情。”

她又補充道:“盡管這些限製帶來挑戰,但也激發了創造力和韌性,與中國實現技術獨立的更廣泛政策目標相一致。”

作為世界第二大經濟體,中國在大型科技領域進行了大量投資——從為電動車和太陽能電池板提供動力的電池到AI技術。

將中國打造成科技超級大國長期以來一直是習近平主席的雄心,華盛頓的限製是北京需要迎接的挑戰。

評價不一

DeepSeek的推出引發了美國主要科技股的拋售。美國市場在本周一收盤時,輝達股價已經暴跌17%,市值損失達 6000 億美元,根據彭博社報導,這是美國股市曆史上最大的跌幅。

風險投資家安德瑞森( Marc Andreessen) 在社交媒體X上表示,將DeepSeek-R1的出現視為 “AI的斯普特尼克時刻”,這指的是蘇聯率先發射的人造衛星。

但這款中國應用也引發了許多人的擔憂。

資深分析師孟斯特( Gene Munster)對BBC表示:“我仍然認為真相隱藏在表麵之下。”他暗示的是DeepSeek披露的財務狀況。他還質疑這家初創公司是否獲得了補貼,以及其報告的數據是否準確。

“這款聊天機器人好得讓人很難相信。”

澳洲科學部長赫斯特( Ed Husic)則指出該產品的安全隱患。他向澳洲廣播公司表示:“有很多問題需要隨著時間的推移得到解答,關於質量、消費者偏好、數據和隱私管理。我會非常謹慎。這些問題需要仔細權衡。”

上周,OpenAI的奧特曼(Sam Altman)和甲骨文的艾莉森( Larry Ellison)與特朗普一起宣布了聯合計畫“星際之門”( Stargate),承諾為美國的AI基礎設施提供高達 5000億美元的私人投資,並且在德州及其它地區建立數據中心,創造 10萬個新工作。

隨著DeepSeek成為 AI 競賽中的另一強勁參與者,一些專家認為,這家公司的突然出現可能會引發對美國AI主導權及其計劃投資規模的質疑。

查看評論(61)