Mistral AI成立於2023年4月,由三位前穀歌DeepMind和Meta的科學家聯合創立。早期他們推出的開源模型Mistral 7B曾憑借超低的調用成本及比肩GPT-3.5的性能,迅速成為OpenAI最有力的競爭對手。
宋春雨是聯想創投集團高級合夥人和首席投資官,是AI領域的投資老兵,投資項目覆蓋AI1.0至AI2.0時代不少明星項目——曠視科技、第四範式、寒武紀、階躍星辰、智譜AI等。
但在基礎大模型最火的2023年,宋春雨沒有投任何一個基礎大模型公司,反而是投資了開源社區、上層應用及一些算力芯片公司。
“當時在海內外,GPT-4都非常火。但因為調用GPT-4成本高,這種模式不長久,我們要找的是能把大模型像水、電、煤一樣接入社會基礎設施的公司。”宋春雨說。
宋春雨在海外投資了Mistral AI,而在國內發現了同樣開源且采用MoE架構的Deepseek。“我去年2月就和梁文鋒在交流,但他們不融資。梁文鋒對商業化不感興趣,他專注打磨基礎模型,確保每一代模型都保持領先。”宋春雨說。
今年,宋春雨在AI領域的投資方向已經開始向智能體、AI原生應用以及具身智能
等方向遷移,關注大模型如何重構物理世界。
以下是宋春雨對於基礎大模型技術迭代、Deepseek不融資、中美AI差距、AI原生應用、具身智能、自動駕駛等看法,在不改變原意的基礎上有所刪減:
梁文鋒拒絕融資背後的邏輯
問:你決定投資Mistral AI主要是因為這家公司是開源的嗎?
宋春雨:
開源的魅力在於將最先進的成果公開,使大家能夠快速學習並在其基礎上進行創新。這使得當前各大模型的學習和進化速度比以往快了幾倍。例如,OpenAI在去年12月6日發布o1正式版,Deepseek-R1在今年年初達到與o1相似的性能水平。此後,行業內幾乎每個月都會出現試圖對標o1和R1的新模型。
開源也促進了算法、架構等技術的迅速傳播與應用。比如,Deepseek取得成功之後,Meta在其Llama 4中也采用了MoE架構。
Mistral之所以在2023年底迅速走紅,是因為其開源的MoE大模型Mistral 8x7B性能達到了GPT-3.5的水平。
我們於去年年初投資了Mistral。我回到國內後,就要求我們的投資團隊在國內尋找能夠和Mistral對標的、並采用MoE架構的開源模型。去年2月份我們就和梁文鋒有深度交流,但他們不融資。
問:不缺錢?
宋春雨:
我個人覺得梁文鋒是堅信AGI
的人。第一,他是技術極客背景出身,他給自己的使命就是要去摸AGI的上限,或者說人類能達到矽基智能的上限是什麽?他對商業化不感興趣,這一輪Deepseek浪潮中,在用戶體驗方麵,最大的贏家是騰訊的元寶,梁文鋒所有的卡都用來做下一代的模型了。
梁文鋒和DeepSeek公司主體(杭州深度求索人工智能基礎技術研究有限公司)本身也不差錢,這點很重要,他們可以養的起團隊。現在很多投資機構和大廠都要給DeepSeek融資,但梁文鋒不接,因為他有實現AGI的使命感。從這一點來看,DeepSeek某種程度上回歸了OpenAI最初作為非營利組織的初心與願景。
所以開源的DeepSeek代表代際模型的最高水平,部署成本僅是閉源模式的幾十分之一。馬斯克下的xAI訓練出對標o1和R1水平的模型,大約用了20萬張卡,但梁文鋒團隊用的少了一個量級。
問:DeepSeek對創投行業也是分水嶺?
宋春雨:
是的。從去年開始,我們一直在找拐點。在DeepSeek出來之前,中國創業者用GPT-4更多,但因為調用GPT-4成本高,這種模式不長久,我們要找的是能把大模型像水、電、煤一樣接入社會的基礎設施。
就像4G通信技術的普及曾催生移動互聯網原生應用,比如滴滴、拚多多、大眾點評、美團、小紅書等,我們相信,AI時代也會誕生AI原生的Super APP。在DeepSeek出來之前,受基礎模型性能與成本的雙重製約,當時大家覺得這個Super APP很難出現。
問:為什麽?
宋春雨:
用戶對基礎模型還沒有培養起高度的使用粘性。比如在DeepSeek推出之前,豆包擁有1億到1.5億用戶,但DeepSeek上線後,大量用戶開始遷移。這也正是我特別佩服梁文鋒的地方——他專注打磨基礎模型,確保每一代模型都保持領先,隻要模型足夠好,客戶自然會來。
問:你怎麽評價梁文鋒?
宋春雨:
他是我心中最完美的AGI創業者,初心純粹,篤定AGI方向。
多模態是下一代大模型明確方向
問:聽說咱們今年的行研已經結束了,與去年比,我們在大模型和AI領域得出結論有哪些變化?之前您認為開源大模型可能落後於閉源,Deepseek大火後,您的看法有了哪些改變?
宋春雨:
今年標誌著一個新時代的開始,整體AI發展正在加速邁向矽基智能。以Deepseek為代表的開源大模型崛起,反映出AI普惠趨勢明顯加快。
我們得出三個主要結論。第一,去年我們在分析AI大模型格局時認為開源與閉源各占五成。Deepseek最大的價值是AI普惠了,AI普及加速,這會讓開源和閉源模式變成八二開,開源大模型占比80%,閉源大模型占比20%。
Deepseek的開創性貢獻體現在兩方麵,一是其不僅開源了推理模型,還大幅降低了模型部署成本,加速了智能體和AI應用的普及。同時,Deepseek在工具鏈、數據鏈以及調用性方麵更透明,也促進了智能體之間的協作。例如,像Manus
這樣的平台,使得多個智能體協同完成複雜任務成為可能。
第二,在大模型和AI領域,中國和美國已成全球兩大核心力量,代表當前AI發展的最高水平。由於大模型高度依賴數據,主權AI的邏輯依然成立。
第三,Deepseek帶來AI普惠後,下一階段會有智能體的大爆發,垂域智能體和通用智能體會加速進化。在物理世界,我們看大模型對物理世界的影響主要是兩個方向,一是車的自動駕駛,二是具身智能。會出現基於物理世界真實數據和仿真數據的專屬具身智能大模型。
問:現在行業對具身智能判斷兩極分化,你怎麽看?
宋春雨:
我個人認為具身智能是物理世界進化的終極形態。首先,在有限場景的泛化,比如工廠內的分揀工作,兩年內能產生ROI;其次,未來的機器人將呈現多樣化共存的狀態,它們不一定是人形的,可能是輪式的,或者配備的不是五指靈巧手,而是簡單的夾具等形式。
問:和第一波具身智能創業者相比,這波創業者有何不同?
宋春雨:
第一波創業者大多來自高校教授,而這波創業者很多都具有產業背景,比如創業者本身在智能駕駛公司、或者在特斯拉等工作過。
問:智能駕駛現在處於哪個階段?
宋春雨:
智能駕駛現已進入快速收斂期,自動駕駛肯定是具身第一個成功的商業化成功的場景,畢竟自動駕駛本質上就是一種“四輪機器人”。
自動駕駛已經迎來了類似iPhone的突破時刻,這一進展主要由視覺大模型驅動,然而具身智能落地應用仍需進一步演進。在中國,自動駕駛領域的創業公司會進一步收斂集中。由於特斯拉的FSD在國內缺乏數據訓練支持,這對中國的自動駕駛企業來說是一個機會。一旦這些企業能夠提供超越用戶體驗門檻的產品,就會對市場產生重大影響。
問:多模態大模型
算今年的投資重點嗎?
宋春雨:
從模型進化來看,Deepseek-R1和OpenAI的o1主要基於文本處理,下一代大模型比較明確發展方向是多模態。典型案例是GPT-4o的多模態能力,圖像、聲音等是大模型獲取世界數據的方向。
問:怎麽看文生視頻方向?
宋春雨:
我個人感覺文生視頻的技術框架上還沒有完全走通,OpenAI的Sora相當於給大家放了個demo(一個演示性產品),模型本身還需要突破。
中美在模型算法上的差距為6個月
問:現在中美AI差距有多大?
宋春雨:
非常接近了,個人認為在算法層麵的代差約為半年周期。真正的製約瓶頸在於算力基礎設施,導致整體訓練效率受限。但在算法上,中美的差距大約在6個月。
此外,人才結構也慢慢呈現本土化特征。從AI公司的員工配備看,這一代的AI人才已經不局限於吳恩達、李飛飛等有留學背景的人才,比如DeepSeek員工都是清北、浙大一群年輕人,他們的算法團隊90%都在清華五道口那。
所以,這波AI是顛覆式創新的偉大時代,創業者都非常年輕,我們現在看的AI應用項目都是00後在做。
問:超級智能體會對人類產生哪些影響?
宋春雨:
這一波AI不僅重塑生產力,還重塑了生產關係。(楊)元慶在今年Tech World給超級智能體做了分層,第一,能感知與交互;第二能認知與決策;第三是有自主學習與進化能力。智能體能自主演進和協作已經重塑了生產關係。
在美國,已經出現了這樣的案例:兩個人通過管理和協調各種智能體,創建了一家估值達到1億美元的公司,這正是生產關係被重塑的典型實例。
問:現在agent發展處於哪個階段?
宋春雨:
目前智能體(agent)在文本數據處理方麵已相對成熟,比如訂火車票、寫PPT等任務已經可以較好完成。但多模態交互仍處於模型發展階段,尚未完全成熟。當前的關鍵在於推動MCP
(模型上下文協議)的落地,實現不同模型之間的輸入接口統一和協同
問:但在國內,讓用戶為智能體付費似乎比較困難。
宋春雨:
展望未來10到20年,中國有望像美國一樣,大幅提升軟件的價值。與上一代軟件主要提高工作流程效率(約30%)不同,AI時代的新技術可以直接提升人效,比如達到以一抵三的效果。新一代AI需直接對企業KPI產生貢獻,明確其帶來的經濟效益。在美國已經形成了一種新的商業模式,即通過AI直接幫助企業實現盈利,並根據利潤進行分成。
問:這種模式適合國內嗎?
宋春雨:
國內AI創業者有個現象,不願意做To B領域,但美國創業者99%都在做To B的軟件變革。
問:國內何時能出現兩個人就做出了一個估值1億美金的公司的情況?
宋春雨:
估計需要兩三年,比如,YouMind就五六個人的團隊,沒花錢做推廣也實現了盈利。
問:我們在投資AI應用時有沒有特定的投資邏輯?標準是什麽?
宋春雨:
AI應用是最難投的,因為非共識的成分大。我們的邏輯還是看人,看一個AI代替單位人工所能創造的價值。比如在AI麵試方麵,我們會考察該工具是否能夠完全替代人類執行任務。對於隻能提供輔助功能的AI應用,我們稱之為copilot;而那些能夠進行交互和協作的,則被定義為超級智能體。
問:這與移動互聯網的投資邏輯不同嗎?
宋春雨:
在移動互聯網領域,可以進行像素級的複製模仿,但由於AI涉及底層技術的創新,這種邏輯並不適用,其不確定性更高。
問:決定投資一家AI公司時會考慮的因素?
宋春雨:
首先,該公司要有極高的人才密度;其次,一號位不僅要有定義產品的能力,還要有非常強的行業號召力;第三,大模型公司尤其要能展現出在早期就具備融資100億人民幣的能力。