前穀歌科學家李誌飛：冷靜點中國OpenAI是個偽命題

劃重點：

1中國的OpenAI是個偽命題。完全複製OpenAI非常難，甚至他們自己都不一定能重複。做大模型不隻一條路，中國肯定需要很多大模型，但是不是有能力做類似OpenAI這樣探索人類天花板的模型，並不確定。
2李誌飛預估，中國1-2年以後，會看到50家以上公司做大模型。從競爭維度，中國是美國的10倍。
3與其說現在就匆匆忙忙跳進去做通用大模型，還不如多想想做出了通用大模型以後又怎麽樣？

中國大模型經曆了短暫沸騰以後，一部分人驟然冷靜下來。在過去1個月，行業已悄然分化。前Google科學家、出門問問創始人兼CEO李誌飛就是其中之一。

1個月前，他率先聲稱要做“中國OpenAI”，但現在，他卻說：“中國是不是存在一個跟OpenAI一樣的這種組織？我覺得大概率不存在。”

他說：“真正像OpenAI那樣探索AI天花板的鳳毛麟角，複製一個OpenAI未必有必要。”

他還說：“你就算做了一個AGI（通用人工智能）又怎麽樣，更重要的還需要make AGI accessible。”

在過去短短1個月，一部分沸騰著的大模型創業者心態經曆了巨幅轉變。李誌飛回憶說，對大模型達到狂熱頂峰期，是他剛過完年赴美國考察的時候。在矽穀，學院路有個Blue Bottle，他穿過咖啡館走廊，耳邊接連聽到一大串chat、chat、GPT、chat、ChatGPT……那段時間他每天5點就醒了，感覺多睡一會兒都在浪費生命；逢人便聊大模型，“每天喉嚨都是啞的”。

這次到美國，他帶著三個疑惑：一，ChatGPT背後革命性的技術是怎麽做出來的？二，為什麽是OpenAI，而不是他的前東家Google帶來這一曆史性時刻？最後，大模型壁壘有多高？為了一探究竟，他約見了OpenAI、Google、DeepMind、Amazon、Meta等一係列工程師。

對於第三個問題，他在當時得出了過於樂觀的結論：大模型壁壘極高。但隨著他回國、ChatGPT在國內爆火，巨頭、大佬和資金瘋狂湧入大模型領域——很快，這個結論破滅了，大模型的壁壘和門檻被踏得粉碎。

大模型的供給比他想象得多太多。不管是互聯網巨頭，還是原有人工智能企業，抑或大佬帶資入局，都在快速為這場大模型平台之爭備戰。在中國，似乎一夜之間遍地是大模型。據李誌飛預估：“中國1-2年以後，你會看到50家以上公司做大模型。”這場平台之戰太過於慘烈。

在此背景下，一部分大模型創業者在過去1個多月回歸了平靜。這波人選擇了一條更現實、也能與原有業務相結合的路徑。李誌飛隻是其中一位。

有投資人說，他們的一個顧慮是，李誌飛如何妥善安排自己10年的創業公司、對原有股東負責，然後另起爐灶？“這個我先聲明一下。”李誌飛回應稱。現在他的想法是，在出門問問基礎上，一方麵做大模型底層能力，另一方麵做基於大模型的各種應用，且公司已有業務閉環基礎。他們目前暫無融資訴求。

“我其實是希望勸一些人不要去做大模型，”他說，“與其現在就匆匆忙忙跳進去做通用大模型，不如多想想我做出了通用大模型以後又怎麽樣。”

“包括大佬們。他們可能走進了一個，他們不知道是什麽、也不一定像他想象中擅長、最後也不一定是喜歡（的地方）。”

以下是對李誌飛的訪談節選。為了方便閱讀，我對文本進行了一些優化。

01 突然的轉折

騰訊新聞潛望：今年2月，為什麽和王慧文、真格投資人吃了那頓飯？

李誌飛：吃飯是因為他們提到老王也要做AI，我挺好奇。大家對OpenAI很興奮。但至於怎麽做，什麽時候中國能做出來沒有清晰概念。大家聊更多是想能怎麽做。

要花多少錢？入門門檻什麽樣？當時我說至少需要5,000萬美金——2,000萬美金買算力，2,000萬美金招人，1,000萬美金標數據。

騰訊新聞潛望：有沒有互相給offer邀請對方加入公司？

李誌飛：有。但大家有不同做法。

騰訊新聞潛望：接下來你準備怎麽做？

李誌飛：我的想法做了很多改變。當時我覺得壁壘極高，早期投入非常大，最後能做或者願意投入的沒幾個。但通過過去這1-2個月去看，很多東西都變了。

首先做的人會很多。大家太快達成共識，這是未來10-20年最重要的一件事。其次，這個事難度取決於你怎麽做。如果你要像OpenAI或Google做最牛的模型，探索AI天花板，非常難。但如果你跟自己的或你想做的場景結合，難度會大幅降低。包括有開源模型，算力本身英偉達發布了更厲害的計算平台——從算力、算法、數據各層麵，難度會降低。

所以一方麵供給多，另外一方麵如果不是探索能力天花板，難度沒那麽大，導致做法有很大調整。你可能就沒必要一開始單獨做個公司，融很多錢，招最厲害的人，在與世無隔的環境憋12個月。以前我想的是那種。現在還是基於自己的投入和應用落地，快速把模型做起來，迭代使用場景。

騰訊新聞潛望：你想法轉變是什麽時候？

李誌飛：（吃完飯）之後一個多月。

騰訊新聞潛望：中間到底發生了什麽？從雄心壯誌就要做中國OpenAI、探索AGI，轉變得更現實。

李誌飛：興趣和商業是兩回事。這不代表我不能探索AGI。探索特別難的事有兩種方式：一種從零開始，是突變式；另一種是漸進式。現在對我最好的方式是基於出門問問這種漸進式。

騰訊新聞潛望：還會做“中國OpenAI”嗎？

李誌飛：中國的OpenAI是個偽命題。大家都知道完全複製OpenAI非常難，甚至他們自己都不一定能重複。這裏邊很多不確定，所需資源體量龐大。中國是不是存在跟OpenAI一樣的組織？我覺得大概率不存在。你就算做了一個AGI又怎麽樣，更重要的還需要make AGI accessible，把AGI變成可用的東西。我們可以在這方麵做很多探索。

騰訊新聞潛望：你認可Robin（李彥宏）說中國不需要第二個大模型嗎？

李誌飛：中國肯定需要很多大模型，但是不是有能力做類似OpenAI這樣探索人類天花板的模型，我不確定。我一直在強調，做大模型不隻一條路。

能笑到最後的也不知道是誰，甚至哪怕在全世界，OpenAI也不一定笑到最後。今天我對它的商業模式還挺悲觀的。

騰訊新聞潛望：我昨天見一個投資人，他說大多數創業者另起爐灶，想看看誌飛怎麽選。他們在等你的下一個項目。

李誌飛：不。這個我先聲明一下，是在出門問問基礎上，一方麵做大模型的能力，另一方麵有各種應用。

我們從2020年8月就開始做大模型和應用，差不多做了8個月，但局限於學術研究和商業模式的探索就停了。這之後，去年9月我去了一次美國，又把大模型重啟，我們當時想做文案產品，類似Jasper.AI，因為看到GPT-3最適合幹的是寫文案。很幸運我們已經做了好幾個大家叫AIGC的產品，有AI配音和寫文案的。

騰訊新聞潛望：你們大模型的參數和算力大概是什麽規模？

李誌飛：我們就幾百億。

它更加manageable。你做一個萬億的模型，有的時候真的隻能祈求上帝，機器不要掛掉。

02 這輪AI核心是構建了大一統模型

騰訊新聞潛望：從你最早讀自然語言處理的phd，到進入Google翻譯實驗室，再到現在，這個技術經過了哪些迭代？

李誌飛：十幾二十年前，我在約翰霍普金斯讀博，實驗室叫CLSP，創始人是語音識別之父。現在大家對語言模型了解，當時是很小的學術圈，全美做語言模型的phd同一年就幾個。2010年畢業我去了穀歌翻譯實驗室，工作不到三年。2012年回國創業。

2005到2012年，Google用大規模數據訓練語音識別和機器翻譯係統，開放給普通用戶。在這以前，研究是靠美國軍方項目支撐。2005年後，Google把它變成消費產品，我們相當於黃金時代的phd，用大數據、統計做機器翻譯和語音識別，特點叫符號主義。

到2012年，分布式計算的紅利基本沒了。我在Google很痛苦，隨便怎麽加數據，準確率都不會提升，有時反而降低。Google把大數據、分布式計算用到極致了。

2012年到現在最重要的是深度學習，它跟符號主義不一樣。跟以前的模型比，它容量更大，潛在天花板更高，對數據學習能力更強。以前很多模型學習數據是表麵的pattern，比如兩個詞同時出現、出現頻繁，我認為他們之間要麽是翻譯關係，要麽是上下文關係。但深度學習通過10年發展，它能對數據做很多抽象。規模也比以前大——以前用幾千萬或者幾億的token，現在可能10萬億。

總結來說，深度學習時代後，模型的表達能力、吸取數據的抽象能力、分布式訓練能力，相比2012年當時到瓶頸的時候有幾十倍或幾百倍提升。

騰訊新聞潛望：ChatGPT在哪些技術革新了，導致和過去10年的AI不一樣，同時帶來了爆發？

李誌飛：核心是通用。以前語音識別的係統專門一個團隊做，機器翻譯專門一個團隊做。以前在我們學校，做機器翻譯的人在計算機係，做語音識別的人在電子工程係。Google也一樣，做機器翻譯的人跟做語音識別的人是不同團隊——他們有單獨訓練的數據，單獨的代碼係統。

大模型，當然現在還沒做到，但未來它可能做語音識別、圖像、機器翻譯、回答你所有問題，陪你聊天，甚至做蛋白質結構預測——它可能是大一統的係統，做到以前每個需要單獨訓練一個係統的能力。這是為什麽叫它通用人工智能。

騰訊新聞潛望：現在達到AGI了嗎？還是隻是逼近？

李誌飛：微軟前陣子寫過一篇文章，微軟154頁研究刷屏：GPT-4能力接近人類，“天網”初現？

，我比較同意。通用的智能無非是第一通用，第二要有高度抽象的能力，第三有規劃能力。

騰訊新聞潛望：對於ChatGPT，你作為一個內行人的Aha moment是什麽？

李誌飛：以前AI係統，你去問它一些抽象的東西，推理或者故意騙它，它隻在網上找相對應的文本形成答案。你知道它笨在什麽地方。但ChatGPT你有強烈感覺：在跟有智商的人聊天，它理解你在說啥，還能跟你繞。

騰訊新聞潛望：所謂的“自監督”，我可不可以通俗一點理解，把孩子扔到海裏遊泳，他不需要我們看著他就能自己學會。

李誌飛：不需要比喻也容易理解。就是基於前麵的詞，預練下個詞是什麽。所謂的自監督是因為互聯網是序列文本，我們現在正在“聊天”，當我說“聊”，後麵有個“天”。互聯網上有海量文本，可以自監督預測下個詞。

每次AI預測，如果輸出是“天”，跟文本對上了，係統給獎勵；如果輸出是“話”，這個不對，係統給懲罰。所謂自監督是互聯網文本每一步都給了監督的信號，但為什麽又叫自監督？因為這個數據不是被標出來的。不像以前，我做機器翻譯，我要提供一句中文，然後標注一句英文；或者做語音識別，提供一個音頻文件，然後標注一個對應文字。現在你從互聯網上就能收集數據。自監督是每預測下個詞，數據都給你反饋，告訴你錯了還是對了。

03 矽穀見聞實錄：為什麽是OpenAI而不是Google？

騰訊新聞潛望：春節後你馬上動身去了矽穀，那段時間發生了什麽，在那待了多久，有什麽收獲？

李誌飛：當時對我來說，ChatGPT太神奇、太厲害了。第一，我很想知道到底怎麽做出來的，原理是什麽？第二，為啥是OpenAI做出來，而不是Google？第三，壁壘多高？

我帶著這些問題跟很多人聊。聊完答案是，第一沒人知道這怎麽搞出來的，技術原理是啥，為啥它突然有這麽強的能力。包括OpenAI的人也沒有清晰答案。很多深度學習的問題不可解釋、不可操控。

騰訊新聞潛望：為什麽是OpenAI而不是Google搞出來？

李誌飛：如果高度簡單化這個東西，我覺得主要幾點：

第一OpenAI成立就一直目標是做AGI，Google很多人不太相信——就覺得這可能是學術騙子，甚至當你說你要做AGI，我覺得你不知道你在說啥。你看在GPT-2的時候，OpenAI就說我要做通用，我不是去做那些比如pre-training，然後fine-tunning，收斂到具體任務的係統。它跟Google的信仰不一樣。

第二，在GPT-3後，它是產品驅動的AI研究，這跟Google或別的組織不一樣。別的要麽是偏學術的研究——一幫人做出一個係統，寫一篇論文，弄個PR，又去幹別的了；要麽是像DeepMind是項目製，AlphaGo做一做，又做AlphaZero，又做AlphaFord。它不是product-oriented的迭代。

騰訊新聞潛望：DeepMind怎麽遴選項目？

李誌飛：有偶然有必然。必然是他們做遊戲出身，認為通過深度學習去學怎麽打遊戲，最終實現通用AI，這是DeepMind人的信仰。

從執行路徑，先找一些限定場景，比如下棋不涉及很多人的交互。它規則、邊界清晰，數據幹淨，但同時足夠難，有代表性。

騰訊新聞潛望：嗯，第一是信念，第二是產品驅動，還有第三點嗎？

李誌飛：很多時候，有的人隻對研究有興趣，有的人隻會做產品，有的人隻願意做工程。但能有一批人對三個都有興趣，相互能協作，這也是重要因素。

2020年6月GPT-3開放給用戶後，獲得了很多用戶反饋，通過反饋收集數據，通過數據又去迭代係統，然後重新給用戶，效果越來越好。它已經悄悄幹了兩年半。Google就沒有這麽一個係統在線上。

騰訊新聞潛望：最後你的第三個問題，壁壘是什麽？

李誌飛：那一刻我是覺得大模型壁壘極高。我跟很多人聊之前，覺得Google應該很快就搞出來了；但聊完，我意識到這個模型跟以前的壁壘不一樣，有比較長的訂貨交付時間（lead time）。

首先你要花很多算力算，管你再厲害，如果你沒有那麽多卡，在這麽大的數據量算過，模型就出不來。第二，模型的結構，包括數據的收集和清洗，需要時間積累。第三，這個實際是實驗的科學，我用很多台機器，基於這個模型、數據的格式，我去調，調完後看結果，每做一個實驗都要花很多時間。

它類似於造硬件。不是說兩個月後另一個人立馬就可以造出同樣的iPhone。

騰訊新聞潛望：預計周期是多長？

李誌飛：至少比如6個月8個月以上。哪怕對Google這樣的競爭對手。

騰訊新聞潛望：你當時跟Google的人聊，跟OpenAI的人也聊，OpenAI的人怎麽看Google，Google怎麽看OpenAI？

李誌飛：這個我倒沒太注意。算力、數據、人，某種程度上Google可以碾壓OpenAI。Google更大的問題是內部組織形態。在跨部門，Google的研究部門和業務部門是分開的，比如跟Youtube、搜索、雲業務分開，調動數據、資源，甚至把產品上線都不是容易的事。在部門內部，太多聰明人，每個人有自己的想法、自己相信的方法論。這都是OpenAI不存在的情況。

有時一個競爭對手比你強10倍，但在這種高度不確定性的事上，它不一定能打得過你。

04 在中國創業的現實和真相

騰訊新聞潛望：大模型時代到底給我們會帶來什麽，從今天往後看10年有什麽樣的預演？

李誌飛：人類最引以為傲的是通過語言承載的認知。ChatGPT已經有很強的認知能力。這會導致有幾個後果。

它讓我們產生強烈信心，當認知問題都能解決，很多感知問題小菜一碟。

很多人講 AI大模型是生成式，這是巨大的誤導。ChatGPT這種認知模型，能力是全方位，比如它有很強的理解能力、分析能力、生成能力，甚至有不錯的規劃能力。它的應用遠超語言。未來5-10年，我想不到什麽領域不會被這個影響。

騰訊新聞潛望：現是iPhone時刻還是瀏覽器時刻？

李誌飛：這個我跟別人爭論過，我認為是後iPhone時刻。通過過去10年，人類很多東西高度數字化了，每個人有手機，手機聯網，手機內存、觸摸屏、通訊、GPS能力非常好。我們等的是智能時代的爆發。現在智能有巨大突破，為什麽不覺得它是iPhone後時刻呢？

騰訊新聞潛望：你們屬於從上一代AI創業的時代走過來，上一代AI公司的共同挑戰包括哪些？

李誌飛：商業模式不行，投入很高、產出很低，所有公司陷在商業化糟糕的狀況裏。

騰訊新聞潛望：現在呢？

李誌飛：現在好的方麵是AI應用場景遠超上一代，需求可能是以前的十倍、百倍。

但大模型出來後，在太短的時間內所有人達成了共識。壞的地方是供給可能也是上一代的10倍，所以會讓很多現在做AI的公司，還是像上一代一樣比較痛苦。

對行業、社會當然是好事，但對player，共識太強，競爭會非常激烈。我曾經說過一個觀點，中國1-2年後你會看到50家以上的公司做大模型。這裏麵做法有不同。真正像OpenAI那樣探索AI天花板的鳳毛麟角，複製一個OpenAI未必有必要，我們可以做中國式創新的大模型。

騰訊新聞潛望：大模型時代的killing app在哪？

李誌飛：大模型empower killing app能力已經ready，更多是大家能做出什麽樣的應用，用戶怎麽去接受它。

騰訊新聞潛望：大模型這個領域，它是能誕生新的巨頭，還是說它是原有巨頭的疊加？

李誌飛：肯定會有新公司。最後能跑出來公司可能是垂直整合的，自己找一個主應用場景，收集用戶的數據，同時也訓練自己的模型，不停迭代。純粹依賴於第三方的模型，不僅壁壘很難建立，而且很難快速迭代。

騰訊新聞潛望：創業10年有什麽比較難的時候？最近的困難是什麽？

李誌飛：沒有一天不難的。最近麵臨著很大壓力。一方麵是機遇；另一方麵，競爭無處不在，太多聰明人在裏邊琢磨，會讓我有時產生一種——我會不會miss掉這一波機會，我能不能在大的浪潮裏立住的感覺。好多人很焦慮，都覺得自己有可能被顛覆掉。無論是有業務的，還是沒業務的。

我會越來越輕鬆點。焦慮也沒用，還不如抱著長期主義心態。很明顯，未來5年、10年、20年有太多可創新的地方，也許抓不住這個小機會，就能抓住另一個。你這一刻被更聰明、更努力的人超過了，並不代表你不能下一刻抓住，隻要你覺得是長期的事。

騰訊新聞潛望：創業10年你的性格變了嗎？

李誌飛：肯定是性格大變。

騰訊新聞潛望：你以前接受采訪經常提到狂妄，講話也會流露強烈的表達——你以前會說：“我隻是要求非常正規的融資，正規到純潔無瑕。”還會說：“看到這個世界正在被我瞧不起的人推向我不喜歡的世界，我非常痛苦。”

李誌飛：我不喜歡給自己打臉，有一些東西我說了做不到，或者是因為無知而說的，我會調整。

2012年人家問我說：“怎麽跟某度競爭”？我說：“某度是什麽東西？”通過10年在中國創業，你發現人家很厲害，不能欺騙自己對吧？明明知道這個東西不是這樣子，還去忽略它，這是不求真。現在行為、說話方式有變化，是因為我看到了很多真相。

騰訊新聞潛望：國內競爭的真相是？

李誌飛：從競爭維度，中國是美國的10倍。怎麽得出來的？中國創業供給是美國的2倍，美國客單價是中國的5倍，乘起來是10倍。我是覺得超級有道理的。

騰訊新聞潛望：你今年的目標是什麽？

李誌飛：我希望我每天思考的問題和與大家聊的話題，超過70%內容跟這相關。

騰訊新聞潛望：對當下這波在中國做大模型創業的人，有什麽想說的嗎？

李誌飛：我其實是希望勸一些人不要去做大模型。這跟我個人競爭沒有任何關係，我跟他們沒有任何衝突。

我覺得你貿然進入，難度很大，商業競爭激烈。你現在做的是一個非常通用的大模型，但你沒有仔細想過，最後落地在什麽場景下？商業模式怎麽做？與其說現在就匆匆忙忙跳進去做通用大模型，還不如多想想做出了通用大模型以後又怎麽樣？

兩個月以前，我就是要複製ChatGPT，但現在我覺得不想清楚商業模式到最後會很痛苦。

前穀歌科學家李誌飛：冷靜點 中國OpenAI是個偽命題

前穀歌科學家李誌飛：冷靜點中國OpenAI是個偽命題