作為擁有600,000塊H100的男人,在AI界占據著開源製高點的紮克伯格會如何看待AI的未來?
也許你已經有了一些答案。他在最近發布最強開源大模型Llama
3.1之後,已經密集的接受了一係列采訪,講述了他對AI產業的諸多看法。
但在今天的SIGGRAPH大會上,你看到的可能是最真實的紮克伯格。在和黃仁勳的巔峰對談中,他自曝自己開源也有自私的一麵,飆髒話怒斥閉源供貨商的傲慢。還深刻反思了自己過去不夠潮,做的產品不夠酷了。
而且這還可能是看到的最全麵的Meta未來圖景。這長達一個小時的對談中,他們從產品到產業,從開源的信仰到計算平台的迭代。基本上把AI這個產業的未來都聊通了。
對AI產品方麵的未來,紮克伯格表示AI正在徹底改變社交媒體平台的運作方式:未來的Facebook和Instagram將成為一個統一的AI模型,能夠整合不同類型的內容和係統,為用戶提供更加個性化和豐富的體驗。特別提到了推薦係統的革新,預測未來的內容不僅會基於用戶興趣進行推薦,還會通過AI工具實時創作或合成。
他還非常堅定的認定了智能體就是AI產品的下一個形態。他認為,“在未來,就像每個企業都有一個電子郵件地址、一個網站和一個或多個社交媒體賬戶,我認為在未來,每個企業都將擁有一個與客戶交互的AI智能體”,而智能體的可能性之大,即使基礎模型的進展現在停滯不前,還會有五年的時間來讓行業基本上弄清楚如何最有效地利用迄今為止已經構建的所有東西。
而在AI產業方麵,紮克伯格表達了對開放生態係統的堅定支持。紮克伯格透露私心,認為就算為了確保Meta等公司不會被封閉的生態係統所限製,也得自己做開源。而且隻有開放的生態才能導致技術標準的形成,能用用戶飛輪去更快速的迭代產品。而且,在這樣的開源生態中,他預見到未來將出現大量針對特定任務和領域的專門AI模型,而不是由少數幾個大型通用模型主導。
關於下一代計算平台,紮克伯格重點討論了智能眼鏡和混合現實設備的前景。因為AI始料未及的快速發展,小紮現在的元宇宙不再是非得虛擬現實了。而是AI+眼鏡就行。和雷朋的合作就是他這個新認知的具象體現。
而且在整個對談中,老黃和小紮棋逢對手,互相揶揄和玩笑不斷。自稱自己“不善言辭”的黃仁勳和素有“機器人”之稱的紮克伯格坐在一起互相調侃,甚至拉到自家農場的家常。不由得讓人覺得,人,確實是會變的。
想知道Meta的路線圖,這篇萬字對談值得你細讀。想看看甲方乙方談話的藝術,這篇對談也值得一讀。
以下為訪談實錄:
黃仁勳:
你能相信嗎?這是現代計算的先驅之一,推動者。我邀請他來參加SIGGRAPH了。馬克,坐下吧。很高興你能來這裏。歡迎。謝謝你飛過來。我聽說你已經連續飛行了大約五個小時。
紮克伯格: 是的,當然。
黃仁勳:
這是SIGGRAPH,你知道吧?這裏有90%是博士。SIGGRAPH真正了不起的地方是,它是計算機圖形學、圖像處理、人工智能和機器人技術的綜合展示。多年來,一些公司如迪士尼、皮克斯、Adobe、Epic
Games,當然還有NVIDIA,在這裏展示和揭露了許多令人驚歎的東西。我們在這裏做了很多工作。今年,我們在人工智能與模擬的交叉領域引入了20篇論文。
我們正在利用人工智能使模擬規模更大、速度更快,例如,可微分物理學。我們創建了用於人工智能合成數據生成的模擬環境。這兩個領域正在真正融合。我對我們在這裏所做的工作感到非常自豪。Meta,你們在AI方麵做了令人驚歎的工作。我發現有趣的一點是,媒體寫到Meta在過去幾年如何涉足AI領域。FAIR做了很多工作——記住,我們都使用PyTorch。那源自Meta。
你們在計算機視覺方麵的工作,語言模型方麵的工作,實時翻譯上都有開創性的工作。我想問你的第一個問題是,您如何看待Meta當前在生成式AI方麵取得的進展?以及您如何應用它來增強您的運營或引入您正在提供的新功能?
紮克伯格: 是的,有很多內容需要解釋。
首先,非常高興能來到這裏。Meta已經連續八年參加SIGGRAPH。與你們相比,我們還是新手。但我想是在2018年——(被打斷)
黃仁勳:你的裝扮很合適(指紮克伯格的黑色襯衫和自己撞衫)。
Meta AI改變臉書的雙核心:推薦係統和創作能力
紮克伯格:(笑)這裏是你的地盤。
(2018年)我們展示了一些為我們的VR和混合現實頭顯所做的早期手部追蹤工作。我認為我們那時討論過Meta在編解碼數字人方麵取得的進展。我們希望從消費者級頭顯中驅動那種逼真的數字化身,而我們正越來越接近這一目標。此外,我們還完成了很多顯示係統的工作。我們正在研發的未來原型,旨在使混合現實頭顯能夠變得非常輕薄。我們在光學堆棧和顯示係統方麵已經相當先進,這是一個集成係統。這些通常是我們首先在這裏展示的內容。
所以很興奮今年能來到這裏,不僅討論元宇宙相關的內容,還有所有的人工智能部分。正如你所說,我們當初開始時,人工智能研究中心還是Facebook。現在是Meta,在我們成立Reality
Labs之前就已經在這方麵工作了一段時間。所有圍繞生成式AI的內容——這是一場有趣的革命。我認為這將最終使我們所做的所有不同產品以有趣的方式變得不同。
我先大概梳理一下我們已經擁有的大型產品線。比如信息流和推薦係統,還有Instagram和Facebook。我們一直在這樣的旅程中,從僅僅是為了與朋友聯係開始(發展到如今的複雜係統)。排序機製一直很重要,因為即使你僅僅關注了朋友,如果某人做了非常重要的事情,比如你的表親生了孩子之類的,你會希望這個消息排在最前麵。如果我們把它埋在你的信息流某個角落,你肯定會很生氣。
但如今,在過去幾年裏,用戶的關注已經發展到更多是關於外麵世界的各種公共內容了。推薦係統變得極其重要,因為現在不再是隻有幾百或一千條來自朋友們的潛在發布,而是有數百萬條內容。這就變成了一個非常有趣的推薦問題。而借助生成式AI,我認為我們將很快進入這樣一個領域:你今天在Instagram上看到的大部分內容都是根據你的興趣和是否關注這些人,從外界匹配推薦給你的。但我認為在未來,很多這類內容也將通過這些AI工具來創作。其中一部分將是創作者使用這些工具創作的新內容。而另一部分,我想,最終會是為了你即時創作或從現有內容中整合合成的內容。這隻是我們核心業務如何進化的一個例子。而且它已經發展了20年。
黃仁勳: 嗯,很少有人意識到,世界上構想過的最大的計算係統之一就是推薦係統。
紮克伯格:是的,我的意思是,這是一條完全不同的道路。它並不是人們談論的那種熱門的生成式AI。但我認為,推薦係統用到的也是Transformer架構。(生成式AI)也是一種類似的情況,(我們現在)隻是不斷構建越來越通用的模型。
黃仁勳:就是將非結構化數據嵌入到特征中。
紮克伯格:
是的,其中一個重要方麵是它推動了質量的提升。過去,每種內容類型都有不同的模型。最近的一個例子是,我們有一個模型用於排名和推薦短視頻,另一個模型用於排名和推薦更長的視頻。然後需要一些產品工作來確保係統能夠在線展示所有內容。但如果你能創建更通用的推薦模型,覆蓋所有領域,效果隻會越來越好。我認為部分原因在於內容的經濟性和流動性。你能夠從中汲取的內容池子越廣,你就不會像從不同池子中抽取那樣遇到奇怪的低效問題。
黃仁勳: 是的,隨著模型變得更大更通用,效果會越來越好。
紮克伯格:所以我夢想有一天,你可以想象整個Facebook或Instagram就像一個統一的AI模型,整合了所有不同類型的內容和係統,這些內容和係統實際上在不同的時間框架下有著不同的目標。因為其中一部分隻是向你展示今天你想要看到的有趣內容。但另一部分則是幫助你長期構建你的社交網絡,推薦你可能認識的人,或是你可能想要關注的賬號。而這些多模態模型往往能提供更好的陪伴。
黃仁勳: 你一直在構建GPU基礎設施,長時間運行這些大型推薦係統。
紮克伯格:實際上,談到GPU,在這方麵的進展就有點慢了。(笑)
黃仁勳: 是的。你總是盡量表現出善意。
紮克伯格:是的,你知道的,非常善意。
黃仁勳:
確實,應該總是保持善意的。你是我的客人。你知道,在他上台前,在後台的時候,你提到了關於承認自己的錯誤之類的事兒,對吧?所以...(笑)你沒必要這麽主動的想講出來是吧?
紮克伯格:(笑)我覺得這點我已經很好地嚐試過了。
黃仁勳: (笑)是的。但一旦你進入表演狀態,你就會全力以赴。這就對了。
現在,關於生成式AI真正酷的一點是,如今我用WhatsApp時,感覺就像在與WhatsApp合作。我喜歡Imagine。我坐在這裏打字,它隨著我的輸入生成圖像。我回頭修改文字,它就生成其他圖像。比如一個中國老人在黃昏時分享受一杯威士忌,身邊有三條狗:金毛尋回犬、金毛貴賓犬和伯尼山犬。它就根據這個生成了一張相當不錯的圖片。
紮克伯格: 是的,我們正朝著那個方向前進。
黃仁勳:現在你實際上可以把我的照片上傳上去進去。(所以那個老人)那就是我。
AI產品的未來:就算現在模型停止迭代,我們也得用五年才能發掘出智能體的全部產品潛力
紮克伯格:
我最近花了很多時間和女兒們在一起,想象她們變成美人魚之類的角色。非常有趣。一方麵,我認為,生成式AI將是對我們長期使用的所有工作流程和產品的一次重大升級。但另一方麵,現在它可以創造出許多全新的東西。
所以MetaAI,不光擁有一個能幫你處理不同任務的AI助手的想法,而且在我們的世界它也將會非常注重創意。就像你說的那樣。它們非常通用,所以你不必僅僅局限於此。它能回答任何問題。
隨著時間的推移,當我們從Llama 3類模型發展到Llama
4及以後,我認為,它將會感覺不像是一個聊天機器人,那種你給它一個提示,它就簡單回應,然後你再給它一個提示,它又回應。就這樣一來一回。我覺得它會很快進化到,你給它一個意圖,它實際上就能在多個時間框架內處理它。我的意思是,它可能會根據之前的談話預判你的意圖。但我想,AI最終會變成能啟動需要數周或數月的計算任務,並在世界上發生某些事情時回來找你(並告知你處理方法)。我認為那將會非常強大。
黃仁勳:
所以,我的意思是我不太確定。如你所知,今天的AI基本上是回合製的。你說一句話,它回你一句話。但顯然,當我們思考,當我們被賦予一個任務或麵對一個問題時,你知道,我們將考慮多種選擇,或者我們可能會提出一個選項樹,一個決策樹,我們會在心中模擬沿著決策樹走下去,你知道,我們可能會做出的每個決策的不同結果是什麽。所以我們正在進行規劃。因此,未來的人工智能也會做類似的事情。當你談到你對Creator
AI的願景時,我感到非常興奮,坦白說,我認為那是一個絕佳的想法。請向大家介紹一下Creator
AI和AI工作室,正是它們將使你能夠實現那個願景。
紮克伯格:
是的。實際上,我們之前已經討論過一些,但今天我們將更廣泛地推出它。我們的願景是,我不認為隻會有一款人工智能模型,對吧?這是行業內一些其他公司所不具備的,他們似乎在構建一個中心化的智能體係統。而我們確實提供了MetaAI助手供您使用,但我們的願景更多在於賦能每一位使用我們產品的用戶,讓他們能夠為自己打造專屬的智能體。
無論是平台上眾多的數百萬創作者還是數億小型企業,我們最終目標是將您的所有內容整合,並迅速搭建一個業務智能體,構建與客戶的互動、進行銷售及客戶支持等全方位服務。因此,我們正在逐步推出的,就是我們稱之為AI工作室的項目,它旨在助力您快速啟動並運營這一智能體係統。這基本上是一套工具,最終將使每位創作者都能構建一個自己的AI版本,作為某種智能體或助手,讓他們的社區能夠與之互動。
這裏存在一個根本問題,即一天中根本沒有足夠的時間,對吧?就像如果你是一位創作者,你希望更多地與你的社區互動。但你受限於時間做不到。同樣地,你的社區也希望與你互動。但這很困難。我的意思是,能用來做這件事的時間是有限的。所以,次佳的選擇是,讓人們能夠創造一種智能體,你通過訓練它,讓它基於你的素材來代表你,以你希望的方式呈現。
我認為這是一項非常具有創造性的努力,幾乎像是一種藝術品或你發布的內容。而且,很明顯,它並不是在與創作者本人互動,但我認為這將是一種有趣的方式,就像創作者在社交平台上發布內容這樣的人,就能夠擁有智能體來完成。同樣地,我認為人們將會創造自己的智能體,用於各種不同的用途。有些會是定製化的實用工具,他們希望對其進行精細調整和訓練。
有些則會是娛樂性質的。人們創造的一些東西隻是有趣,你知道的,它有些可能有點傻或者對事物有一種幽默的態度,我們可能無法預料。
用戶可能不會將MetaAI構建為助手,但我認為人們對看到和與之互動相當感興趣。然後我們看到的其中一個有趣的應用場景是人們使用這些智能體進行支持。這一點是讓我有點驚訝的,MetaAI最受歡迎的用途之一是人們基本上用它來模擬他們即將麵臨的複雜社交情境。無論是職業場合,比如說,"我想問我的經理,我怎樣才能得到晉升或加薪",或者"我和朋友發生了爭執",或者"我和女朋友遇到了困難",基本上在一個完全沒有偏見的空間裏,你可以模擬這種情況並看看會如何發展,如何進行對話並獲得反饋。
很多人,他們不僅僅想與同類型的智能體交互,無論是MetaAI還是ChatGPT,或者其他大家都在使用的工具,他們想要創造自己的東西。
所以這就是我們大致上在AI工作室所要做的方向。但這些都是我們更大的觀點的一部分,我們認為不應該隻有一種大型AI供人們交互。我們隻是認為,如果存在多種不同的AI,世界會變得更好、更有趣。
黃仁勳:
我認為這非常酷,如果你是一位藝術家並且有自己的風格,你可以采用你的風格,你所有的作品集,你可以微調你的一個模型,現在這變成了一個AI模型,你可以來使用它並給出提示。你可以讓我,比如說,創作一些與我所擁有的藝術風格類似的作品,你甚至可以給我一幅作為繪圖的藝術品,一個草圖作為靈感,我就能為你生成一些東西。然後,其他用戶會來到來到我的AI那裏(獲得這些能力)。每一個餐廳,每一個網站在未來可能都會有這些AI。
紮克伯格:是的,我有點認為在未來,就像每個企業都有一個電子郵件地址、一個網站和一個或多個社交媒體賬戶,我認為在未來,每個企業都將擁有一個與客戶交互的AI智能體。
黃仁勳: 對。
紮克伯格:
這些事情我認為是曆史上一直很難做到的。比如你考慮任何公司,客戶支持部門與銷售部門是兩個完全獨立的組織。而作為CEO,你並不希望它們這樣運作。隻是,好吧,它們所需的技能確實有所不同。當你是CEO時,你得處理所有這些事情。
我的意思是,一般來說,當你搭建組織的時候,組織是分開的。因為它們各自優化於不同的事務。但我認為理想化的狀態是它應該是一種統一的存在,對吧?作為消費者,你不想在購買東西時走一條路線,而在遇到已購商品問題時又走另一條路線,你隻想有一個地方可以去,能解答你的問題,並且能夠以不同的方式與企業互動。我認為這對創作者也同樣適用。
黃仁勳: 我認為這種個人消費者方麵的互動,尤其是他們的投訴,將會使你的公司變得更好。
紮克伯格: 是的,完全正確。
黃仁勳: 所有這些AI與客戶的互動都會讓AI捕捉到那些機構知識,而這些又都可以進入分析係統,這會提升後續人工智能。
紮克伯格:
是的。你說的這個版本我認為是個整合度更高的版本,我們仍處於相當早期的alpha階段。但AI工作室讓人們能夠創建自己的UGC智能體和其他內容,開始進入這個讓創作者創作的飛輪。我對這個挺興奮的。
黃仁勳: 那麽,我能用AI工作室來微調我的圖片,我的圖片集嗎?
紮克伯格: 是的,我們正朝那個方向發展。
黃仁勳: 好的。然後,我能把我寫的所有東西都加載進去,讓它作為我的RAG(檢索增強生成)使用嗎?
紮克伯格: 是的,基本上可以。
黃仁勳: 好的,是的。每次我回來,它都會重新加載記憶。所以它記得上次離開的地方,我們繼續對話,就像什麽都沒發生過一樣。
紮克伯格:
是的。而且我的意思是,就像任何會隨著時間改進的產品一樣,用於訓練它的工具也會變得更好。這不僅僅是關於你希望它說什麽。我認為通常創作者和企業也有他們想要避開的主題。
黃仁勳: 對。所以在這方麵不斷進步。
紮克伯格:
是的。你知道,我認為理想的版本不僅僅是文本,對吧?這和我們隨著時間在做的一些編解碼虛擬形象的工作有些交集。你肯定希望能夠和那個智能體進行像視頻聊天一樣的交互,我認為我們隨著時間會達到那一步的。我不認為這些東西離我們太遠,這個飛輪正在非常快速地旋轉。所以這是令人興奮的。有很多新東西需要構建。
我認為即使基礎模型的進展現在停滯不前,盡管我不認為它會停滯,我想我們還會有五年的時間來讓行業基本上弄清楚如何最有效地利用迄今為止已經構建的所有東西。但實際上,我認為,基礎模型和基礎研究方麵的進展正在加速。所以,這是一個非常狂野的時期。
黃仁勳:
你的願景是這一切,你某種程度上促成了這一切。所以,謝謝你。你知道,我們是CEO,我們是脆弱的花朵。我們需要很多支持。(笑)
紮克伯格: 是的。我們現在已經相當堅韌了。我認為我們是行業中兩位任職時間最長的創始人。對吧?
黃仁勳: 我的意思是,這是真的。這是真的。
紮克伯格: 而且你的頭發變灰了。我的隻是變長了。(笑)
黃仁勳: 我的頭發是變灰了。你的變卷了。這是發生了什麽?
紮克伯格:它一直都很卷。所以我一直保持短發。
黃仁勳: 是啊。我隻是,如果我知道成功需要這麽長時間……
紮克伯格: 你可能一開始就不會開始。(笑)
黃仁勳:不,我可能會像你一樣從大學退學。早點開始。(笑)
紮克伯格: 嗯,這是我們性格的一個好差別。(笑)
黃仁勳:你已經領先了12年。那很不錯。
紮克伯格:你知道,你做得相當不錯。
黃仁勳:我會繼續前進的。(笑)
所以,我喜歡的,關於您對每個人都能擁有AI,每個企業都能在我們公司擁有AI的願景。我希望每位工程師和每位軟件開發者都能擁有一個AI。
紮克伯格: 是的。我們有很多AI。
黃仁勳:
我欣賞您的願景的一點是,您也相信每個人都和每個公司都應該能夠創造自己的AI。所以您實際上是開源了。當您開源了Llama時,我認為那很棒。Llama
2.1,順便說一下,我認為Llama 2可能是去年AI領域最大的事件。
紮克伯格:我原本以為(去年AI領域最大的事件)是H100。(笑)
黃仁勳: 這是個先有雞還是先有蛋的問題。是的。所以這兩者哪個先出現的?
紮克伯格: H100。 嗯,Llama 2實際上不是H100。(笑)
黃仁勳: 是的,它是A100。(笑)
開源的未來:不受限製的構建,恢複開放黃金時代
黃仁勳: 是的,謝謝。因此,但我說這是最大事件的原因在於,當Llama 2.1
發布時,它激活了每一家公司、每一個企業和每一個行業。突然之間,每家醫療公司都在開發AI,每家公司,無論大小,初創企業都在構建AI。它讓每一位研究者都能重新投入到AI領域,因為他們有了一個起點去做些什麽。而現在,3.1版本已經發布,你知道的,我們共同努力部署Llama
3.1,將其推向全球企業。這種興奮之情簡直難以言表。我認為它將推動各種應用的發展。
但請談談你的開源理念。這一理念源自何處?你開源了PyTorch,現在它已成為人工智能開發的框架。而現在,你們已經開源了Llama
3.1。圍繞它建立了一個完整的生態係統。所以,我認為這非常棒。但這一切是從哪裏來的呢?
紮克伯格:
是的,這裏麵有很多曆史。我的意思是,隨著時間的推移,我們做了很多開源工作。我認為部分原因,坦白說,是我們在其他一些科技公司之後才開始構建分布式計算基礎設施和數據中心這類東西。而且,正因為如此,當我們構建這些東西時,它已經不是競爭優勢了。所以我們想,那好吧,我們不如幹脆將其開源。然後我們將從圍繞它的生態係統中受益。所以我們有很多這樣的項目。
我認為最大的一個例子可能是開放計算項目(Open
Compute),我們公開了我們的服務器設計、網絡設計,最終還包括數據中心設計,並發布了所有這些內容。通過使其成為某種行業標準,整個供應鏈基本上都圍繞它進行了組織,這帶來了為每個人節省資金的好處。因此,通過公開和開放這些設計,我們基本上通過這樣做節省了數十億美元。
黃仁勳: 嗯,開放計算項目也使得NVIDIA HGX成為可能,我們為一個數據中心設計的東西突然間也能在其他數據中心工作。
紮克伯格:
確實如此。太棒了。所以我們有了這次非常棒的經曆。之後,我們還將其應用於我們的一係列基礎設施工具,比如React、PyTorch等。因此,可以說到了Llama出現的時候,我們對做這件事有一種積極傾向。
特別是對於AI模型,我想我有幾種看待這個問題的方式。首先,在過去20年裏,在公司裏構建東西中最困難的事情之一就是不得不應對這樣一個事實:我們通過競爭對手的移動平台發布我們的應用。一方麵,移動平台對整個行業產生了巨大的推動作用,這非常棒。另一方麵,不得不通過競爭對手來交付你的產品是具有挑戰性的,對吧?
而且,在我成長的時代,Facebook的第一個版本是在網絡上,那是開放的。然後轉向移動端,其好處是,現在每個人口袋裏都有一台電腦。那真是太好了。但不利的一麵是,我們在能做的事情上受到了更多限製。因此,當你審視這些計算時代的更迭,你會發現存在一個巨大的近因偏差,人們現在隻關注移動設備時代,並認為封閉的生態係統(會帶來更好的結果),因為蘋果基本上贏得了這場勝利並設定了規則。是的,我知道從技術上講,有更多的安卓手機存在,但蘋果基本上掌控了整個市場,而且(贏得了)所有的利潤,基本上安卓在發展方麵也在跟隨蘋果的腳步。所以我認為蘋果在這一代中明顯勝出。
但情況並非總是如此。
如果你回顧上一代,蘋果在搞他們那種封閉的模式(MacOS)。但微軟,它顯然不是一個完全開放的公司,但相較於蘋果,Windows在各種不同的OEM廠商和不同軟件、硬件上運行,是一個更為開放的生態係統。而Windows(那時)是領先的生態係統。基本上在個人電腦這一代產品中,開放的生態係統勝出了。
我有點希望在下一波計算浪潮中,我們將重返一個開放生態係統勝出並再次成為主導的領域。總是會有封閉的和開放的兩種選擇。我知道兩者都有其存在的理由。兩者都有其好處。我並不是在這方麵極端的人。我的意思是,我們也有閉源的產品。我們發布的並非所有內容都是開源的。
但我認為,對於整個行業所依賴的計算平台而言,尤其是軟件如果開放,會有很大的價值。這確實塑造了我在這方麵的哲學。無論是與Llama合作的AI項目,還是我們在AR和VR領域的工作,我們基本上是在為混合現實構建一個開放的操作係統,類似於Android或Windows,旨在與眾多不同的硬件公司合作,製造各種類型的設備,我們基本上隻是希望將生態係統恢複到那個開放的水平。我對下一代的發展相當樂觀,開放的係統將會勝出。
對我們來說,我隻想確保我們自己能夠接入(AI)。這麽說有點自私,但我的意思是,在創建這家公司一段時間後,我未來10到15年的目標之一就是,我隻是想確保我們能夠構建基礎技術,因為這將是我們構建社交體驗的基礎,因為之前我嚐試構建的許多東西都受到了限製。然後你被告知,不,你無法真正構建那個,這是平台提供商在某一層麵的說法。我隻想說,不,去他的。對於下一代,我們將一路構建下去。
黃仁勳:好的,我們的直播要被掐了(因為紮克伯格說了Fword)
紮克伯格:是的,抱歉。抱歉。(笑)
黃仁勳:我當時就想說,嗶。(笑)
紮克伯格:是的。你知道,我們前20分鍾做得還不錯,但一談及封閉平台,我就生氣。(笑)
黃仁勳:有人致力於構建盡可能最好的AI,無論他們如何構建,並將其作為服務提供給世界,我認為這才是一個很棒的世界。然後,如果你想自己構建AI,你仍然可以自己構建AI,這都很棒。但在使用AI的能力這件事上,你知道,有很多東西(我更喜歡開盒即用)。我更傾向於不自己製作這件夾克。我更傾向於讓別人為我製作這件夾克。你明白我的意思嗎?
紮克伯格: 是的,是的。
黃仁勳:
皮革可以開源對我來說不是一個有用的概念。但我認為你可以擁有偉大的服務,令人難以置信的服務,以及開放的服務,開放的。
紮克伯格: 是的。
黃仁勳: 那麽我們基本上涵蓋了整個範圍。但你用Llama
3.1所做的事真的很棒,你有405B的版本,你有70B的版本,你有8B的版本,你可以用它來生成合成數據,用更大的模型來教小模型。雖然更大的模型會更通用,它也不那麽脆弱,但你仍然可以構建一個更小的模型,適合於任何你希望的操作領域或運營成本。無論你希望的操作領域或運營成本是什麽,你都可以構建一個更小的模型來適應。
你創建了一個守衛,我想是叫Llama守衛(Llama
Guard),Llama守衛用於護欄,非常棒。所以現在你構建模型的方法,它是以一種透明的方式構建的。你擁有一個世界級的安全團隊,世界級的倫理團隊,你可以以這樣一種方式構建它,讓每個人都知道它是正確構建的。我真的很喜歡這部分。
紮克伯格:
是的,我先說完在我之前被岔開話題之前想說的話。你知道,我確實認為我們有這種一致性,我們構建(開源AI)是因為我們希望它存在,並且我們不希望被某些封閉的模型所隔離。而這不僅僅像是開發一款軟件那麽簡單,AI需要一個生態係統的支撐。因此,幾乎可以說,如果我們不將其開源,它甚至可能無法很好地運作。
我們這樣做並非因為我們是什麽無私的人,盡管我認為這對生態係統是有益的。我們這樣做是因為我們認為,通過建立一個強大的生態係統,可以使我們正在構建的東西達到最佳狀態,看看有多少人參與到了PyTorch生態係統的建設中。
黃仁勳:
(這需要)大量的工程工作。我的意思是,僅視頻處理方麵,我們可能就有數百人專門致力於讓PyTorch更優秀、更具擴展性,你知道的,性能更佳等等。
紮克伯格:
是的,而且當某個技術成為行業標準的時候,其他人就會圍繞它進行創新,對吧。因此,所有的硬件和係統最終都會被優化,以便非常好地運行這項技術,這將使所有人受益,同時它也能很好地兼容我們正在構建的係統。而這一點,我認為隻是展示了(開源)這種方式最終會變得非常有效的一個例子。
紮克伯格:所以,我認為開源策略作為商業策略將會是一個好的選擇。我想人們可能還沒完全意識到我們有多麽熱愛它。
黃仁勳: 我們圍繞它建立了一個生態係統。我們創造了這個東西。
紮克伯格:
是的,我發現這一點了。你們團隊的表現一直很出色。每次我們推出新產品,你們是首批發布並優化使其運作的團隊。我很感激這一點。
黃仁勳: 我還能說什麽呢?我們確實有不少優秀的工程師。
紮克伯格:(笑)而且,你們也總是迅速抓住這些機會。
黃仁勳:所以,我雖是長者,但行動敏捷。這就是CEO必須做的。
我認識到了一件重要的事情。我認為Llama確實非常重要。我們圍繞它構建了一個名為AI工廠(AI
Foundry)的概念,以便幫助每個人構建AI。很多人,他們有構建AI的願望。對他們來說,擁有AI非常重要,因為一旦他們將其融入數據飛輪,這就是他們公司機構知識被編碼並嵌入AI的方式。但他們承擔不起讓那個AI飛輪,數據飛輪在其他地方(通過購買服務)轉起來的成本。因此開源允許他們這樣做。但他們並不真正知道如何將這一切轉化為AI。所以我們創建了這個名為AI
Foundry的東西。我們提供工具,提供專業知識,Llama的技術,我們有能力幫助他們將這一切轉化為AI服務。然後當我們完成這一切後,他們接手,他們擁有,其輸出就是我們所說的NIMM。這個NIMM,這個神經微型NVIDIA推理微服務,他們隻需下載,帶走並在任何他們喜歡的地方運行,包括本地部署。我們擁有一個完整的合作夥伴生態係統,從能夠運行NIMMs的OEM到像Accenture這樣的GSIs,我們培訓並與他們合作創建基於Llama的NIMMs和管道。現在我們正在幫助全球各地的企業實現這一目標。我的意思是,這確實是一件非常令人興奮的事情。這一切實際上都是由Llama的開源引發的。
AI產業的未來:模型不會一家獨大,從小到大的模型都有場景
紮克伯格:
是的,我認為,幫助人們從大型模型中提煉出自己的模型的能力,將成為一個真正有價值的新事物。就像我們在產品方麵討論的那樣,至少我不認為會有一個每個人都會去跟它交流的核心AI智能體。在同一水平上,我也不認為必然會有一個模型是每個人都會使用的。
黃仁勳:
我們有一個芯片AI,芯片設計AI。我們有一個軟件編碼AI。我們的軟件編碼AI理解USD,因為我們用USD為Omniverse編寫代碼。我們有一個理解Verilog的軟件AI,我們的Verilog。我們擁有能夠理解我們的缺陷數據庫的軟件AI,並且知道如何幫助我們分類缺陷並將其發送給正確的工程師。
這些AI中的每一個都是基於Llama進行微調的。我們會對它們進行微調,並設置防護措施。你知道,如果我們有一個用於芯片設計的AI,我們並不希望詢問它關於政治、宗教之類的問題。所以我們會對它進行防護限製。因此,我認為每家公司基本上都會為它們擁有的每一個功能,配備專門為此構建的AI。他們需要幫助來實現這一點。
紮克伯格:
是的,我認為未來的一大問題是,人們將多大程度上使用更大、更複雜的模型,而不是僅僅針對他們的需求訓練自己的模型。至少我可以肯定,未來會有各種各樣、數量龐大的不同模型湧現。
黃仁勳:
我們使用的是最大型的那些模型。而這樣做的原因在於,我們的工程師時間極其寶貴。因此,我們現在正針對性能優化405B版本的Llama
3.1。如你所知,無論GPU多大,405B都無法完全適配。這就是為什麽NVLink的性能如此關鍵。我們采用了這種技術,通過一個名為NVLink的非阻塞交換機,將每塊GPU連接起來。
例如,在一個HGX中,就有兩個這樣的交換機。我們使得所有這些GPU能夠協同工作,運行405B時性能極為出色。我們這樣做的原因是,工程師的時間對我們來說極其寶貴。你知道,我們希望使用盡可能最佳的模型。即便這樣做在成本上隻節省了幾分錢,誰又會在乎呢?因為我們希望確保向他們展示的是最優質的結果。
紮克伯格:
是的,我的意思是,我認為405B的成本大約是GPT-4模型的一半。所以,從這個層麵來說,它已經相當不錯了。但我認為人們正在設備上使用或需要更小型的模型,他們會將其精簡。因此,這就像是AI運行的一整套不同的服務。
黃仁勳:
讓我們假設一下,我們正在用於芯片設計的AI每小時可能隻需10美元成本。你知道,如果你持續使用它,並且將那個AI共享給眾多工程師,那每個工程師可能都有一個成本不高的AI陪伴著他們。這個AI的成本其實並不高。而我們支付給工程師的薪酬卻很高。
因此,對我們來說,每小時幾美元就能大幅提升那些尚未接入AI的人的能力。立刻行動,接入一個AI吧。我們想說的就是這些。
那麽,讓我們談談下一波趨勢。你們所做的工作中,我特別喜歡的一點是,計算機視覺,我們內部大量使用的一個模型是 Segment
Everything。你知道,我們現在正在視頻上訓練AI模型,以便我們能更好地理解世界模型。我們的應用場景是機器人技術和工業數字化,將這些AI模型接入Omniverse,以便我們能更好地建模和表達物理世界。讓機器人在這些Omniverse世界中更好地運作。因此你的應用,Ray-Ban
Meta眼鏡,你將AI引入虛擬世界的願景真的很有趣。給我們講講吧。
紮克伯格: 好的,嗯,這裏麵有很多值得探討的內容。你所談論的那個Segment
Everything模型,我們實際上在SIGGRAPH上展示了它的下一個版本,Segment Everything
2。現在它已經能正常運行了,速度更快了。它現在也能處理視頻了。我覺得這些實際上是我考艾島牧場的牛。順便說一下,它們被稱為馬克的小牛,美味的小牛。
黃仁勳:美味的馬克的小牛。所以馬克下次來我家,我們得一起做費城奶酪牛排。你直接帶牛過來。
紮克伯格: 然後你做奶酪,我就當副廚。這牛真的非常好吃。
黃仁勳: 這是副廚的評價。
紮克伯格:
好吧,聽著。然後在晚上結束時,你就像,"嘿,你吃得夠多了,對吧?"然後我就說:"不知道,我還能再吃一個。"你就像:"真的嗎?"
黃仁勳:
我肯定像是在說:"對,我們還要再做一些。我們還要再做一些。你吃飽了嗎?"通常你的客人會說:"哦,是的,我很好。"
紮克伯格: “再給我做一個芝士牛排,老黃。”
黃仁勳: 所以,為了讓你知道他有多強迫症,我轉過身去,我在準備芝士牛排。然後我說:"馬克,切一下西紅柿。"
遞給馬克一把刀。
紮克伯格: 對,我是個精確的切割者。
黃仁勳:
然後他就切西紅柿。每一個都切得精確到毫米。但真正有趣的是,我以為所有的西紅柿都會被切成片,然後像一副撲克牌那樣疊起來。當我轉過身時,他說他需要另一個盤子。而他這樣做的原因是,他切的每一片西紅柿,彼此之間都不能有接觸。一旦他把一片西紅柿與其他西紅柿分開,它們就不應該再碰到一起。
紮克伯格: 是啊,你看,夥計,如果你希望它們接觸,你應該提前告訴我。你需要...我隻是一個副廚,好嗎?
黃仁勳: 這就是為什麽他需要一個不帶偏見的AI。
紮克伯格: 是的。(笑)
黃仁勳: 這真的很酷。好的,所以它在識別牛的足跡...它在追蹤牛的足跡。
紮克伯格:
用這個可以製作很多有趣的特效。而且因為它會被廣泛開放,行業內還會有更多嚴肅的應用。所以我的意思是,科學家用這些東西來研究珊瑚礁、自然棲息地以及地形的演變等等。但我的意思是,它能夠在視頻中實現這一點,告訴它你想追蹤的內容,你就能擁有B-roll鏡頭並能夠與之互動。這真是非常酷的研究。
黃仁勳:
我舉個例子,告訴你們我們使用它的場景。比如,你有一個倉庫,裏麵裝滿了攝像頭。倉庫的AI正在監控著所有發生的事情。假設一堆箱子倒塌了,或者有人在地麵上灑了水,或者即將發生任何意外,AI識別到這一情況,生成文字信息,發送給相關人員,救援就會在路上。這就是使用它的一個方式。不是記錄所有事情,如果有事故發生,不是記錄每一納秒的視頻,然後再回去檢索那個時刻,它隻記錄重要的內容,因為它知道自己在看什麽。因此,擁有一個視頻理解模型,一個視頻語言模型對於所有這些有趣的應用來說,確實非常強大。那麽,你們接下來還會研究些什麽呢?Ray,跟我談談...
計算平台的未來:別XR了,就AI+潮眼鏡就能賣10億個
紮克伯格:是的,還有所有智能眼鏡。我認為,當我們考慮下一代計算平台時,我們會將其分解為混合現實(XR)、頭戴設備和智能眼鏡。而智能眼鏡,我認為人們更容易接受並佩戴它們,因為現在幾乎每個戴眼鏡的人最終都會升級為智能眼鏡。這在全球有超過十億人。所以這將是一個相當大的市場。
VR/MR頭戴設備,我認為有些人覺得它們在遊戲或其他用途上很有趣,有些人則還不這麽認為。我的觀點是,它們都將存在於這個世界。
我認為智能眼鏡將類似於手機,是常駐型計算平台的下一個版本。而混合現實頭顯則更像你的工作站或遊戲主機,當你坐下來進行更沉浸式的體驗,並需要更多計算資源時。眼鏡(大小)隻是非常小的形式因素。因為算力將帶來很多限製,就像你不能在手機上進行(和計算機)同樣級別的計算一樣。
黃仁勳:它恰好出現在所有這些生成式AI突破發生的時候。
紮克伯格:是的,所以我們基本上,對於智能眼鏡,我們一直從兩個不同的方向來解決這個問題。一方麵,我們一直在構建我們認為的那種理想全息增強現實(AR)眼鏡所需的技術,並且我們正在進行所有定製矽芯片的工作,所有定製顯示堆棧的工作,就像為了實現這一目標所需做的所有事情。而且它們是眼鏡,對吧?不是頭戴式設備。不像VR/MR頭顯。它們看起來就像普通眼鏡。但它們與你現在戴的眼鏡相比,還有相當大的差距。我是說你的眼鏡非常薄。
但即便我們製造的雷朋眼鏡,目前還無法將實現全息AR所需的所有技術完全融入其中。我們正在接近,我認為未來幾年我們會越來越接近。它仍然會相當昂貴,但我們還是會把它推出成一個產品。
我們考慮的另一個角度是,先從外觀好看的智能眼鏡開始。通過與全球頂尖的眼鏡製造商EssilorLuxottica合作,他們基本上涵蓋了你所熟知的所有大牌,比如雷朋、奧克利、奧利弗·皮普爾斯,以及其他少數幾個品牌。這些幾乎都屬於EssilorLuxottica旗下。
黃仁勳: (就像)NVIDIA眼鏡(那麽大牌)。(笑)
紮克伯格我想,你知道,他們大概也會喜歡這種比喻。我是說,誰會不喜歡呢?在當下,誰會不想要這樣的眼鏡呢?
紮克伯格: 但我們一直在與他們合作開發雷朋係列,現在已經是第二代了。
我們的目標是,好吧,讓我們將外形限製在看起來非常棒的範圍內。然後在這個框架內盡可能多地融入技術,盡管我們知道在技術上還無法達到我們理想中的完美整合,但最終,它們將會是外觀出色的眼鏡。到目前為止,我們配備了攝像頭傳感器,因此您可以拍照和錄像,您實際上可以實時直播到Instagram,您可以在WhatsApp上進行視頻通話並實時傳輸給對方,您知道,您所看到的畫麵。它配備了麥克風和揚聲器,我是說,那個揚聲器實際上非常出色。它就像,開放式耳道設計,因此許多人覺得它比耳塞更舒適。您可以聽音樂,就像擁有一段私密的體驗,這相當不錯。人們很喜歡這一點,您可以在上麵接聽電話。
但我們發現,這些傳感器組合正是與AI對話所需的。所以這可以說是個意外的發現。如果五年前你問我,我們會先實現全息AR還是AI?我可能會說,大概是全息AR吧。對吧,我的意思是,這看起來就像是所有虛擬現實和混合現實技術上的進步,以及構建新的顯示技術棧。我們正朝著這個方向不斷取得進展。然後,大型語言模型(LLMs)取得了突破,結果是我們現在擁有了高質量的人工智能,並且在全息增強現實(AR)出現之前,它的改進速度非常快。
所以這是一種我未曾預料到的轉變。幸運的是,我們處於有利位置,因為我們一直在研究這些不同的產品,但我認為最終你會得到一係列不同價格、不同技術水平的潛在眼鏡產品。所以,基於我們現在看到的Ray-Ban
Meta的情況,價格在300美元左右的無顯示屏AI眼鏡將成為一個非常熱門的產品,最終可能會有數千萬甚至數億人使用。屆時,你將與高度互動的AI進行對話。
黃仁勳:它會有你剛才展示的視覺語言理解技術。實時翻譯功能。你可以用一種語言與我交談。我聽到的是另一種語言。
紮克伯格:當然,有顯示屏也會很棒,但這會增加眼鏡的重量,使其價格更高。因此,我認為很多人會想要那種全息顯示效果,但也有很多人希望最終能擁有類似超薄眼鏡的產品。
黃仁勳: 對於工業應用和某些工作場合,我們確實需要(虛擬現實)這樣的技術。
紮克伯格:對於消費品也是如此。我在疫情期間思考過這個問題,當時大家都短暫地遠程工作了一段時間。就像你整天都在Zoom上,這還算過得去。雖然現在我們有這些工具已經挺棒了,但未來我們離實現虛擬會議並不遙遠。到那時我並不實際在場,你看到的隻是我的全息影像,但感覺就像我們真的在那裏,身體上也在場。我們可以一起工作,共同協作。但我認為這在與AI合作時尤為重要。
黃仁勳: 我可以接受一個不需要我時刻佩戴的設備。
紮克伯格:
哦,是的,但我認為我們終將達到那個實際應用的階段。我的意思是,在眼鏡中,有細框和粗框,還有各種風格,但我認為我們離擁有全息眼鏡的形式還有一段時間,不過我認為在不久的將來,擁有一副時尚且稍顯粗框的眼鏡並不遙遠。
黃仁勳: 這些(小型智能)太陽鏡現在越來越貼合人臉了。我能看出來。
紮克伯格:是的,你知道嗎,這是一個非常有用的風格。無論你信不信,但我正努力成為一名潮男,以便在眼鏡上市前影響這種風格。(笑)
紮克伯格: 我能看出你在嚐試。你的潮男之路進行得怎麽樣了?(笑)
黃仁勳: 還早。但我覺得,如果未來業務的一大塊是打造人們佩戴的時尚眼鏡,那我可能應該開始多關注這方麵了。
紮克伯格:
沒錯。完全同意。我們得讓那個每天穿同樣衣服的我退休了。(笑)但這就是眼鏡的特別之處。我覺得它不同於手表或手機,人們真的不希望都長得一樣。
黃仁勳:
對,所以我認為,你知道的,這是一個平台,我覺得它會傾向於我們之前討論的主題,成為一個開放的生態係統,因為人們對於形式多樣性和風格的需求將會非常大。並不是每個人都會想要那種你知道的,其他人設計的類似的那種眼鏡,我不認為這對這次來說會行得通。
紮克伯格: 是的,我認為你說得對。
結束語:軟件3.0時代已經到來
黃仁勳:
馬克,我們正處在一個整個計算堆棧正在被重新發明的時代,這真是不可思議。我們對軟件的思考方式,你知道安德烈稱之為軟件1.0和軟件2.0,而現在我們基本上處於軟件3.0的時代了。從通用計算到生成式神經網絡處理方式的轉變,我們能夠開發的計算能力和應用在過去的想象中是不可思議的。這種生成式AI技術,我記不清還有哪項技術能以如此快的速度影響消費者、企業、行業和科學界,並且能夠跨越從氣候技術到生物技術再到物理科學等所有不同科學領域。在我們遇到的每一個領域,生成式AI都正處於這一根本性轉變的核心。
而且,除了你提到的生成式AI將在社會中產生深遠影響之外,我非常興奮的一件事是,有人之前問我是否會有一個"Jensen
AI",那正是你所說的創造性AI,我們可以構建自己的AI,並加載所有我寫過的內容,通過我回答問題的方式進行微調,希望隨著時間的積累,它能成為一個真正出色的助手和夥伴,為那些隻想提問或交流想法的人服務。這個版本的Jensen
AI不會評判你,你不必擔心被評判,因此你可以隨時與它互動。我認為這些都是非常了不起的事情。我們經常寫很多東西,而僅僅給它三四個主題,讓它以我的聲音寫出我想要的基本主題,並以此為起點,這是多麽不可思議。現在我們可以做的事情實在太多了,與你合作真的很棒。
我知道建立一家公司並不容易,你將你的公司從桌麵轉向移動、VR再到AI,所有這些設備,這真的非常非常不尋常。我們自己也多次轉型,我知道這有多難。多年來,我們倆都經曆了很多挫折,但這就是成為先驅和創新者所需要的。看著你真的很棒,同樣,我不確定這是否算轉型,如果你一直在做之前的事情,但你也增加了新的內容,這意味著還有更多的章節等待我們。我認為對你來說也是如此,看著你們的旅程很有趣。
我的意思是,你們經曆了一個時期,當時每個人都認為一切都會轉向這些設備,計算會變得非常便宜,但你們一直堅持不懈,就像實際上你們會需要這些能夠並行處理的大型係統一樣。
紮克伯格:
是的,我們曾經一段時間內製造越來越小的設備,但後來我們讓計算機變得時尚了一段時間,然後變得不那麽時尚,甚至超級不時尚,但現在又酷起來了。
黃仁勳:
我們製造圖形芯片GPU,現在你部署GPU。Zuck在他的數據中心裏有成千上萬的H100。我想你們即將達到600,000塊GPU的機組。
紮克伯格:我們是優質客戶。這就是如何在
大會上獲得Jensen問答環節的秘訣。(笑)
當他們說"你知道嗎,幾周後我們在SIGGRAPH有個活動",我就想,"是啊,我覺得那天我沒什麽安排,不在丹佛,聽起來很有趣,我那天下午也沒什麽安排"。
黃仁勳:(所以)你就這麽出現了,但關鍵是,你們構建的這些係統,它們是巨大的係統,非常難以協調,非常難以運行,你知道你比大多數人晚進入GPU領域,但你運營的規模比任何人都大,看著你所做的一切真是令人難以置信,恭喜你所做的一切,你現在真是個潮流引領者。