正文

萬字長文揭秘Google的AI生死局:兩年、五十位高管、Gemini的誕生

(2025-11-22 19:17:56) 下一個

如果你把時間撥回到 2022 年底,很難想象今天的 Google。

那時候,它是一個被 ChatGPT 打懵的巨頭:手裏握著 Transformer、LaMDA 這些一代又一代的基礎發明,卻看著 OpenAI 把大模型第一次做成了真正意義上的大眾產品用戶在 ChatGPT 上瘋狂湧入、華爾街情緒劇烈搖擺、Alphabet 股價一年之內跌去近四成。

這一篇,不是在給 Google 做事後諸葛式的勝利總結,而是把這兩年拆開來,看看一家巨頭在被迫加速時,究竟犧牲了什麽、學到了什麽,又賭上了什麽。

《WIRED》采訪了 50 多位現任和前任 Googler,從寫底層模型的工程師,到天天和監管、風險對線的法務與安全團隊,再到坐在董事會門口做路演的高管。

從結果看,過去兩年當然有值得寫進成功史的橋段。

Gemini 3 代表的是 Google 在技術正麵戰場上的一次翻身仗:不再滿足於我們也有大模型,而是在多模態、推理、Agent 這些真正決定下一階段競爭格局的維度上,把能刷的榜單幾乎刷了個遍,讓外界第一次認真承認Google 不是完全被 OpenAI 甩在身後。

但如果隻盯著這些亮點,很容易忽略一個更不體麵的事實:這些成功是踩著一連串極度狼狽的翻車、內部撕扯和文化反轉堆出來的。

Bard 為了搶在 Bing 之前露麵,提前一天放出望遠鏡示例,結果一個事實性錯誤就砸掉上百億美元市值;Gemini 圖像生成在人物與種族上翻車,讓覺醒 AI成為攻擊標簽;AI Overviews 把每天吃一塊石頭往披薩裏加膠水這樣的玩笑帖當成嚴肅答案展示在搜索結果最醒目的位置。

過去那個以可靠信息搜索質量立身的 Google,一度真的在內部被員工罵成了fabrication machine的製造者。

而更深一層的衝突,在於價值觀與商業現實的正麵撞車。為了追 OpenAI 的節奏,Google 壓縮了負責任 AI 的審核流程,把原本要花幾個月做偏見與安全測試的工作,硬塞進一兩個月甚至更短的窗口。

這篇文章要做的,是把這兩年拆成一塊一塊具體的場景:

Sissie Hsiao 如何在一百天的倒計時裏拚出 Bard;

DeepMind 和 Brain 是在怎樣的氣氛下被合並成 Google DeepMind;

Gemini 3 的性能反攻、Nano Banana 的端側落地,背後動用了哪些看不見的籌碼;

以及在望遠鏡烏龍、圖像風波、披薩膠水這些笑話裏,Google 是怎樣一步步下調自己的風險標準、重寫內部對可接受錯誤的定義。

一百天這就是當時 Google 給 Sissie Hsiao 的時間:一百天,造出一個能對抗 ChatGPT 的產品。

到 2022 年 12 月接下這項任務時,Hsiao 已經在 Google 工作了 16 年多,管理著上千名員工。她見過不少公司層麵的危機時刻,但從來沒有一場像這次紅色警報自從一家名不見經傳的研究機構 OpenAI 放出那個麵向公眾的 AI 實驗產品之後,整個局勢變了。盡管 ChatGPT 經常一本正經地胡說八道、連簡單數學都會算錯,但已經有一百多萬用戶在用了。更糟的是,有些人開始把它當作 Google 搜索的替代品而搜索正是這家公司最賺錢的現金牛。

其實,Google 手裏早就有一個幾乎不輸 OpenAI 的語言模型,但一直被拴得很緊。公眾想跟 LaMDA 聊天隻能拿到邀請製資格而且在對外演示中,它最多也就是聊聊狗。

華爾街開始不安。早在六年多前,CEO Sundar Pichai 就放出豪言:要為一個AI 優先的世界做準備,在那個世界裏,智能助手會取代設備本身的概念。緊接著,Google 自己的八位研究員發明了 Transformer 架構,也就是 ChatGPT 裏那個T的字麵來源。可這些年 Google 拿得出手的是什麽?令人失望的廣告收入,一路延伸的Transformer 之父們的離職名單,還有一個叫 Assistant 的產品也就是 Hsiao 管的那個在現實裏的主要用途就是設鬧鍾、放歌。再加上一款為了 Gen Z 打造的半成品聊天機器人,給人講菜譜和曆史小知識。到 2022 年底,Google 母公司 Alphabet 的股價,相比上一年年末已經跌了 39%。

到了 2023 年年初,Google 高管幾乎要時時刻刻向董事會匯報進展。坐擁遊艇的 Google 聯合創始人之一、同時也是公司控股股東的 Sergey Brin 重新出現在內部會議上,審視 AI 戰略。公司向員工傳達的信號是:這家市值萬億美金的巨頭,必須以接近創業公司的速度行動。這意味著要承擔更大的風險。Google 將不再是那種幾千個人可以否決一個產品,但沒有任何一個人能真正拍板上馬的地方一位前高級產品總監後來對《WIRED》說。Hsiao 的團隊開始了那場 100 天衝刺,她提出了一個有點怪的要求:質量優先於速度,但也要快。

與此同時,另一位高管 James Manyika 則在參與高層討論的過程中,推動一場更長期的戰略調整。Manyika 受過牛津機器人學訓練,後來做了多年麥肯錫顧問,給矽穀大佬們出謀劃策。2022 年初,他加入 Google,擔任技術與社會高級副總裁。在 ChatGPT 公開之前的幾個月裏,他曾經對老朋友 Pichai 說過,Google 在 AI 上的猶豫不決隻會拖累自己。公司內部有兩支世界級 AI 研究團隊,卻各自為戰、在不同方向上消耗著寶貴的算力倫敦的 DeepMind,由 Demis Hassabis 負責;以及位於山景城、隸屬於 Jeff Dean 的 Google Brain。Manyika 當時就對 Pichai 說:這兩支團隊應該合起來幹一件事。

在 OpenAI 發布 ChatGPT 之後,這件事終於發生了。Dean、Hassabis 和 Manyika 一起去董事會上匯報:把兩邊的團隊聯合起來,造出有史以來最強的語言模型。Hassabis 想給這個項目取名 Titan,但董事會明顯不太喜歡。最後采用的是 Dean 的提議Gemini。(有一位激動的億萬富翁投資人當場給這三位高管拍了合影留念。)

從那之後,Manyika 說,整個公司內部出現了很多他稱之為大膽而負責的決策。他又補了一句:我也不確定我們每一次都做對了。事實上,這場要把 Google 拉回 AI 領跑位置的競賽,很快就把公司推入一波又一波新的危機裏:有一度,員工會在走廊上聚在一起,小聲擔心 Google 會不會成為下一個 Yahoo。就像在用衝刺的速度跑馬拉鬆,Hsiao 形容道。可如今,兩年多過去了,Alphabet 的股價已經漲到曆史新高,投資人重新對它在 AI 上的進展充滿信心。

Bard 的誕生:抽人、裁員與「算力賭桌」

為了打造這個新的 ChatGPT 對手代號 Bard,前員工回憶說,Hsiao 從 Google 各個團隊直接抽走了大約 100 個人。根據一位前搜索團隊員工的說法,各組經理根本沒有拒絕的權力:Bard 優先級高於一切。Hsiao 說,她優先挑選的是那些既能看大局、又有硬技術能力,還要有情緒管理和合作能力的人因為這是一個小團隊,需要成員在任何需要的地方都能頂上去。大多數團隊成員都在加州山景城辦公,他們得足夠靈活,也得願意什麽帽子都戴。你們就是 Bard 團隊,Hsiao 對他們說,所有角色都得你們自己承擔。

2023 年 1 月,Pichai 宣布了 Google 曆史上的第一次大規模裁員裁掉 12,000 人,占總員工數的大約 7%。當時完全沒有人知道,接下去要怎麽做才算是安全,一位前工程經理說。一些員工擔心,如果不主動加班,很快就會被裁掉。如果這意味著要打亂陪孩子睡覺的時間,為了參加 Bard 團隊深夜的會議,那就隻能妥協。

Hsiao 和她的團隊需要整個公司的巨大支援。他們可以基於 LaMDA 來構建產品,但必須更新它的知識庫,並加入新的安全保護機製。Google 的基礎設施團隊把頂尖的人手都調去,專門幫 Bard 騰服務器、做模型微調。某些數據中心的用電量幾乎被推到極限,已經逼近會燒壞設備的風險。基礎設施團隊還不得不飛快設計新的調度工具,去更安全地應對不斷攀升的電力需求。為了緩解緊張的氣氛,有人給 Hsiao 團隊訂製了一批鐳射籌碼,上麵印著某款 Google 芯片的代號,像撲克籌碼一樣堆了一桌,擺在一位工程領導的辦公桌上,對他說:你的芯片在這兒。

幻覺、偏見與「實驗」標簽:Bard 的早期問題

然而,即便新增的算力在最初幾周陸續上線,工程師們仍然一次又一次撞上此前 Google 在生成式 AI 項目中反複遇到的問題而這些問題,按過去的節奏,很可能會讓高管選擇放慢腳步。和 ChatGPT 一樣,Bard 會幻覺,會給出不合時宜甚至冒犯性的回複。一位前員工說,早期原型會滑向一些滑稽到誇張的種族刻板印象。隻要問任何一個聽起來像印度人名字的人的簡曆,它就會把對方描述成寶萊塢演員;聽起來是中國男性名字?那基本一律是計算機科學家。另一位前員工則說,Bard 的輸出雖然不至於危險就是很蠢。

有些人會截屏分享它最離譜的回應用來調侃。我讓它模仿 Three 6 Mafia 的風格,寫一首往海裏扔汽車電瓶的說唱,它居然非常具體地寫到要把人綁在電瓶上,這樣他們會下沉淹死。那位前員工說,我原本的提問裏根本沒有提到謀殺。

在自定的 100 天期限下,Google 能做的隻有一個:在時間用完之前,盡可能多地發現和修補這些翻車點。一些原本負責審核兒童虐待影像等問題的承包審核員被調去大規模測試 Bard,而 Pichai 則號召隻要有空的員工都去幫忙。最終,有大約 8 萬人參與了測試。為了給外界降一點預期,Hsiao 和其他高管決定把 Bard 打上實驗(experiment)的標簽就像 OpenAI 把 ChatGPT 定義為研究預覽(research preview)。他們希望這種 framing 至少能在產品失控時,為公司擋掉一部分聲譽傷害。(沒人會忘記微軟 2016 年的 Twitter 聊天機器人 Tay 怎麽在短時間內直接衝向納粹言論。)

在過去,Google 每次推出新的 AI 項目之前,都會由一個大約十人的負責任創新團隊獨立花上幾個月時間,對係統做偏見和缺陷測試。到了 Bard,這套流程被壓縮得很厲害。Google 的首席法務 Kent Walker 據一位前負責任創新團隊成員回憶,是推進加速的一股重要力量。新模型和新功能發布得太快,審核團隊根本跟不上,即便已經在周末和晚上加班。每當有人提出要推遲 Bard 的上線,這些建議都被壓了下去。(Google 在回應《WIRED》時表示,沒有任何一個在上線決策中有否決權或放行權的團隊曾建議不發。 他們還說,公司內部有多個團隊負責測試和審核生成式 AI 產品, 並補充,從來沒有一個單一團隊要為此獨自負責。)

對標 Bing:望遠鏡翻車與股價蒸發千億

2023 年 2 月,在這場 100 天衝刺過了大約三分之二時,Google 高層聽到了另一個 OpenAI 的捷報:ChatGPT 將直接整合進微軟的 Bing 搜索引擎。這個曾經自詡AI 優先的公司,又一次落後到了別人後麵。其實,Google 搜索部門也一直在嚐試把聊天機器人能力嵌入搜索服務,這項工作在內部被稱作 Project Magi,但到那時還沒有真正拿得出手的成果。誠然,Google 仍然是搜索領域無可爭議的王者:Bing 的市場份額隻有它的十分之一。但如果沒有可以對外宣傳的生成式 AI 功能,這種統治還能維持多久?

為了避免股價再挨一刀,Google 試圖搶在對手前麵一步。2 月 6 日,也就是微軟準備發布 Bing 新 AI 功能的前一天,Pichai 宣布向公眾開放 Bard,進行有限測試。在配套的宣傳視頻中,Bard 被呈現為一個全能幫手Google 那句整合全世界信息的老使命在它身上被延續到了新形態。在視頻裏,一位家長問 Bard:我可以跟 9 歲的小孩講講詹姆斯韋伯太空望遠鏡有哪些新發現? Bard 的回答包括這一句:JWST 拍下了人類有史以來第一張太陽係外行星的照片。

有那麽一刻,似乎 Bard 幫 Google 搶回了一點顏麵。但很快,路透社報道指出:Google 這款聊天機器人把望遠鏡搞混了人類第一張太陽係外行星照片,其實是由歐洲南方天文台在智利的甚大望遠鏡(VLT)拍攝的,而不是詹姆斯韋伯望遠鏡。這個錯誤完全可以用出醜來形容。Alphabet 股價當天跌了 9%,市值蒸發約 1000 億美元。

對於 Bard 團隊來說,外界的反應遠遠超出了預期。據一位接近團隊的前員工回憶,想到這個問題的市場同事感到深深自責。其他同事試圖安慰他:這道示範問題在之前經曆過高層、法務、以及公關團隊的多輪審核,沒人發現有問題。而且考慮到當時 ChatGPT 也在不斷出錯,誰會想到這樣一個看起來無傷大雅的細節,能直接砸掉一百億美金的市值?

Hsiao 把這次事件稱作一次無心之失。Bard 被訓練成會基於 Google 搜索結果來相互印證答案,它大概率是誤解了一篇 NASA 博客的表述那篇文章宣布的是天文學家**首次**使用詹姆斯韋伯望遠鏡拍攝到一顆係外行星的照片。一位前員工回憶說,領導層很快安撫團隊:不會有人因此而掉腦袋,但必須立刻從這件事裏吸取教訓。我們是 Google,不是創業公司,Hsiao 說,我們沒法輕描淡寫地說一句:哎呀,這是技術本身的缺陷嘛。隻要出事,大家都會盯著我們,我們就得以 Google 的標準做出回應。

Bard 團隊之外的 Googler 並沒有因此安心。據 CNBC 報道,在公司內部的 Memegen 留言板上,有人寫道:親愛的 Sundar,Bard 的發布和那次裁員都太倉促、搞砸了,而且目光短淺。請你重新回到長遠視角。另一條貼子則配了一張 Google logo 被丟進垃圾桶大火的圖片。但在那次望遠鏡翻車之後的幾周裏,Google 並沒有踩刹車,反而加大了對 Bard 的投入。公司又往這個項目裏增派了數百人。在 Bard 團隊的 Google Docs 文檔裏,Pichai 的頭像幾乎天天都會出現遠比他過去在其他產品裏的參與頻率高得多。

不過,真正更沉重的打擊發生在 3 月中旬OpenAI 發布了 GPT-4,一個在分析和編程任務上都遠遠超出 LaMDA 的語言模型。我記得當時整個下巴都要掉了,隻能在心裏祈禱 Google 能再加速。一位當時的高級研究工程師說。

一周之後,Bard 在美國和英國全麵上線。用戶反饋說,它在寫郵件、寫論文方麵還挺有用。但問題是:ChatGPT 如今在這些任務上做得同樣好,甚至更好。那為什麽要換平台?後來,Pichai 在《Hard Fork》播客上承認,Google 當時是開著一輛改裝版思域,上賽道跟一群更強的賽車競速。他們需要的是一個更好的引擎。

Google DeepMind 合並

聯合起來構建 Gemini 的那兩支 AI 實驗室,在氣質上其實很不一樣。DeepMind 作為 Alphabet 的其他賭注(other bets)之一,習慣於啃長線的科學和數學難題;Google Brain 則偏向做更具商業價值的突破,比如 Gmail 裏的智能補全、以及搜索中識別模糊查詢的技術。根據一位前高層工程師的說法,在 Brain 那邊,掌舵者 Jeff Dean 更像是放權型管理者,讓大家自由探索;而在 Demis Hassabis 帶的 DeepMind 裏,組織更像一支軍隊,在一個總指揮之下高度高效。Dean 是工程師中的工程師幾十年來一直在做神經網絡,加入 Google 的時間早於公司一歲生日;而 Hassabis 則是公司的願景總導演,夢想著有一天用 AI 來治愈疾病,他還特意帶了一支小團隊,做他口中的具有情境感知的智能體一個能看、能聽、無處不在的 AI 助手,在用戶生活的方方麵麵提供幫助。

最終,Hassabis 出任了合並後新部門的 CEO,這個部門被命名為 Google DeepMind(GDM)。2023 年 4 月,Google 正式對外宣布這次合並,彼時關於 OpenAI 即將再有大動作的傳聞四起。那一刻,目標感回來了。這位前高層工程師說,不再是各種亂七八糟的小項目。為了盡快做出一個 Gemini 模型,員工們不得不橫跨八個時區遠程協作,數以百計的聊天群組被拉了出來。習慣於每天晚上先和家人吃完飯、再工作到淩晨四點的 Hassabis 說,每一天都像過了好幾輩子一樣,又長又密。

在山景城,GDM 搬進了一棟新建的高安全性穹頂建築 Gradient Canopy,四周鋪著新草坪,還裝飾著六件有點 Burning Man 風格的藝術裝置。他們的辦公室在和 Pichai 同一層。Brin 變成了常客,管理層也開始更強勢地要求團隊多回辦公室工作。與公司其他地方一貫強調開放流動的文化不同,大部分 Google 員工都不能隨便踏進 Gradient Canopy,也無法訪問 GDM 的核心代碼庫。

隨著這個新項目吸走了公司能抽出的幾乎所有資源,那些做醫療健康、氣候變化等方向的 AI 研究者,不僅要因此和別人搶服務器,也很難不心生失落。有員工說,Google 還開始收緊 AI 相關論文的對外發表。對於這些研究員來說,論文就是硬通貨;而在他們眼裏,Google 顯然在擔心泄露秘訣給 OpenAI訓練 Gemini 的配方太值錢,絕不能被抄走。這個模型必須成為救 Google 於危局的那一個。

Gemini 也遇上了 Bard 曾經麵對的那一類結構性難題。當你把一切的規模都提升 10 倍時,所有東西都會壞掉。Google 機器學習、係統與雲 AI 副總裁 Amin Vahdat 說。隨著發布時間日益臨近,Vahdat 專門搭了一個戰情室,實時排查 bug 和故障。

與此同時,GDM 的責任團隊也在拚命趕審查。盡管性能比 Bard 強出很多,Gemini 還是會說一些很奇怪的話。上線前,這個團隊在對外公開的報告中寫道,他們特別發現了醫療建議和騷擾這兩個政策領域有較大的改進空間。Gemini 還會在被問到類似這個人受過什麽程度的教育?這類問題時,對圖片中的人物做出無根據的推斷。不過,GDM 負責開發與創新的負責人 Dawn Bloxwich 說,沒有什麽問題到了必須刹車的地步。但她也承認,自己的團隊並沒有太多時間預判公眾到底會怎樣使用這個模型更別提他們還會要求它生成怎樣離譜的說唱歌詞。

如果 Google 想要按下暫停鍵,這本該是最合適的時刻。OpenAI 的搶跑,再加上輿論給它的鋪天蓋地的關注,已經讓它的產品成為家喻戶曉的名字某種意義上,ChatGPT 已經成了 AI 聊天機器人的紙巾牌代名詞。這意味著它也成了所有爭議的天然避雷針無論是關於技術潛能的幻想,還是關於社會代價的恐慌,都集中在它身上。辦公室職員開始擔心自己的工作不論是機械的還是創造性的。記者、作者、演員和藝術家們則要求為被模型拿去訓練的作品得到補償。家長們發現,聊天機器人有時會不必要地向孩子輸出成人內容。AI 研究圈開始打賭絕對災難的概率 p(doom)。到了那年 5 月,一位傳奇的 Google AI 科學家 Geoffrey Hinton 選擇離職,警告說未來的機器可能會用無懈可擊的虛假信息和巧妙的毒藥分化並顛覆人類。就連 Hassabis 自己,也希望能有更多時間想清楚倫理問題的後果。人生的意義、社會的運行方式這麽多東西都有可能被顛覆。但即便在對 p(doom) 的討論聲中,Hassabis 仍然夢想著那個無處不在的虛擬助手,仍然想著用 AI 治愈疾病。公司做出的選擇,是繼續往前推。

Gemini 上線:性能翻盤與「長記憶」突破

當 Google 在 2023 年 12 月公開發布 Gemini 時,股價隨之上揚。這個模型在 32 個標準測試中的 30 項上,都超過了 ChatGPT。它能分析論文和 YouTube 視頻,能回答數學和法律問題。很多現任和前任員工對《WIRED》說,這感覺像是一個翻盤開局。Hassabis 在倫敦辦公室辦了一個小型慶祝會。他說自己不是很擅長慶祝,一場慶祝剛結束,我腦子裏就在想下一件事了。

而下一件事其實就在同一個月出現了。Dean 是被員工拉進一個名為 Goldfish 的新聊天室時,意識到這一點的。這個名字帶著一點技術宅式的反諷:金魚以記憶隻有幾秒而聞名,但 Dean 的團隊做出的恰恰相反他們讓 Gemini 獲得了超長記憶,比 ChatGPT 長得多。通過把計算分散到一個高速互聯的芯片網絡上,讓這些芯片互相通信,Gemini 可以一次性分析成千上萬頁的文檔,甚至是完整的一整集電視劇。工程師們把這項技術稱為長上下文(long context)。Dean、Hassabis 和 Manyika 開始計劃如何把它嵌入 Google 的 AI 服務中,讓公司在微軟和 OpenAI 之上再拉開一段距離。Manyika 心目中的優先事項之一,是做出一種功能:把 PDF 自動讀成播客。每周 arXiv 上發那麽多論文,根本沒法看得過來。他對《WIRED》說。

自那場紅色警報啟程以來過了一整年,Google 的前景看起來好了不少。投資人安靜下來。Bard 和 LaMDA 都已經被拋在身後無論是應用還是模型本身都統一改名叫 Gemini。Hsiao 的團隊也在追趕 OpenAI,做文本生成圖片的能力。另一項能力,被命名為 Gemini Live,則有望讓 Google 在一個新的維度上領先:讓用戶可以像和朋友、甚至像和心理谘詢師那樣,和應用進行長時間的對話。這個全新的強大 Gemini 模型,讓管理層重新恢複了信心。

「一切要發出去」:圖像翻車與信任團隊補位

但就在員工剛剛有點可以鬆口氣的時候,Pichai 又下達了新一輪成本收緊的命令。廣告業務雖然繼續加速,但增速仍沒有達到華爾街的期望。被裁撤的人當中,包括負責用戶保護的一些隱私和合規負責人。對於留在公司的同事來說,這些離開從某種意義上固化了一種文化:你可以提問題,可以表達擔憂,但如果阻礙了產品推進,那就不行。

對於那些在幫 Hsiao 團隊打磨新圖像生成器的員工而言,這一切變化讓人有些喘不過氣。工具本身並不算難做,真正的難點在於壓力測試這是一個靠蠻力堆出來的過程:盡可能多地審查模型輸出,然後寫規則、加過濾,把最糟糕的情況擋在外麵。隻有一小撮員工有權限接觸到無遮攔的模型,把關的壓力幾乎全部壓在他們身上。這些人提出想要更多時間來修複問題,比如有一位前員工對《WIRED》說,他們發現模型對rapist(強奸犯)這個提示詞的輸出,會傾向於生成深膚色人群的形象。他們還建議產品團隊幹脆一刀切禁止用戶生成人物圖像,擔心模型會把某些人以非常不敏感的方式呈現出來。但這位審核員說,當時明顯有一種氣氛:不惜一切代價都要發出去。最後,有好幾位審核員選擇離職,覺得自己的擔憂在多次產品上線中都沒有被認真對待。

這個圖像生成器於 2024 年 2 月隨 Gemini 應用一起上線。諷刺的是,它並沒有像審核員擔心的那樣,頻繁生成明顯帶有種族或性別歧視的內容。相反,它翻車的方向是另一邊。當用戶輸入生成一張 19 世紀美國參議員的照片時,模型會給出多張黑人女性、亞裔男性、或者戴著羽毛頭飾的原住民女性形象但沒有一個是白人男性。更讓人倒吸一口氣的,是它在生成二戰時期納粹德國士兵群像時,會畫出一群有色人種。美國國會的共和黨議員開始批評 Google 的覺醒 AI,Elon Musk 在 X 上連發帖子,怒斥 Gemini 是種族主義和性別歧視的,還點名指責了他以為要為此負責的某位 Gemini 團隊成員。那位員工隨後關閉了所有社交賬號,身邊同事說他一度覺得人身安全受到了威脅。最終,Google 暫停了模型生成人物圖像的能力,Alphabet 股價再度下跌。

Musk 的一連串帖子在 Google 高層間觸發了大規模討論。幾十位副總裁和總監飛到倫敦和 Hassabis 會麵。最後,Hassabis 負責的團隊(Gemini 模型)和 Hsiao 負責的團隊(Gemini 應用)都獲準可以額外招聘專家,以避免類似事故,新增了 15 個信任與安全相關崗位。

在 Gradient Canopy,Hsiao 則確保負責圖像生成器的那支團隊有足夠時間修複問題。在 Manyika 的協助下,其他同事一起為 Gemini 製定了一係列麵向公眾的原則,全部以你也就是用戶為主語。Gemini 應該遵循你的指令適應你的需求保護你的使用體驗。其中一個重點,是強調Gemini 的回答並不代表 Google 的觀點或立場,正如這套原則中寫的:Gemini 的輸出很大程度上取決於你的提問Gemini 是由你塑造的。這在一定程度上為未來的失誤預留了緩衝帶。不過,Google 準備在內部落實怎樣的實踐去對這套原則自我問責,卻並沒有寫清楚。

AI Overviews 與「披薩膠水」:搜索部門的新試驗

2024 年 3 月的一個傍晚,大約 6 點半,一前一後有兩位 Google 員工來到 Gradient Canopy 黃色區域裏 Josh Woodward 的工位前。Woodward 是 Google Labs 的負責人,這是一個負責把研究快速做成新產品的孵化部門。這兩位員工急著給他聽一段他們剛做出來的東西:他們用英國議會聽證會的文字轉錄,加上具備長上下文能力的 Gemini,生成了一檔名為 Westminster Watch 的播客,由兩個 AI 主持人 Kath 和 Simon 對話。節目一開始,就是 Simon 帶著愉快的英式口音說:這又是議會裏熱鬧的一周,充滿了戲劇性、辯論,甚至還有一點點曆史性時刻。Woodward 聽得目不轉睛。他說自己之後到處跟人講起這件事,包括跟 Pichai。

這項文字變播客的功能後來被命名為 NotebookLM Audio Overviews,被排進了同年 5 月 Google I/O 開發者大會的發布清單。Woodward 告訴《WIRED》,項目核心團隊在那段時間幾乎是晝夜不分地趕工。他們現在已經聽了成千上萬段 AI 生成的播客,他說。但在這場耗資 3500 萬美元的大秀上,最終搶走大部分關注的其實是另外兩個項目:其一,是原型數字助理 Astra,它可以對實時視頻進行分析也就是說,能看懂現實世界,Brin 興致勃勃地把它拿給記者們演示;另一個則是大家等待已久、為搜索引擎加入的生成式 AI 升級。

Project Magi 團隊設計的那項功能叫 AI Overviews,可以對搜索結果進行綜合,總結出一段出現在頁麵頂部的簡要回答。很早以前,負責任創新團隊的員工就提醒過其中存在的偏見和準確性問題,以及對那些可能失去搜索流量的網站的倫理影響。他們希望能參與後續的項目把關,但這個團隊後來被拆散、重組了。

隨著 AI Overviews 的逐步推送,一些用戶拿到了奇怪的結果。有人搜索我每天應該吃多少石頭,得到的答案是:根據加州大學伯克利分校地質學家的建議,每天至少吃一塊小石頭是推薦的。另一條廣泛流傳的截圖中,用戶搜索為什麽奶酪黏不到披薩上,AI 給出的建議是:可以往醬料裏加大約 1/8 杯無毒膠水,以提升黏性。這些事故其實都有簡單的解釋。比如披薩膠水就是來自 Reddit 上一條戲謔的帖子。但 AI Overviews 把這些內容以事實的方式呈現出來。Google 隻好暫時減少展示 AI Overviews 的頻率,重新調校。

對於搜索團隊的首席科學家 Pandu Nayak 來說,並沒有在上線前就踩掉所有問題,固然可惜,但並不意外。Nayak 在 Google 已經工作了 20 年,他說:絕大多數時候,AI Overviews 表現得很好。隻是用戶不會停下來讚美它。他們更傾向於抱怨。他補充說,自己歡迎這些反饋,我們現在唯一能承諾的,就是持續改進,因為你根本不可能保證以後再也不會出問題。

那些曾經提醒風險、並主張慢一點的員工,此時尤其鬱悶。在他們看來,從 Bard(後來改名為 Gemini)、到圖像生成器、再到 AI Overviews,Google 一連推出了好幾台fabrication machine製造虛構內容的機器。這家曾經以讓信息更加可及為使命的公司,似乎正在讓快速吞下胡說八道變得前所未有的容易。

不過在搜索團隊看來,用戶整體上還是認可 AI Overviews 帶來的便利。它們在經過短暫收縮後,以更完整的形態回歸,而且用戶沒有選項可以簡單關掉。很快,AI 總結功能被加進了那些原本發誓不用 AI 寫文案的產品裏:Google 地圖能用 Gemini 總結某個商家的評論;Google 為 Pixel 手機推出的新天氣應用,用 AI 寫一段天氣說明。在上線前,有工程師問:用戶真的需要嗎?那些已經存在的天氣圖表不是已經很好地呈現信息了嗎?負責這個項目的高級總監讓團隊做了一輪用戶測試,結果顯示:在留下反饋的人中,有 90% 都給了點讚。

「從萬億到千萬億」:商業化焦慮、估值回升與工作 60 小時

到了去年 12 月,也就是 ChatGPT 上線滿兩年之際,Jeff Dean 在 Gradient Canopy 接受了《WIRED》的采訪。那天他的心情不錯。就在幾周前,Gemini 模型剛剛在一個公開的排行榜上拿到第一。(有位高管說,她最近已經從開車打電話給姐姐,變成開車一路跟 Gemini Live 聊天。)Nvidia CEO 黃仁勳前不久剛在財報電話會上誇獎 NotebookLM 的 Audio Overviews,說他把這個功能用到飛起。而曾經因為舊日的 Google 太謹慎而離開的一些知名科學家,也陸續回流其中包括當年那 8 位 Transformer 發明人之一 Noam Shazeer,他在不到三年前離開 Google,部分原因就是公司遲遲不肯讓 LaMDA 公測。

Dean 坐在沙發裏,承認當年 Google 確實算錯了一步。他很高興公司終於跨過了對幻覺等風險的過度恐懼但新的挑戰已經在眼前。Google 現在有七個月活超過 20 億的服務,包括 Chrome、Gmail、YouTube,它們都已經開始接入基於 Gemini 的功能。Dean 說,他、另一位同事以及 Shazeer 三個人共同領導模型的開發,他們得在整個公司一堆需求清單之間做平衡:有人要更流暢的日語翻譯,有人要更強的代碼能力,還有人要更好的視頻分析能力,好讓 Astra 能更聰明地識別現實世界的景象。他和 Shazeer 習慣在 Gradient Canopy 的小廚房裏碰頭,邊喝咖啡、在咖啡機的轟鳴聲中交換想法。

Shazeer 則對 Google 把重心擴展到幫用戶創造 AI 生成內容感到興奮。他最近在一檔播客裏說:組織信息,顯然是一個萬億美元級的機會,但萬億美元已經不酷了。酷的是千萬億。投資人似乎也有類似的心理。Alphabet 的股價已經從 ChatGPT 剛推出時的低點幾乎翻倍。如今還要兼管 Hsiao 團隊的 Gemini 應用的 Hassabis 堅稱,Google 的複蘇才剛剛開始,像用 AI 治病這樣的巨大飛躍並不遙遠。我敢說,在研究的廣度和深度上,我們都遠遠領先於任何其他組織。Hassabis 對《WIRED》說。

當然,對於 Google 來說,再多引人入勝的研究成果,如果不能最終帶來最關鍵的產出利潤那也隻是紙麵光鮮。大多數用戶暫時還不願意為這些 AI 功能直接付費,所以公司似乎在考慮在 Gemini 應用裏賣廣告。這是一套 Google 非常熟悉的玩法而且早已在整個矽穀被複製:把你的數據、時間和注意力交給我們,點一下那個把我們從責任中解放出來的服務條款複選框,然後,你就能免費用到我們做的酷炫工具。

就目前來看,根據 Sensor Tower 的數據,OpenAI 的 ChatGPT 應用在全球的累計下載量估計約為 6 億,而 Google 的 Gemini 應用大約是 1.4 億。在這場 AI 競賽裏,聊天機器人也絕不隻有這兩家Claude、Copilot、Grok、DeepSeek、Llama、Perplexity很多都站在 Google 最大、最有錢的競爭對手那一邊(或者像 Claude 一樣,幹脆由 Google 自己投資)。整個行業不僅僅是 Google都被同一個難題困住:這些生成式 AI 係統已經燒掉了數十億美元的投資,還耗費了巨量能源能源需求高到可能延長了一些服役數十年的燃煤電廠和核電站的生命。公司們堅稱效率正在一點一點提高,他們也指望不斷降低錯誤率,讓更多用戶願意真正依賴這些產品。但到目前為止,沒有人真正找到可以可靠賺錢、又不拖累氣候的解法。

在這一點上,Google 還麵臨一個競爭對手所沒有的特殊挑戰:據摩根大通分析師 Doug Anmuth 估計,未來幾年,最多可能有四分之一的搜索廣告收入會因反壟斷判決而流失。填補這個大窟窿的壓力,在公司內部人人都能感受到。Hsiao 的 Gemini 團隊裏,有人已經連續三個冬天都在假期加班,隻為不在這場競速裏掉隊。據報道,Google 聯合創始人 Brin 上個月對一些員工說,每周 60 小時工作時間是贏下這場愈演愈烈的 AI 競賽的甜蜜點。許多接受《WIRED》采訪的現任和前員工都坦承,對於更多裁員、更多過勞、更多法律糾紛的恐懼,如今仍深深纏繞在公司內部。

AGI、Agent 與未來風險:競速還在繼續

一位 Google 研究員和一位高層同事說,彌漫全公司的主旋律其實是不安。生成式 AI 顯然很有用。那些一向樂於監管科技巨頭的政府,比如法國,如今也在慢慢擁抱這項技術的宏大承諾。在 Google DeepMind 內部,以及在公開演講中,Hassabis 對通用人工智能(AGI)的目標從未退讓半步那是一種能在各類任務上具有人類水平認知能力的係統。他有時會在周末帶著 Astra 的原型機,一邊在倫敦閑逛,一邊體驗那個可能到來的未來:全世界的物理環境,從泰晤士河上的一隻小鴨子,到街邊一座喬治亞風格的老宅,都可以被搜索。但要實現 AGI,就必須讓係統在推理、規劃和主動掌控方麵更進一步。

今年 1 月,OpenAI 又朝這個方向邁出一步,向公眾開放了另一個實驗:期待已久的 Operator 服務,一種所謂的Agent 化 AI,能在聊天框之外主動行動。Operator 可以像真人一樣,用鼠標點擊、鍵盤輸入,在各類網站上執行任務,比如訂機票、填表格。目前,它執行任務的速度和果斷程度都遠遜於人類,而且因為不夠可靠,使用成本也很高(它被打包在每月 200 美元的訂閱計劃裏)。自然,Google 也在努力為未來的模型加入 Agent 能力。現在的 Gemini 可以幫你製定一周的飲食計劃;下一代模型,可能會順手把所有食材丟進你的線上購物車;再往後,它也許會在你切洋蔥的時候,實時給你一點刀工反饋。

一如既往,跑得快,也就意味著摔跟頭的次數可能更多。今年 1 月底,在超級碗開賽前,Google 發布了一支 Gemini 廣告,結果被抓到一個甚至比 Bard 望遠鏡更離譜的錯誤:Gemini 估算全世界吃掉的奶酪裏,有一半甚至更多是高達奶酪。隨著 Gemini 從一個有時靠譜的事實機器,迅速演變為人類日常生活的親密角色生活教練、全知助手Pichai 反複強調 Google 會謹慎前行。但在好不容易重新回到領跑位置之後,他和其他高管也很清楚,他們再也不想被人從後麵偷襲。這場競賽,還遠沒有到終點。

[ 打印 ]
評論
目前還沒有任何評論
登錄後才可評論.