簡體 | 繁體
loading...
新聞頻道
  • 首頁
  • 新聞
  • 讀圖
  • 財經
  • 教育
  • 家居
  • 健康
  • 美食
  • 時尚
  • 旅遊
  • 影視
  • 博客
  • 群吧
  • 論壇
  • 電台
  • 焦點新聞
  • 圖片新聞
  • 視頻新聞
  • 生活百態
  • 娛樂新聞
您的位置: 文學城 » 新聞 » 焦點新聞 » 在OpenAI工作,是一種怎樣的體驗?

在OpenAI工作,是一種怎樣的體驗?

文章來源: 華爾街見聞 於 2025-07-16 09:15:20 - 新聞取自各大新聞媒體,新聞內容並不代表本網立場!
被閱讀次數

三周前離職的OpenAI前工程師Calvin French-Owen分享了在公司工作一年的真實體驗。他見證了OpenAI從1000人瘋狂擴張到3000人,這種快速增長帶來管理混亂、代碼質量參差不齊等問題。但公司仍保持濃厚創業氛圍,他的團隊僅用七周就開發出代碼助手Codex。關於AI安全爭議,他澄清公司更關注實際威脅而非理論風險,並未忽視安全問題。

科技媒體TechCrunch近日報道了一篇引人注目的博客文章,作者是三周前剛從OpenAI離職的工程師Calvin French-Owen。這位曾參與開發OpenAI最具前景新產品之一的工程師,在公司工作一年後選擇離開,並公開分享了他在這家AI巨頭內部的真實工作體驗。

French-Owen曾是客戶數據初創公司Segment的聯合創始人,該公司在2020年被Twilio以32億美元收購。三周前,這位參與開發OpenAI最具前景新產品之一的工程師選擇從公司離職,隨後在個人博客上分享了他在OpenAI工作一年的深度觀察。

他強調自己離開OpenAI並非因為任何"戲劇性事件",而是希望重新回到創業者的角色。他在博客中坦言,選擇離開是為了追求自己的創業夢想,而非對公司文化的不滿。

這篇博客文章揭露了許多OpenAI內部運作的細節,從瘋狂的產品開發節奏到公司文化的獨特之處。French-Owen特別詳細描述了團隊如何在七周內從零開始構建並發布代碼助手Codex的經曆,這款產品直接與Cursor和Anthropic的Claude Code等工具競爭。

他的觀察既證實了外界對OpenAI的一些認知,也糾正了不少誤解。從公司的快速擴張到內部管理挑戰,從產品發布的魔力時刻到外界監督的壓力,French-Owen的分享為外界提供了難得的內部視角。

瘋狂擴張:從千人到三千人的蛻變

OpenAI的增長速度可以用"瘋狂"來形容。French-Owen透露,在他工作的一年時間裏,"OpenAI從1000人增長到了3000人"。這樣的擴張速度在科技行業也屬罕見。

這種快速擴張並非沒有原因。ChatGPT被公認為史上增長最快的消費產品,今年3月公司宣布其月活躍用戶已超過5億,並且還在快速攀升。麵對激烈的市場競爭,各大AI公司都在加速招聘優秀人才,OpenAI自然不能落後。

然而,如此快速的人員增長也帶來了顯而易見的挑戰。正如French-Owen所觀察到的,當公司規模迅速擴大時,原有的管理體係往往跟不上節奏,各種問題開始暴露出來。

成長的煩惱:混亂中尋找秩序

快速擴張的代價很快顯現出來。French-Owen直言不諱地指出:

"當你擴張得如此之快時,一切都會出問題:公司內部如何溝通、匯報結構、如何發布產品、如何管理和組織人員、招聘流程等等。"

在這種環境下,OpenAI仍然保持著小型初創公司的文化特色——員工可以相對自由地實施自己的想法,幾乎沒有繁文縟節的束縛。但這種自由也帶來了負麵效應,多個團隊經常在做重複性工作。French-Owen舉例說:"我見過至少六個用於隊列管理或代理循環的代碼庫。"

技術層麵的挑戰同樣明顯。公司內部的編程水平參差不齊,既有來自穀歌的資深工程師,他們能編寫支持十億用戶的代碼,也有剛畢業的博士生,缺乏實際編程經驗。再加上Python語言的靈活性,導致公司的核心代碼庫"有點像個垃圾場"。French-Owen坦承,係統經常出現故障或運行緩慢,不過高級工程管理層已經意識到這些問題,正在積極尋求改進方案。

創業精神:七周打造Codex的奇跡

盡管麵臨各種挑戰,OpenAI仍然保持著濃厚的創業氛圍。French-Owen觀察到,這家公司"似乎還沒有意識到自己已經是一家巨型公司",從完全依賴Slack進行溝通就能看出這一點。他將公司的文化比作早期Facebook時代的Meta,充滿了"快速行動,打破常規"的精神。

這種創業精神的最佳體現,就是Codex項目的開發過程。這款與Cursor和Anthropic's Claude Code競爭的編碼工具,竟然隻用了七周時間就從構思走向發布。

French-Owen回憶說,他的高級團隊包括大約8名工程師、4名研究人員、2名設計師、2名市場推廣人員和1名產品經理,整個團隊幾乎沒怎麽睡覺就完成了這個項目。

產品上線後的表現更是令人驚喜。French-Owen感慨道:

"我從未見過一個產品僅僅因為出現在左側邊欄就能獲得如此多的用戶,但這就是ChatGPT的力量。"

這種即時的用戶增長,讓團隊的辛苦付出得到了最好的回報。

透明與保密的矛盾:在聚光燈下工作

作為全球最受關注的AI公司,OpenAI處在一個相當特殊的位置。一方麵,公司高度重視保密工作,試圖控製信息泄露;另一方麵,外界對公司的一舉一動都極為關注。

French-Owen描述了這種"玻璃屋"效應:"ChatGPT是一家備受審視的公司。這導致了一種保密文化,試圖控製向公眾的信息泄露。"

同時,公司也密切關注社交媒體上的動態,特別是X平台。如果某個帖子在那裏走紅,OpenAI會看到並可能做出回應。正如French-Owen引用朋友的話:"這家公司靠Twitter情緒運營。"

這種對社交媒體動態的高度關注,反映了公司對公眾輿論的重視程度。這種外界壓力不僅來自普通用戶和媒體,還包括政府和競爭對手的密切關注。

各國政府都在監督OpenAI的發展,競爭對手也在密切觀察其動向,而OpenAI同樣在觀察競爭對手。French-Owen總結道:"感覺風險真的很高。"

這種矛盾的狀態反映了OpenAI麵臨的獨特挑戰——既要保持技術領先地位,又要應對公眾監督;既要快速創新,又要承擔相應的社會責任。

在這樣的環境下工作,員工們不僅要麵對技術挑戰,還要適應高度透明的工作環境。

安全爭議:理論與實踐的平衡

外界對OpenAI最大的爭議之一就是其在AI安全方麵的態度。許多AI安全專家,包括一些前OpenAI員工,都批評過公司的安全流程。對此,French-Owen提供了內部視角的澄清。

他指出,外界對OpenAI"不夠重視安全"的看法是最大的誤解。雖然確實有"末日論者"在擔心理論上的人類風險,但公司內部更多關注的是實際安全問題,"比如仇恨言論、濫用、操縱政治偏見、製造生物武器、自我傷害、提示注入"等具體威脅。

French-Owen強調,OpenAI並沒有忽視長期潛在影響。公司有研究人員專門研究這些問題,並且清楚地意識到數億人正在使用其大語言模型尋求從醫療建議到心理治療的各種幫助。

未來展望:在變革中尋找方向

從French-Owen的描述來看,OpenAI正處在一個關鍵轉折點。公司需要在保持創新速度和初創精神的同時,解決快速擴張帶來的管理和技術債務問題。如何在數千名員工的規模下仍能保持高效決策和產品迭代,將是公司麵臨的核心挑戰。

技術層麵的改進已經在進行中。French-Owen提到,頂級工程管理層已經意識到代碼質量和係統穩定性問題,正在著手改善。但這種改進需要時間,也需要在不影響創新速度的前提下進行。

以下為AI翻譯的前OpenAI工程師Calvin French-Owen博客全文:

關於在OpenAI工作的思考

我在三周前離開了OpenAI。我是在2024年5月加入這家公司的。

我想分享我的思考,因為大家對OpenAI做了很多猜測,但很少有人有在那裏的第一手文化體驗。

Nabeel Quereshi有一篇很棒的文章,叫《對Palantir的反思》,他回顧了是什麽讓Palantir如此特別。我也想做同樣的事,趁記憶還新,為OpenAI留個注記。這裏沒有任何商業機密,隻是對當下這家最具吸引力的組織之一,在極具意義時刻,工作體驗的個人觀察。

首先要說的是:我離職並非因任何人事糾紛,恰好我對離開感到深深矛盾。從創立自己的組織,變成一家有三千名員工公司的職員,這種身份的轉換很難。現在我渴望一次全新的開始。

我也許會被那裏的工作所吸引,回去也說不定。畢竟想象一下有機會參與AGI的建設是不現實的,而大語言模型無疑是近十年以來的技術創新。我很慶幸能親眼見證一些發展,同時也參與了Codex的發布。

顯然,這些並非公司的官方立場——隻是我個人的觀察。OpenAI是一個大機構,我隻能從我的“小窗口”提供這些見聞。

文化

首先要知道的是,OpenAI擴展得極快。我加入時,公司剛剛超過1000人。但一年後已經超過3000人,而我在員工任職時間排名位列前30%。幾乎所有領導層在2–3年前都還不是在做現在這份工作。

顯然,快速擴張會帶來問題:如何在公司層麵溝通,組織架構如何設定,如何推進產品發布,如何管理和組織人力,以及如何招聘等。不同團隊的文化情況也差別巨大:有些團隊持續高壓快跑,有些在監控已有項目,有些保持更穩定的節奏。沒有所謂的“OpenAI體驗”,研究團隊、應用團隊、GTM(市場/銷售)節奏都完全不同。

OpenAI有個特殊之處——一切都通過 Slack(一個用於工作溝通交流的平台) 運行,沒有電子郵件。我整個任期或許隻收到過10封郵件左右。如果你不善於整理,很容易被這些渠道淹沒,但如果你管理好渠道和通知,也能做得井然有序。

OpenAI鼓勵“自下而上”,尤其在研究領域尤為明顯。我剛加入時,問第一季度的路線圖在哪,得到的回答是:“不存在。”(不過現在已經有了。)好主意可能來源任何人,通常我們並不清楚哪些想法會提前證明是最有成效的;公司不靠宏大的“總體計劃”,進展往往迭代並在新的研究結果基礎上逐步展開。

這種自下而上的文化也讓OpenAI極具“重績效主義(meritocratic)”性質。曆史上,公司裏的領導者大多是因擁有好點子並能執行而晉升。許多非常優秀的人,不擅長全體大會發言或政治運作,但在OpenAI他們一樣能脫穎而出。好點子通常可以勝出。

OpenAI的文化喜歡快速行動(bias to action)。在類似方向有多個團隊同時試點並不少見。我剛加入時曾同時見到大概3–4種Codex相關原型,最後才決定上線。它們通常由少數人自發發起,不需要特別審批;當看到希望時,團隊就自發聚攏。

Codex 負責人Andrey曾說,你應該將研究員視為“迷你董事會”。在那裏,你可以全盤推進自己的方向,看它能走多遠。相應地,如果某個問題被認為“無意思”或者“已解決”,它可能根本不會有人去關注。

優秀的研究經理作用極大,但也都有限。他們擅長將不同方向的研究串聯起來,將其匯聚到大規模模型訓練裏。同樣,出色的產品經理也能串起價值點,將力量聚合。

我合作過的ChatGPT的工程經理(EM)Akshay、Rizzo、Sulman,是我見過最Cool的“客戶”。他們經驗非常豐富。他們多為管理型角色,主要職責是招聘優秀人才並為他們提供成功支持。

OpenAI會瞬間調整方向。這點我們在Segment(原公司)也很喜歡——有新情況就改變方向,比為了“計劃”一直推進要好得多。令人驚奇的是,OpenAI這麽大的公司還保留著這種思維方式——Google顯然不是這樣。公司決策快速,一旦決定了努力的方向,就全力奔跑。

媒體上對OpenAI有很多抨擊。我來自B2B企業背景,對此很震驚:內部還未宣布的功能,新聞稿已經播出;我告訴別人我在OpenAI工作,往往就聽到對它的既有偏見。有一些 Twitter 賬號用自動化機器人監測功能上線情況。

因此,OpenAI非常保密。我無法詳細告訴任何人我在做什麽。公司內部有不同的工作空間和不同權限。營收、燒錢數據都高度保密。

OpenAI也比你想象中更“嚴肅”,因為風險非常高。一方麵要構建 AGI,需要把一切都做對;另一方麵產品已有數以億計用戶在用於醫療建議、心理療愈等敏感場景;再者,OpenAI處在與 Meta、Google、Anthropic 的激烈競爭中,甚至全球政府都密切關注這個領域。

盡管媒體有抨擊,但我見的每個人都是真心“想把事情做好”。作為一家消費者導向的公司,曝光最大,也最易成為輿論焦點。

當然,不應把 OpenAI 視作一個整體統一的“單一實體”。我更像把它當成“洛斯阿拉莫斯”式的組織——一群科學家在探索最前沿。巧合的是,他們也造出了曆史上最火爆的消費者 App。之後開始擴展到政府和 企業服務。公司裏人來的時間不同、所處團隊不同,目標也不同——想法迥異。時間越久的人,越會帶著“研究實驗室”或“公益非營利”視角去看。

我最欣賞的一點是公司“說到做到”地讓 AI 利益大眾化。最先進的模型沒有鎖定在某個企業合同中。世界上任何人都可以訪問 ChatGPT,哪怕未登錄。可以注冊 API 使用 —— 大多數模型(即使是 SOTA 或專有模型)會迅速加入 API 服務,讓創業公司、開發者都用得上。你可以猜測會有截然不同的企業版本策略,但 OpenAI 並沒有走那條路,值得讚賞,這一點仍是公司文化核心。

安全問題的關注比你在 Zvi 或 LessWrong (社區論壇,專注於討論認知偏見等)裏看到的還要多。公司有大量人手致力開發安全係統。但現實中更關注的是實用風險——仇恨言論濫用、政治操縱、研發生物武器、自我傷害誘導、及時藥物注入等——遠比理論上爆炸性風險更受關注。當然仍有人研究理論風險,那也是存在的。但在我看來,實用安全才是主流,很多安全內容不公開發表,OpenAI 其實還應該更多公開這一部分成果。

與很多公司在招聘會發大量 周邊不同,OpenAI 不大送周邊(新員工也基本沒桌牌之類)。取而代之的是會不定期發“drops”,員工可以訂購庫存。第一次 drop 店鋪就被刷爆了,連 Shopify 都掛了。有一個內部的帖子流傳如何POST正確的json(基於JavaScript語言的輕量級的數據交換格式,即JavaScript Object Notation)有效負載和規避這一點。

所有事情與 GPU 成本相比都太小。舉例:Codex 中一個細小功能的 GPU 資源消耗,就相當於我們整個 Segment 基礎設施的費用(雖然 ChatGPT 規模更大,但平台體量也大)。

OpenAI 是我見過的最雄心勃勃的組織。你大概會以為擁有一個全球頭部 App 就夠了,但他們誌在多場戰役:API 產品、深度研究、硬件、編程代理、圖像生成等等(還有很多未公開項目)。這裏是個讓點子落地彈射的平台。

公司非常關注 Twitter上的氛圍。如果你發的一條與 OpenAI 相關的 tweet 爆火,很可能有人會看到並重視。一位朋友曾說:“這家公司靠 Twitter情緒運行。”對於一個消費級公司來說,這點也沒毛病。當然他們也有用戶增長、留存等分析,但情緒倒也很重要。

OpenAI 裏的團隊比很多地方更 fluid、更靈活。在 Codex 發布時,我們需要幾個 ChatGPT 的工程師來趕進度。於是我們找 ChatGPT 的 產品經理提需求,第二天就來了兩位牛人,不需要等季度計劃或重新分配資源。動作快得驚人。

高層領導很活躍,好像沒一位是“掛名”——gdb(Greg Brockman)、sama(Sam Altman)、kw(Wojciech Zaremba)、Mark、Dane 等經常在 Slack 上互動。

代碼與基礎設施

OpenAI 使用巨大的 monorepo(單一代碼倉庫:一種將多個項目或代碼庫存儲在同一個版本控製係統中的策略,以便於跨項目協作和代碼共享),以 Python 為主(但也有 Rust 服務,和少量 Golang 用於網絡代理等)。這導致代碼風格多樣:既有來自 Google 資深工程師設計的大型庫,也有博士剛畢業寫的 Jupyter notebook。所有後端基本都是 FastAPI + Pydantic 構建 API,而且沒有統一強製的風格指南。

OpenAI 完全在 Azure 上運行。好玩的是,能真正信任的隻有三項服務:Azure Kubernetes Service、CosmosDB、BlobStore。沒有 Dynamo、Spanner、BigQuery、Kinesis 等 AWS 工具,也少有自動擴展設計。IAM 機製也較弱,於是很多機製選擇自研。

從工程人才看,有大量來自 Meta → OpenAI 的背景。在很多方麵,OpenAI 早期就像 Meta:一款轟動一時的消費者應用軟件、新興的基礎設施、行動快。大多基礎設施人才來自 Meta+Instagram,水準很強。

把這些東西放在一起,你會看到很多基礎設施的核心部分讓人想起Meta,你會看到很多 Meta 風格的設計:內部重寫的 TAO、邊緣統一身份認證等等。我相信還有很多我不知道的。

聊天功能深入係統。從 ChatGPT 起,許多代碼庫都是圍繞聊天消息和對話的思想構建的。這些源語內嵌得很深,不注意就會踩坑。Codex 雖有些變體(基於響應式 API),但仍複用很多原先框架。

OpenAI 強調實幹:沒有架構委員會決策,通常誰做誰決定。這帶來行動快的優勢,但也常導致代碼庫裏存在多個類似功能庫。我見過很多庫,比如隊列管理或代理循環。

在缺乏工具支持的快速擴張團隊裏,問題也會產生:比如Sa-server(後端整體)有點像垃圾場。在master上,CI崩潰的頻率比您想象的要高得多。即使是並行運行的測試用例,考慮依賴關係的子集,在gpu上運行也需要大約30分鍾的時間。這些並不是無法解決的問題,但它提醒我們,這類問題無處不在,而且當你快速擴展時,它們可能會變得更糟。好在內部已有大量精力投入改進。

其他經驗

了解什麽叫“大消費者品牌”。Codex 推出時我才意識到這一點。這裏的 KPI 是“專業用戶”;即便是 Codex,會側重用戶個人使用情況上指標,而非團隊協作。對於我這種 B2B 背景的人來說,這種風格很不一樣:你轉動個開關,流量就來了。

大型模型訓練機製(高層次)。這種流程從“實驗小型原型”到“擴容實跑”再到“疑難調試”一直延續。實驗時不僅調模型結構,也會調訓練數據混合;訓練變大後更像分布式係統工程,需要調邊緣案例(僅在極端(最大或最小)操作參數或其他異常操作條件下發生的問題或情況)。

GPU 數學基礎。作為Codex發布的一部分,我們必須預測負載能力需求,這是我第一次真正對gpu進行基準測試。要從延遲、token 數、time-to-first-token著手往下推硬件能力,而不是簡單問 GPU能跑多少 FLOPS 。每個模型版本的性能負載差異很大,需要重測。

在大型 Python 代碼庫中協作。Segment是兩個微服務的組合,主要是Golang和Typescript,我們沒有OpenAI那樣的代碼廣度。而在 OpenAI,我學到了很多關於如何根據貢獻代碼的開發人員的數量來擴展代碼庫的知識。你必須設置更多的護欄,比如“默認工作”、“保持主界麵清潔”和“難以誤用”。

發布 Codex

過去三個月裏,我參與的最大項目是 Codex 的發布。毫無疑問是我職業生涯中的亮點。

說下背景:在2024年11月,公司設下目標——2025年推出編程助手。到2025年2月,我們已有數個內部工具使用模型效果不錯。壓力來了——確實模型對編碼已具生產力(你看到市場上大量生成 vibe-code 工具)。

我提前休完陪產假回來,幫助這次發布。一周後,我們混並了兩個團隊,開啟加速衝刺。從寫第一行代碼到上線,僅用了7周。

Codex 衝刺是我十年職業生涯中最拚的一次。幾乎每晚工作到11點或更晚。早上5:30被新生兒叫醒,7點去辦公室,幾個周末也在辦公室。大家周周爭分奪秒,很像當年YC創業節奏。

這種節奏真難形容。我從沒見過哪家隻花7周就從想法到完全發布並開放給所有人的產品。我們構建了一個容器運行時,對repo下載進行了優化,對自定義模型進行了微調以處理代碼編輯,處理了各種git操作,引入了一個全新的界麵,啟用了Internet訪問,最終得到了一個使用起來令人愉悅的產品。那感覺,真心太爽了。

無論別人怎麽說,OpenAI 依然保有那種創業精神(launch spirit)。

幸運的是,隻要給對的人,就能創造奇跡。我們是一個由8名工程師,4名研究人員,2名設計師,2名市場推廣和1名產品經理組成的高級團隊。如果我們沒有這個團隊,我想我們會失敗的。沒有人需要太多的指導,但我們確實需要相當數量的協調。如果有機會和Codex團隊合作,你就知道他們有多強。

發布前夜,五個人熬夜到淩晨4點布署主單體(部署耗時數小時);然後回到辦公室,參加8點的發布會和直播。打開功能開關,瞬間流量來了。我從沒見過哪個產品上線後憑借側邊欄(Sidebar)就有這麽爆發式流量——ChatGPT的力量非常顯著。

在產品形態上,我們選擇了全異步形式。與當時的 Cursor(現在也支持後端異步模式)或 Claude Code 不同,我們希望用戶把任務發給代理,就像給同事發PR(拉取請求);它會自動執行,完成後返回PR。

這是個賭注:當時模型仍“好但不完美”。它能工作幾分鍾,但還做不了幾個小時。用戶對模型能力信任度參差不齊。而且到底模型真正能力在哪也還不很明朗。

我相信從長遠看,大多數編程會更像 Codex 這種形式。但與此同時,等著看各種產品如何演化會很有趣。

Codex 在大型代碼庫中導航、任務管理能力特別突出。相比其它工具,我見過最大區別是它能並行觸發多個 task,然後比對他們輸出。

我最近看到公共數據顯示不同大模型代理製作 PR 的數據量。Codex 已生成 63 萬個 PR。53 天內,對外公開的 PR 達 7.8 萬個/工程師;私有 PR 多則更多。我人生都沒做過這麽有影響力的事情。

告別感言

坦白說,我最初對加入OpenAI很擔憂。不確定放棄自由、擁有老板、融入大廠是否合適。我低調告訴朋友我加入了OpenAI,生怕不適合就尷尬了。

我希望這次經曆能讓我:

構建對模型訓練機製及未來能力變化的直覺

與優秀的同事一起工作並學習

推出一個偉大的產品

回顧這一年,我覺得這可能是我做過的最正確的選擇。難以想象哪能比這裏學得更多。

如果你是創始人,覺得自己創業沒前景了,該深度評估是不是放棄機會打多幾次仗,要麽去加入大實驗室。現在是創造的黃金時刻,也是窺見未來方向的絕佳窗口。

我認為 AGI 的競爭有三匹馬:OpenAI、Anthropic 和 Google。他們會根據各自 DNA(消費導向 vs 商業優先 vs 基礎架構和數據驅動)走出不同路徑。在其中工作將是開眼界。

感謝 Leah 在深夜支持我,承擔大部分育兒任務。感謝 PW、GDB、Rizzo 給我機會。感謝 SA teammates 教會我很多:Andrew, Anup, Bill, Kwaz, Ming, Simon, Tony, Val。感謝 Codex 核心團隊:Albin, AE, Andrey, Bryan, Channing, DavidK, Gabe, Gladstone, Hanson, Joey, Josh, Katy, KevinT, Max, Sabrina, SQ, Tibo, TZ, Will。這趟旅程我永生難忘。

查看評論(0)

24小時熱點排行

宗慶後杜建英合影曝光 女方主動又熱情 看對方眼神…
中國學生湧入伊利諾伊“玉米地”,中餐也“火”了
馬斯克推出二次元“AI女友”,月費30美元
全球民調曝"對中國改觀",美國好感度僅剩35%
宗馥莉的媽媽 才是狠人 以柔克剛 有容乃大

24小時討論排行

中國好感度反超,美國全球民調出現“逆轉”
美女議員AOC稱川普是“強奸犯” 白宮官員:可悲可憐
知情人士:宗慶後不止四孩 顧慮公眾形象未入家譜
宗馥莉叔叔批她自私:要那麽多錢幹麽 天堂又不能用
有損國格!一切西方偽史論 本質都是辱華的高級黑
國會推"尊嚴法案" 非法移民交$7000 可申請永久身份
消息人士:特朗普對俄變臉,普京“並不畏懼”
華裔夫婦瘋狂代孕案中案:保姆涉虐童遭FBI通緝
巴西咖啡恐大漲!業者搶50%關稅前加速向美國運貨
別被川普“臨陣軟腳”騙了 他要的就是關稅!越高越好…
全美炸鍋!華裔夫婦找代孕瘋狂生21娃 被剝奪監護權
iPhone稀土不靠中國!蘋果砸5億建立美國供應鏈
川普健康又“出事”?神秘瘀青曝光 白宮急回應!
泰國高僧史詩級性醜聞:8萬張照片 5600段視頻
卡爾森率領憂心忡忡的MAGA鬥士們 質疑特朗普
特朗普向普京發出最後通牒,烏克蘭人卻感到難抱期望
  • 文學城簡介
  • 廣告服務
  • 聯係我們
  • 招聘信息
  • 注冊筆名
  • 申請版主
  • 收藏文學城

WENXUECITY.COM does not represent or guarantee the truthfulness, accuracy, or reliability of any of communications posted by other users.

Copyright ©1998-2025 wenxuecity.com All rights reserved. Privacy Statement & Terms of Use & User Privacy Protection Policy

文學城新聞
切換到網頁版

在OpenAI工作,是一種怎樣的體驗?

華爾街見聞 2025-07-16 09:15:20

三周前離職的OpenAI前工程師Calvin French-Owen分享了在公司工作一年的真實體驗。他見證了OpenAI從1000人瘋狂擴張到3000人,這種快速增長帶來管理混亂、代碼質量參差不齊等問題。但公司仍保持濃厚創業氛圍,他的團隊僅用七周就開發出代碼助手Codex。關於AI安全爭議,他澄清公司更關注實際威脅而非理論風險,並未忽視安全問題。

科技媒體TechCrunch近日報道了一篇引人注目的博客文章,作者是三周前剛從OpenAI離職的工程師Calvin French-Owen。這位曾參與開發OpenAI最具前景新產品之一的工程師,在公司工作一年後選擇離開,並公開分享了他在這家AI巨頭內部的真實工作體驗。

French-Owen曾是客戶數據初創公司Segment的聯合創始人,該公司在2020年被Twilio以32億美元收購。三周前,這位參與開發OpenAI最具前景新產品之一的工程師選擇從公司離職,隨後在個人博客上分享了他在OpenAI工作一年的深度觀察。

他強調自己離開OpenAI並非因為任何"戲劇性事件",而是希望重新回到創業者的角色。他在博客中坦言,選擇離開是為了追求自己的創業夢想,而非對公司文化的不滿。

這篇博客文章揭露了許多OpenAI內部運作的細節,從瘋狂的產品開發節奏到公司文化的獨特之處。French-Owen特別詳細描述了團隊如何在七周內從零開始構建並發布代碼助手Codex的經曆,這款產品直接與Cursor和Anthropic的Claude Code等工具競爭。

他的觀察既證實了外界對OpenAI的一些認知,也糾正了不少誤解。從公司的快速擴張到內部管理挑戰,從產品發布的魔力時刻到外界監督的壓力,French-Owen的分享為外界提供了難得的內部視角。

瘋狂擴張:從千人到三千人的蛻變

OpenAI的增長速度可以用"瘋狂"來形容。French-Owen透露,在他工作的一年時間裏,"OpenAI從1000人增長到了3000人"。這樣的擴張速度在科技行業也屬罕見。

這種快速擴張並非沒有原因。ChatGPT被公認為史上增長最快的消費產品,今年3月公司宣布其月活躍用戶已超過5億,並且還在快速攀升。麵對激烈的市場競爭,各大AI公司都在加速招聘優秀人才,OpenAI自然不能落後。

然而,如此快速的人員增長也帶來了顯而易見的挑戰。正如French-Owen所觀察到的,當公司規模迅速擴大時,原有的管理體係往往跟不上節奏,各種問題開始暴露出來。

成長的煩惱:混亂中尋找秩序

快速擴張的代價很快顯現出來。French-Owen直言不諱地指出:

"當你擴張得如此之快時,一切都會出問題:公司內部如何溝通、匯報結構、如何發布產品、如何管理和組織人員、招聘流程等等。"

在這種環境下,OpenAI仍然保持著小型初創公司的文化特色——員工可以相對自由地實施自己的想法,幾乎沒有繁文縟節的束縛。但這種自由也帶來了負麵效應,多個團隊經常在做重複性工作。French-Owen舉例說:"我見過至少六個用於隊列管理或代理循環的代碼庫。"

技術層麵的挑戰同樣明顯。公司內部的編程水平參差不齊,既有來自穀歌的資深工程師,他們能編寫支持十億用戶的代碼,也有剛畢業的博士生,缺乏實際編程經驗。再加上Python語言的靈活性,導致公司的核心代碼庫"有點像個垃圾場"。French-Owen坦承,係統經常出現故障或運行緩慢,不過高級工程管理層已經意識到這些問題,正在積極尋求改進方案。

創業精神:七周打造Codex的奇跡

盡管麵臨各種挑戰,OpenAI仍然保持著濃厚的創業氛圍。French-Owen觀察到,這家公司"似乎還沒有意識到自己已經是一家巨型公司",從完全依賴Slack進行溝通就能看出這一點。他將公司的文化比作早期Facebook時代的Meta,充滿了"快速行動,打破常規"的精神。

這種創業精神的最佳體現,就是Codex項目的開發過程。這款與Cursor和Anthropic's Claude Code競爭的編碼工具,竟然隻用了七周時間就從構思走向發布。

French-Owen回憶說,他的高級團隊包括大約8名工程師、4名研究人員、2名設計師、2名市場推廣人員和1名產品經理,整個團隊幾乎沒怎麽睡覺就完成了這個項目。

產品上線後的表現更是令人驚喜。French-Owen感慨道:

"我從未見過一個產品僅僅因為出現在左側邊欄就能獲得如此多的用戶,但這就是ChatGPT的力量。"

這種即時的用戶增長,讓團隊的辛苦付出得到了最好的回報。

透明與保密的矛盾:在聚光燈下工作

作為全球最受關注的AI公司,OpenAI處在一個相當特殊的位置。一方麵,公司高度重視保密工作,試圖控製信息泄露;另一方麵,外界對公司的一舉一動都極為關注。

French-Owen描述了這種"玻璃屋"效應:"ChatGPT是一家備受審視的公司。這導致了一種保密文化,試圖控製向公眾的信息泄露。"

同時,公司也密切關注社交媒體上的動態,特別是X平台。如果某個帖子在那裏走紅,OpenAI會看到並可能做出回應。正如French-Owen引用朋友的話:"這家公司靠Twitter情緒運營。"

這種對社交媒體動態的高度關注,反映了公司對公眾輿論的重視程度。這種外界壓力不僅來自普通用戶和媒體,還包括政府和競爭對手的密切關注。

各國政府都在監督OpenAI的發展,競爭對手也在密切觀察其動向,而OpenAI同樣在觀察競爭對手。French-Owen總結道:"感覺風險真的很高。"

這種矛盾的狀態反映了OpenAI麵臨的獨特挑戰——既要保持技術領先地位,又要應對公眾監督;既要快速創新,又要承擔相應的社會責任。

在這樣的環境下工作,員工們不僅要麵對技術挑戰,還要適應高度透明的工作環境。

安全爭議:理論與實踐的平衡

外界對OpenAI最大的爭議之一就是其在AI安全方麵的態度。許多AI安全專家,包括一些前OpenAI員工,都批評過公司的安全流程。對此,French-Owen提供了內部視角的澄清。

他指出,外界對OpenAI"不夠重視安全"的看法是最大的誤解。雖然確實有"末日論者"在擔心理論上的人類風險,但公司內部更多關注的是實際安全問題,"比如仇恨言論、濫用、操縱政治偏見、製造生物武器、自我傷害、提示注入"等具體威脅。

French-Owen強調,OpenAI並沒有忽視長期潛在影響。公司有研究人員專門研究這些問題,並且清楚地意識到數億人正在使用其大語言模型尋求從醫療建議到心理治療的各種幫助。

未來展望:在變革中尋找方向

從French-Owen的描述來看,OpenAI正處在一個關鍵轉折點。公司需要在保持創新速度和初創精神的同時,解決快速擴張帶來的管理和技術債務問題。如何在數千名員工的規模下仍能保持高效決策和產品迭代,將是公司麵臨的核心挑戰。

技術層麵的改進已經在進行中。French-Owen提到,頂級工程管理層已經意識到代碼質量和係統穩定性問題,正在著手改善。但這種改進需要時間,也需要在不影響創新速度的前提下進行。

以下為AI翻譯的前OpenAI工程師Calvin French-Owen博客全文:

關於在OpenAI工作的思考

我在三周前離開了OpenAI。我是在2024年5月加入這家公司的。

我想分享我的思考,因為大家對OpenAI做了很多猜測,但很少有人有在那裏的第一手文化體驗。

Nabeel Quereshi有一篇很棒的文章,叫《對Palantir的反思》,他回顧了是什麽讓Palantir如此特別。我也想做同樣的事,趁記憶還新,為OpenAI留個注記。這裏沒有任何商業機密,隻是對當下這家最具吸引力的組織之一,在極具意義時刻,工作體驗的個人觀察。

首先要說的是:我離職並非因任何人事糾紛,恰好我對離開感到深深矛盾。從創立自己的組織,變成一家有三千名員工公司的職員,這種身份的轉換很難。現在我渴望一次全新的開始。

我也許會被那裏的工作所吸引,回去也說不定。畢竟想象一下有機會參與AGI的建設是不現實的,而大語言模型無疑是近十年以來的技術創新。我很慶幸能親眼見證一些發展,同時也參與了Codex的發布。

顯然,這些並非公司的官方立場——隻是我個人的觀察。OpenAI是一個大機構,我隻能從我的“小窗口”提供這些見聞。

文化

首先要知道的是,OpenAI擴展得極快。我加入時,公司剛剛超過1000人。但一年後已經超過3000人,而我在員工任職時間排名位列前30%。幾乎所有領導層在2–3年前都還不是在做現在這份工作。

顯然,快速擴張會帶來問題:如何在公司層麵溝通,組織架構如何設定,如何推進產品發布,如何管理和組織人力,以及如何招聘等。不同團隊的文化情況也差別巨大:有些團隊持續高壓快跑,有些在監控已有項目,有些保持更穩定的節奏。沒有所謂的“OpenAI體驗”,研究團隊、應用團隊、GTM(市場/銷售)節奏都完全不同。

OpenAI有個特殊之處——一切都通過 Slack(一個用於工作溝通交流的平台) 運行,沒有電子郵件。我整個任期或許隻收到過10封郵件左右。如果你不善於整理,很容易被這些渠道淹沒,但如果你管理好渠道和通知,也能做得井然有序。

OpenAI鼓勵“自下而上”,尤其在研究領域尤為明顯。我剛加入時,問第一季度的路線圖在哪,得到的回答是:“不存在。”(不過現在已經有了。)好主意可能來源任何人,通常我們並不清楚哪些想法會提前證明是最有成效的;公司不靠宏大的“總體計劃”,進展往往迭代並在新的研究結果基礎上逐步展開。

這種自下而上的文化也讓OpenAI極具“重績效主義(meritocratic)”性質。曆史上,公司裏的領導者大多是因擁有好點子並能執行而晉升。許多非常優秀的人,不擅長全體大會發言或政治運作,但在OpenAI他們一樣能脫穎而出。好點子通常可以勝出。

OpenAI的文化喜歡快速行動(bias to action)。在類似方向有多個團隊同時試點並不少見。我剛加入時曾同時見到大概3–4種Codex相關原型,最後才決定上線。它們通常由少數人自發發起,不需要特別審批;當看到希望時,團隊就自發聚攏。

Codex 負責人Andrey曾說,你應該將研究員視為“迷你董事會”。在那裏,你可以全盤推進自己的方向,看它能走多遠。相應地,如果某個問題被認為“無意思”或者“已解決”,它可能根本不會有人去關注。

優秀的研究經理作用極大,但也都有限。他們擅長將不同方向的研究串聯起來,將其匯聚到大規模模型訓練裏。同樣,出色的產品經理也能串起價值點,將力量聚合。

我合作過的ChatGPT的工程經理(EM)Akshay、Rizzo、Sulman,是我見過最Cool的“客戶”。他們經驗非常豐富。他們多為管理型角色,主要職責是招聘優秀人才並為他們提供成功支持。

OpenAI會瞬間調整方向。這點我們在Segment(原公司)也很喜歡——有新情況就改變方向,比為了“計劃”一直推進要好得多。令人驚奇的是,OpenAI這麽大的公司還保留著這種思維方式——Google顯然不是這樣。公司決策快速,一旦決定了努力的方向,就全力奔跑。

媒體上對OpenAI有很多抨擊。我來自B2B企業背景,對此很震驚:內部還未宣布的功能,新聞稿已經播出;我告訴別人我在OpenAI工作,往往就聽到對它的既有偏見。有一些 Twitter 賬號用自動化機器人監測功能上線情況。

因此,OpenAI非常保密。我無法詳細告訴任何人我在做什麽。公司內部有不同的工作空間和不同權限。營收、燒錢數據都高度保密。

OpenAI也比你想象中更“嚴肅”,因為風險非常高。一方麵要構建 AGI,需要把一切都做對;另一方麵產品已有數以億計用戶在用於醫療建議、心理療愈等敏感場景;再者,OpenAI處在與 Meta、Google、Anthropic 的激烈競爭中,甚至全球政府都密切關注這個領域。

盡管媒體有抨擊,但我見的每個人都是真心“想把事情做好”。作為一家消費者導向的公司,曝光最大,也最易成為輿論焦點。

當然,不應把 OpenAI 視作一個整體統一的“單一實體”。我更像把它當成“洛斯阿拉莫斯”式的組織——一群科學家在探索最前沿。巧合的是,他們也造出了曆史上最火爆的消費者 App。之後開始擴展到政府和 企業服務。公司裏人來的時間不同、所處團隊不同,目標也不同——想法迥異。時間越久的人,越會帶著“研究實驗室”或“公益非營利”視角去看。

我最欣賞的一點是公司“說到做到”地讓 AI 利益大眾化。最先進的模型沒有鎖定在某個企業合同中。世界上任何人都可以訪問 ChatGPT,哪怕未登錄。可以注冊 API 使用 —— 大多數模型(即使是 SOTA 或專有模型)會迅速加入 API 服務,讓創業公司、開發者都用得上。你可以猜測會有截然不同的企業版本策略,但 OpenAI 並沒有走那條路,值得讚賞,這一點仍是公司文化核心。

安全問題的關注比你在 Zvi 或 LessWrong (社區論壇,專注於討論認知偏見等)裏看到的還要多。公司有大量人手致力開發安全係統。但現實中更關注的是實用風險——仇恨言論濫用、政治操縱、研發生物武器、自我傷害誘導、及時藥物注入等——遠比理論上爆炸性風險更受關注。當然仍有人研究理論風險,那也是存在的。但在我看來,實用安全才是主流,很多安全內容不公開發表,OpenAI 其實還應該更多公開這一部分成果。

與很多公司在招聘會發大量 周邊不同,OpenAI 不大送周邊(新員工也基本沒桌牌之類)。取而代之的是會不定期發“drops”,員工可以訂購庫存。第一次 drop 店鋪就被刷爆了,連 Shopify 都掛了。有一個內部的帖子流傳如何POST正確的json(基於JavaScript語言的輕量級的數據交換格式,即JavaScript Object Notation)有效負載和規避這一點。

所有事情與 GPU 成本相比都太小。舉例:Codex 中一個細小功能的 GPU 資源消耗,就相當於我們整個 Segment 基礎設施的費用(雖然 ChatGPT 規模更大,但平台體量也大)。

OpenAI 是我見過的最雄心勃勃的組織。你大概會以為擁有一個全球頭部 App 就夠了,但他們誌在多場戰役:API 產品、深度研究、硬件、編程代理、圖像生成等等(還有很多未公開項目)。這裏是個讓點子落地彈射的平台。

公司非常關注 Twitter上的氛圍。如果你發的一條與 OpenAI 相關的 tweet 爆火,很可能有人會看到並重視。一位朋友曾說:“這家公司靠 Twitter情緒運行。”對於一個消費級公司來說,這點也沒毛病。當然他們也有用戶增長、留存等分析,但情緒倒也很重要。

OpenAI 裏的團隊比很多地方更 fluid、更靈活。在 Codex 發布時,我們需要幾個 ChatGPT 的工程師來趕進度。於是我們找 ChatGPT 的 產品經理提需求,第二天就來了兩位牛人,不需要等季度計劃或重新分配資源。動作快得驚人。

高層領導很活躍,好像沒一位是“掛名”——gdb(Greg Brockman)、sama(Sam Altman)、kw(Wojciech Zaremba)、Mark、Dane 等經常在 Slack 上互動。

代碼與基礎設施

OpenAI 使用巨大的 monorepo(單一代碼倉庫:一種將多個項目或代碼庫存儲在同一個版本控製係統中的策略,以便於跨項目協作和代碼共享),以 Python 為主(但也有 Rust 服務,和少量 Golang 用於網絡代理等)。這導致代碼風格多樣:既有來自 Google 資深工程師設計的大型庫,也有博士剛畢業寫的 Jupyter notebook。所有後端基本都是 FastAPI + Pydantic 構建 API,而且沒有統一強製的風格指南。

OpenAI 完全在 Azure 上運行。好玩的是,能真正信任的隻有三項服務:Azure Kubernetes Service、CosmosDB、BlobStore。沒有 Dynamo、Spanner、BigQuery、Kinesis 等 AWS 工具,也少有自動擴展設計。IAM 機製也較弱,於是很多機製選擇自研。

從工程人才看,有大量來自 Meta → OpenAI 的背景。在很多方麵,OpenAI 早期就像 Meta:一款轟動一時的消費者應用軟件、新興的基礎設施、行動快。大多基礎設施人才來自 Meta+Instagram,水準很強。

把這些東西放在一起,你會看到很多基礎設施的核心部分讓人想起Meta,你會看到很多 Meta 風格的設計:內部重寫的 TAO、邊緣統一身份認證等等。我相信還有很多我不知道的。

聊天功能深入係統。從 ChatGPT 起,許多代碼庫都是圍繞聊天消息和對話的思想構建的。這些源語內嵌得很深,不注意就會踩坑。Codex 雖有些變體(基於響應式 API),但仍複用很多原先框架。

OpenAI 強調實幹:沒有架構委員會決策,通常誰做誰決定。這帶來行動快的優勢,但也常導致代碼庫裏存在多個類似功能庫。我見過很多庫,比如隊列管理或代理循環。

在缺乏工具支持的快速擴張團隊裏,問題也會產生:比如Sa-server(後端整體)有點像垃圾場。在master上,CI崩潰的頻率比您想象的要高得多。即使是並行運行的測試用例,考慮依賴關係的子集,在gpu上運行也需要大約30分鍾的時間。這些並不是無法解決的問題,但它提醒我們,這類問題無處不在,而且當你快速擴展時,它們可能會變得更糟。好在內部已有大量精力投入改進。

其他經驗

了解什麽叫“大消費者品牌”。Codex 推出時我才意識到這一點。這裏的 KPI 是“專業用戶”;即便是 Codex,會側重用戶個人使用情況上指標,而非團隊協作。對於我這種 B2B 背景的人來說,這種風格很不一樣:你轉動個開關,流量就來了。

大型模型訓練機製(高層次)。這種流程從“實驗小型原型”到“擴容實跑”再到“疑難調試”一直延續。實驗時不僅調模型結構,也會調訓練數據混合;訓練變大後更像分布式係統工程,需要調邊緣案例(僅在極端(最大或最小)操作參數或其他異常操作條件下發生的問題或情況)。

GPU 數學基礎。作為Codex發布的一部分,我們必須預測負載能力需求,這是我第一次真正對gpu進行基準測試。要從延遲、token 數、time-to-first-token著手往下推硬件能力,而不是簡單問 GPU能跑多少 FLOPS 。每個模型版本的性能負載差異很大,需要重測。

在大型 Python 代碼庫中協作。Segment是兩個微服務的組合,主要是Golang和Typescript,我們沒有OpenAI那樣的代碼廣度。而在 OpenAI,我學到了很多關於如何根據貢獻代碼的開發人員的數量來擴展代碼庫的知識。你必須設置更多的護欄,比如“默認工作”、“保持主界麵清潔”和“難以誤用”。

發布 Codex

過去三個月裏,我參與的最大項目是 Codex 的發布。毫無疑問是我職業生涯中的亮點。

說下背景:在2024年11月,公司設下目標——2025年推出編程助手。到2025年2月,我們已有數個內部工具使用模型效果不錯。壓力來了——確實模型對編碼已具生產力(你看到市場上大量生成 vibe-code 工具)。

我提前休完陪產假回來,幫助這次發布。一周後,我們混並了兩個團隊,開啟加速衝刺。從寫第一行代碼到上線,僅用了7周。

Codex 衝刺是我十年職業生涯中最拚的一次。幾乎每晚工作到11點或更晚。早上5:30被新生兒叫醒,7點去辦公室,幾個周末也在辦公室。大家周周爭分奪秒,很像當年YC創業節奏。

這種節奏真難形容。我從沒見過哪家隻花7周就從想法到完全發布並開放給所有人的產品。我們構建了一個容器運行時,對repo下載進行了優化,對自定義模型進行了微調以處理代碼編輯,處理了各種git操作,引入了一個全新的界麵,啟用了Internet訪問,最終得到了一個使用起來令人愉悅的產品。那感覺,真心太爽了。

無論別人怎麽說,OpenAI 依然保有那種創業精神(launch spirit)。

幸運的是,隻要給對的人,就能創造奇跡。我們是一個由8名工程師,4名研究人員,2名設計師,2名市場推廣和1名產品經理組成的高級團隊。如果我們沒有這個團隊,我想我們會失敗的。沒有人需要太多的指導,但我們確實需要相當數量的協調。如果有機會和Codex團隊合作,你就知道他們有多強。

發布前夜,五個人熬夜到淩晨4點布署主單體(部署耗時數小時);然後回到辦公室,參加8點的發布會和直播。打開功能開關,瞬間流量來了。我從沒見過哪個產品上線後憑借側邊欄(Sidebar)就有這麽爆發式流量——ChatGPT的力量非常顯著。

在產品形態上,我們選擇了全異步形式。與當時的 Cursor(現在也支持後端異步模式)或 Claude Code 不同,我們希望用戶把任務發給代理,就像給同事發PR(拉取請求);它會自動執行,完成後返回PR。

這是個賭注:當時模型仍“好但不完美”。它能工作幾分鍾,但還做不了幾個小時。用戶對模型能力信任度參差不齊。而且到底模型真正能力在哪也還不很明朗。

我相信從長遠看,大多數編程會更像 Codex 這種形式。但與此同時,等著看各種產品如何演化會很有趣。

Codex 在大型代碼庫中導航、任務管理能力特別突出。相比其它工具,我見過最大區別是它能並行觸發多個 task,然後比對他們輸出。

我最近看到公共數據顯示不同大模型代理製作 PR 的數據量。Codex 已生成 63 萬個 PR。53 天內,對外公開的 PR 達 7.8 萬個/工程師;私有 PR 多則更多。我人生都沒做過這麽有影響力的事情。

告別感言

坦白說,我最初對加入OpenAI很擔憂。不確定放棄自由、擁有老板、融入大廠是否合適。我低調告訴朋友我加入了OpenAI,生怕不適合就尷尬了。

我希望這次經曆能讓我:

構建對模型訓練機製及未來能力變化的直覺

與優秀的同事一起工作並學習

推出一個偉大的產品

回顧這一年,我覺得這可能是我做過的最正確的選擇。難以想象哪能比這裏學得更多。

如果你是創始人,覺得自己創業沒前景了,該深度評估是不是放棄機會打多幾次仗,要麽去加入大實驗室。現在是創造的黃金時刻,也是窺見未來方向的絕佳窗口。

我認為 AGI 的競爭有三匹馬:OpenAI、Anthropic 和 Google。他們會根據各自 DNA(消費導向 vs 商業優先 vs 基礎架構和數據驅動)走出不同路徑。在其中工作將是開眼界。

感謝 Leah 在深夜支持我,承擔大部分育兒任務。感謝 PW、GDB、Rizzo 給我機會。感謝 SA teammates 教會我很多:Andrew, Anup, Bill, Kwaz, Ming, Simon, Tony, Val。感謝 Codex 核心團隊:Albin, AE, Andrey, Bryan, Channing, DavidK, Gabe, Gladstone, Hanson, Joey, Josh, Katy, KevinT, Max, Sabrina, SQ, Tibo, TZ, Will。這趟旅程我永生難忘。