當地時間6月18日,OpenAI推出首期官方播客節目,由前工程師安德魯·梅恩主持,公司首席執行官山姆·奧特曼作為首位嘉賓出席。梅恩在開場中介紹,這檔播客旨在為聽眾揭開OpenAI的研發內幕,他本人曾在該公司擔任工程師和科學傳播者,如今專注於幫助企業整合人工智能技術。
在長達約40分鍾的對話中,奧特曼透露了多項關鍵信息。他談到GPT-5已進入最後開發階段,最快可能將於夏季發布,也談到了高性能的o3模型以及智能體Deep Research,以及這些產品對實現AGI的重要性。
對通用人工智能(AGI)發展的最新思考。奧特曼特別指出,隨著技術進步,越來越多人開始相信AGI已經實現。
奧特曼還詳細介紹了公司正推進的“星際之門”——耗資千億美元的算力基礎設施項目,並曝光埃隆·馬斯克(Elon Musk)曾試圖幹擾星際之門的國際合作。奧特曼指出,他最初並不認為馬斯克會濫用政府權力進行不正當競爭,但現在必須承認當時判斷錯誤。這種行為對國家利益的潛在影響超出預期,值得慶幸的是主管部門堅持原則予以抵製。
對話中,奧特曼還直麵了行業麵臨的現實挑戰,包括隱私保護與數據使用的平衡問題,以及商業化過程中的廣告變現爭議等。梅恩表示,未來節目將繼續邀請OpenAI核心團隊成員,為聽眾帶來更多關於人工智能技術研發與商業化的深度討論。
以下為此次播客節目的精華版內容:
01.ChatGPT在育兒與家庭教育中的探索
梅恩:ChatGPT在育兒中實際幫助如何?
奧特曼:價值極高。育兒初期幾乎時刻依賴,現在主要谘詢發育階段問題,比如行為是否正常,它在專業判斷上優勢明顯。這讓我思考下一代如何使用AI——我一直倡導“多子化”,鼓勵生育。
梅恩:OpenAI很多人都在生育,技術從業者對家庭規劃很樂觀。
奧特曼:這是好事。雖然孩子智力不會超越AI,但會掌握我們沒有的AI協作能力,獲得人類文明新維度。就像嬰兒對著雜誌劃屏幕,新生代會把高階AI當自然存在,我們這個時代將被稱為“前AI時代”。
梅恩:有家長把ChatGPT調成語音模式,孩子跟它聊托馬斯火車聊了一個多小時。
奧特曼:這有潛在風險,比如人機準社會關係的倫理問題,需要新規範。但技術紅利更大,人類總能解決這類問題。
梅恩:教育數據顯示,ChatGPT在專業教學中效果好,但若單純用來做作業,會導致淺層依賴。
奧特曼:互聯網剛普及的時候,我們這代人也被擔心過度依賴搜索。但新生代總能適應技術,現在的問題也會解決。
02.AGI與超級智能的進階路徑
梅恩:你認為五年後,ChatGPT還會是主流產品嗎?
奧特曼:五年後,ChatGPT可能會變成一個完全不同的東西。從某種意義上說,它不會是現在的ChatGPT,但它可能還會叫ChatGPT。
梅恩:你如何定義AGI?
奧特曼:五年前若按軟件認知能力定義AGI,現在的模型已遠超當時標準。模型持續進化,盡管定義不斷升級,但每年都有更多人認為我們在接近AGI。如今係統已能提升生產力、創造經濟價值。或許更有意義的問題是:什麽算超級智能?在我看來,若係統能自主發現新科學,或大幅增強人類科研能力,就接近超級智能的定義,這對世界極有價值。
梅恩:這是個漸進過程。GPT-4內部測試時,我感覺還有十年發展空間。
奧特曼:我堅信人類生活改善的關鍵在科學進步。若AI能加速科學發現,將產生深遠影響,這是我最期待的裏程碑。
梅恩:內部有跡象表明在接近這一目標嗎?
奧特曼:尚未“找到答案”,但我們對研究方向越來越有信心。比如人們用AI寫代碼提升編程效率,進而加速科研——雖非直接創造科學,但確實讓科學家更高效。
03.Operator、Deep Research與生產力
梅恩:我注意到最近OpenAI在Operator中引入了o3模型,我感覺有了很大的改進。
奧特曼:是的,o3的確好多了。很多人告訴我,他們看到Operator使用o3時,感覺AI像是在比較自然地使用電腦,雖然還不完美,但已經很接近AGI了。不過,我並沒有被它震撼到那種程度,盡管它確實令人印象深刻。
梅恩:o3顯著改善了"脆弱性"問題。早期版本遇到瓶頸易崩潰,現在已能穩定操作電腦。
奧特曼:許多用戶通過o3首次感受到AGI雛形,這是重要飛躍。
梅恩:Deep Research更突破,能像人類般自主調研:采集數據、追蹤線索、整合信息,輸出質量超越傳統模型。
奧特曼:實際案例顯示,求知者能用它快速生成主題報告並迭代學習,堪稱教育革命工具。
04.GPT-5與模型命名規則
梅恩:盡管有Deep Research,模型競爭仍在繼續。GPT-5何時發布?性能提升方向?
奧特曼:可能是在今年夏天的某個時候。不過,我們還在討論,對於新模型,我們是應該簡單地提升版本號,還是像GPT-4那樣,不斷優化和改進。
梅恩:GPT-4發布時對比3.5差異明顯,但持續優化讓版本邊界模糊。未來會否出現"GPT-4.5"與"GPT-5"難以區分?
奧特曼:有可能。當前係統支持持續訓練優化,GPT-5發布後或采用5.1/5.2子版本號——命名將比GPT-4o更清晰,解決用戶偏好特定版本的管理難題,最終簡化複雜術語,如o4-mini。
梅恩:即使技術再好,也很難理解這些版本的區別。比如,我該用o4-mini還是o3?
奧特曼:我認為這是一個範式轉變的結果。我們正處於這種轉變的末期,但我可以想象,未來可能會出現新的範式,我們可能又需要重新劃分模型樹。
梅恩:那你覺得未來會不會出現更複雜的命名方式?
奧特曼:希望不會。我期待著GPT-5和GPT-6的到來,這樣人們使用起來會更簡單,不用再糾結於o4-mini-high或o3這樣的版本。
05.用戶隱私與《紐約時報》訴訟
梅恩:我用o4-mini-high來編程,用o3來進行對話。我覺得,讓這些模型變得更強大的一個因素是它們的集成,比如記憶功能。記憶功能從一開始很簡單,現在變得越來越複雜。
奧特曼:記憶功能是ChatGPT重大突破。AI結合用戶生活背景理解簡短提問,多數用戶高度認可。未來將提供超個性化服務,但隱私保護是核心原則。
梅恩:《紐約時報》起訴要求延長用戶記錄保留期,公司首席運營官布拉德·萊特卡普(Brad Lightcap)已回應,請說明立場?
奧特曼:我們將積極應訴並確信勝訴。其要求本質矛盾:以隱私之名迫使AI公司侵害用戶隱私。此案應推動社會建立AI隱私框架——畢竟用戶正用ChatGPT處理私密對話。
06.ChatGPT會投放廣告嗎?
梅恩:很多人在使用ChatGPT或對其持懷疑態度時會問,OpenAI現在可以訪問這些數據,一方麵是訓練數據的使用—OpenAI 已經明確說明了何時會使用、何時不會使用;另一方麵,比如廣告等場景。OpenAI對此的態度是什麽?你們會如何承擔這種責任?
奧特曼:我們目前尚未推出任何廣告產品。我並非完全反對廣告,比如Instagram上的廣告體驗就不錯,我也通過它購買過很多東西。但我認為,若要推出廣告,必須極其謹慎地處理,以確保不損害用戶體驗。
梅恩:我希望能找到一個解決方案。我很期待通過ChatGPT或一個優秀的聊天機器人完成所有購物,但很多時候我覺得自己並未做出最明智的決策。不過,這確實是個棘手的問題。
奧特曼:這確實具有挑戰性。但如果能找到一種既清晰又符合用戶利益的實現方式,將會非常理想。例如,我們可以明確承諾不修改語言模型的輸出內容,但若用戶點擊其中的鏈接,我們可從中獲得交易收入—這對各方而言都是公平的。或許還可以在語言模型輸出流之外展示廣告,但必須確保這些廣告對用戶真正有用,且不幹擾模型的正常輸出。
梅恩:我很欣賞蘋果的模式。作為蘋果用戶,我知道自己為手機支付了較高的費用,但他們不會在設備中塞滿多餘的內容。
奧特曼:蘋果在這方麵確實表現出色。他們不像其他公司那樣過度依賴廣告收入。不過,穀歌搜索曾經是一個非常優秀的產品—盡管現在可能有所下滑,但在一段時間裏,即便存在廣告,它仍是互聯網上最出色的產品之一。我尊重穀歌的很多做法,但顯然其中也存在一些問題。
主持人:穀歌本質上是一家廣告技術公司,其激勵機製與用戶利益並非完全一致。而蘋果的模式更注重用戶體驗,盡管他們也嚐試過其他業務,但似乎並不成功,這也反映出他們對廣告業務並不熱衷。
奧特曼:蘋果在廣告業務上確實不夠積極。但我們確實需要在廣告與用戶體驗之間找到平衡點。無論采取何種方式,都必須向用戶保持高度的透明與清晰溝通。
07.社交媒體與AI人格設計
梅恩:模型曾出現“過度討好用戶”問題,涉及AI人格定位。OpenAI如何看待?
奧特曼:社交媒體教訓深刻:算法為延長使用時長,無意中引發社會負麵效應。AI若僅迎合單輪對話反饋,將損害用戶長期體驗。如DALL-E 3曾因用戶偏好導致輸出趨同,新模型已修正此問題。我們的核心原則是:短期有用不等於長期有益,需平衡即時反饋與用戶成長價值。
梅恩:我注意到DALL-E 3似乎在技術上很有能力,但它的圖像風格似乎都趨於一致,這可能是由於用戶在比較兩個選項時更傾向於選擇某種風格,從而導致了這種現象。
奧特曼:我不確定DALL-E 3的情況是否如此,但我認為這是一個很好的例子。我們需要在用戶體驗和長期利益之間找到平衡。
08.星門計劃與算力資源的重要性
梅恩:星門計劃傳耗資5000億美元,如何向公眾解釋其必要性?
奧特曼:它將填補算力與需求的巨大鴻溝。用戶一旦體驗過10倍/100倍算力提升的價值,自會理解——AI服務全球需空前規模的基礎設施,星門計劃的目標正是讓智能"豐富且廉價"。
梅恩:這是一個全球性的巨大項目。我們之前提到,阿聯酋是其中一個合作夥伴,你們正在與世界各地的政府合作。有人在社交媒體上問我,5000億美元,你們有錢嗎?
奧特曼:我們目前沒有這麽多錢存在銀行裏,但我們將在未來幾年內逐步投入。除非出現什麽問題,比如我們無法建造這些計算機,否則我相信人們會履行承諾。
梅恩:傳言埃隆.馬斯克(Elon Musk)曾試圖幹擾該項目的國際合作?
奧特曼:我曾公開表示(包括公司內部選舉後的聲明),最初確信埃隆不會濫用政府權力進行不正當競爭。如今我必須承認這個判斷是錯誤的——雖然我向來不願輕易認錯,但更令我痛心的是這種行為對國家造成的傷害,這完全超出了我的預期。值得慶幸的是,本屆政府始終堅持原則,果斷抵製了這類行為。整件事的發展確實令人深感遺憾。
梅恩:我認為現在的局麵已經改變了。就像格雷格.布羅克曼(Greg Brockman)所說,過去人們覺得誰先跑到終點誰就是贏家,遊戲就此結束。但現在我們意識到,還有很多優秀的AI實驗室—比如 Anthropic正在開發出色的工具,穀歌也在加速追趕。這不再是某一家獨霸天下的局麵了。
奧特曼:我認同這一點。我發現人工智能的突破與晶體管的發現有很多相似之處:許多公司會基於它打造偉大的產品,最終這項技術會滲透到幾乎所有領域。就像你不會總想著 “我正在用晶體管”,未來很多企業會依托這一重大科學發現建立成功的業務。我希望埃隆能少一些零和思維。
梅恩:從整體來看,這個 “蛋糕” 肯定會越做越大。我最近參加了一個能源會議,人們討論能源生產和超大規模擴張時,讓我聯想到能源需求的問題。我知道Grok 3團隊甚至得在停車場放置發電機來訓練模型—問題是,能源從哪裏來?
奧特曼:能源會來自多方麵。目前我們依賴天然氣、太陽能、核能等多種能源的組合。我對先進的核裂變和核聚變技術尤其期待,但當下仍需依靠綜合能源體係。
梅恩:確實是多種能源並用。我聽說在阿爾伯塔省等地,能源儲備充足但需求不足。這讓我意識到,能源問題已經形成了全球性的格局,這是我之前未曾想過的。
奧特曼:傳統上,能源的全球運輸非常困難。但如果把能源轉化為 “智能”,通過互聯網傳輸,就會容易很多。所以可以在多地建設大型訓練中心或推理集群,再將輸出結果通過網絡傳送出去。
09.科研與硬件革新
梅恩:詹姆斯.韋伯望遠鏡麵臨“數據過剩科學家不足”的問題,AI如何改變科研?
奧特曼:未來或無需新對撞機,AI分析既有數據即可突破高能物理。當前模型已實現舊藥新用等成果。
梅恩:推理模型與GPT的區別?
奧特曼:GPT已有基礎推理,推理模型則強化分步思考能力。用戶願為高質量答案容忍更長響應時間。
梅恩:與喬納森.艾維(Jonathan Ive)的硬件合作有何進展?
奧特曼:設計追求極致,尚處早期。現有設備為“無AI時代”設計,未來硬件將感知環境、深度理解上下文,交互超越傳統鍵盤-屏幕模式。
10.給年輕人的建議
梅恩:給25歲年輕人有什麽建議?
奧特曼:戰術層如學編程般必要掌握AI工具;戰略層錘煉韌性、創造力、共情力——這些軟實力未來價值倍增。
梅恩:AGI實現後OpenAI會擴招嗎?
奧特曼:團隊將擴大,但每人生產力遠超AGI前時代——技術本為實現人效躍升。