OpenAI最早秋季推出“草莓”模型,致力解決“未見之謎”

①OpenAI計劃最早於今年秋天推出代號為“草莓”的新AI模型，並已經向美國國家安全官員做了演示。

②“草莓”可以解決以前從未見過的數學問題，並幫助改進OpenAI即將推出的“獵戶座”大語言模型。

③OpenAI正考慮將“草莓”的精簡版本以聊天機器人的形態推向市場，以幫助降低成本。

騰訊科技訊據國外媒體報道，在OpenAI積極尋求籌集更多資金之際，其研究團隊正全力打造一款代號為“草莓”（原Q*）的新型人工智能產品，旨在超越現有技術，更有效地解決複雜難題。

據知情人士透露，這款人工智能模型預計最早將於今年秋季作為聊天機器人的一部分推出，可能集成於ChatGPT平台中。“草莓”的一大亮點在於其能夠解決前所未見的數學問題，這是當前聊天機器人所無法企及的。此外，通過特定訓練，“草莓”還能應對編程相關的挑戰。

然而，“草莓”並不局限於回答與技術相關的問題，如果有更多的時間去“思考”，它同樣擅長處理更為主觀的話題，如產品營銷策略谘詢。為了展示“草莓”在處理語言相關任務方麵的能力，OpenAI的研究人員已展示了其解決複雜字謎遊戲的實例。

推出“草莓”是OpenAI持續創新的一部分，旨在與財力雄厚的對手競逐生成式人工智能及大語言模型領域的領導地位。這項技術不僅引領未來趨勢，還為解決多步驟任務的智能體（Agent）產品奠定基礎，這些智能體被寄予厚望，可能成為新的收入增長點。

OpenAI的業務正以令人難以置信的速度增長：月度收入已較去年翻兩番，達到2.83億美元，主要得益於大語言模型與ChatGPT訂閱服務的熱銷。盡管該公司的月虧損額可能更高，但其估值卻在不斷飆升，現已突破860億美元大關。

然而，OpenAI的未來前景與“獵戶座”（Orion）新型旗艦大語言模型的最終發布緊密相關。作為現有旗艦大語言模型GPT-4的升級版，“獵戶座”旨在進一步鞏固OpenAI在業界的領先地位。到目前為止，其他競爭對手已經推出了性能與GPT-4大致相當的大語言模型。

目前，尚無法確定OpenAI能否在今年內推出提升GPT-4及ChatGPT性能的聊天機器人版“草莓”，該版本為原始“草莓”模型的小型簡化版，即“蒸餾”版（distillation）。它尋求保持與更大模型相同的性能水平，同時提升操作便捷性與成本效益。

一位知情人士表示，OpenAI正利用更大版本的“草莓”生成用於訓練“獵戶座”的“合成數據”。這一創新舉措旨在突破傳統訓練模型對高質量現實世界數據依賴的局限，如從互聯網上提取文本或圖像，而是通過人工智能生成的數據加速模型優化進程。

此外，據知情人士透露，“草莓”還將為即將問世的OpenAI智能體提供有力支持。

減少“幻覺”

智能體初創公司Minion AI的首席執行官、GitHub Copilot的前首席架構師亞曆克斯·格拉維利（Alex Graveley）表示，通過“草莓”生成的高質量訓練數據，OpenAI能夠顯著降低模型錯誤率，即“幻覺”現象。

他描繪了一個理想場景：“一個沒有幻覺的模型，麵對邏輯難題首次作答就能給出準確答案。”格拉維利說解釋稱，該模型之所以能夠做到這一點，是因為“訓練數據中的模糊性減少，從而減少了模型的自我猜測。”

本月早些時候，OpenAI首席執行官山姆·奧特曼（Sam Altman）在社交媒體上分享了一張“草莓”的圖片，雖未詳細說明，卻激發了公眾對即將發布的新品的無限遐想。據知情人透露，OpenAI還於今夏向美國國家安全官員展示了“草莓”項目。

奧特曼在5月活動中透露：“我們已積累足夠數據，以支持‘獵戶座’等下一代大模型的研發，期間還嚐試了包括生成合成數據在內的多種實驗。”他同時表達了為OpenAI爭取更多資金、並探索減少虧損的方法。

一位知情人士表示，自2019年以來，OpenAI已從微軟處籌集約130億美元資金，作為雙方至2030年商業合作的一部分。據知情人士透露，雙方合作條款或有所調整，特別是關於OpenAI如何支付雲服務器租用費用以支持其人工智能研發，這一費用目前是OpenAI的主要支出成本。

有利可圖的用例

鑒於當前人工智能在航空航天、結構工程等數學密集型領域的局限性，開發擅長解決複雜數學問題的人工智能應用具有顯著的市場潛力。然而，這一目標對人工智能研究人員構成了挑戰，因為現有生成式人工智能（如ChatGPT等）常會給出錯誤的答案，這在數學領域尤為致命。

數學推理能力的增強不僅有助於人工智能模型在數學領域的應用，還能提升其處理會話查詢（如客戶服務請求）的精確度與效率。

與此同時，穀歌與多家初創公司正積極投入推理技術的研發。近期，穀歌DeepMind宣布其人工智能模型在國際數學奧林匹克競賽中展現出超越多數人類選手的實力。OpenAI的另一個競爭對手Anthropic亦宣稱，其最新大語言模型因推理能力的飛躍，能夠編寫更複雜軟件代碼並解答圖表相關問題。

為提升模型推理能力，部分初創公司采取了將問題拆解為更小步驟的經濟型策略，盡管此方法進展緩慢且成本不菲。

無論“草莓”是否會作為產品獨立發布，市場對“獵戶座”均寄予厚望，期待OpenAI能借此鞏固領先地位並持續實現可觀收入增長。近期，穀歌先於OpenAI推出了一款靈活應對用戶中斷與話題轉換的人工智能語音助手，盡管OpenAI在5月已率先發布其版本。

與此同時，穀歌、xAI、Anthropic及Meta等開發商的大語言模型在Lmsys Chatbot Arena等榜單上迅速追趕OpenAI，盡管後者仍是商業買家與人工智能應用開發者的首選。

伊利亞看到了什麽？

“草莓”項目起源於OpenAI的早期研究，由首席科學家伊利亞·蘇茨凱弗（Ilya Sutskever）數年前發起。然而，蘇茨凱弗近期離職，並創立了與OpenAI競爭的人工智能實驗室。他離職前，OpenAI的研究員雅庫布·帕喬基（Jakub Pachocki）與西蒙·西多爾（Szymon Sidor）基於蘇茨凱弗的工作，開發了新型數學解決模型Q*，這一進展令部分關注人工智能安全性的研究者感到意外。

值得注意的是，在OpenAI取得上述突破並遭遇內部安全爭議前夕，由蘇茨凱弗領導的董事會曾短暫解雇奧特曼，但隨後又迅速恢複了其職位。

去年，Q*模型問世之前，OpenAI團隊已探索了“測試時計算”（test-time computation）的概念，旨在提升大語言模型的問題解決能力。這一方法允許模型有更多時間深入思考指令或問題的各個部分。當時，蘇茨凱弗還撰寫了相關博客文章，對該研究進行了闡述。