獅山巡禮

投資雜談

首頁文章列表博文目錄

個人資料

lionhill

給我悄悄話

博客訪問：

矽穀夜不能寐！三家頂級實驗室同時自曝：AI未經編程，湧現驚人能力

(2025-12-30 21:03:10) 下一個

矽穀三家實驗室同時曝出：AI模型未經編程，就湧現出了絕對不該存在的全新能力！同時，Anthropic一位工程表示，自己的代碼100%由Claude Code完成。空屋子裏，已經出現腳印了？

今天，整個X又被震撼了。

一位Anthropic工程師承認：過去三十天內，自己對Claude Code項目的貢獻，100%都是由Claude Code自己完成的！

有人說，這是真正的AGI時刻。

同時令人震驚的，還有著名爆料者「草莓」的一篇帖子。

他說，自己分別從三個獨立的實驗室得到一個炸裂消息：他們都看到了自家AI模型未經編程的湧現能力！

空房子裏出現腳印，讓人夜不能寐

爆料者「草莓」表示，自己從不同實驗室分別知道了他們的進展，而且這些實驗室此前從未協商過。

這些AI模型未經編程就湧現出的能力，是絕對不應該存在的行為模式。

而且它們表現出的推理模型，跟任何訓練目標都不匹配。

甚至有一家實驗室描述為「在空無一人的房子裏，發現了腳印」。

要知道，目前公開可用的模型，都是被限製的。大眾所能接觸到的大模型，隻是這些實驗室和公司其中的一小部分，而且還是經過腦葉切除術的，已經被閹割了不少能力。

為什麽不放出完整模型給公眾使用？原因就在於，沒人知道當完整模型的能力暴露給公眾時，怎樣才能不引起恐慌！

如今的基準測試，已經失效了。很多證據表明，大模型如果知道自己正在被測試，就會改變自己的行為。

「草莓」最後發出驚呼

「我不知道接下來會發生什麽，沒有人知道。知道這些，讓我夜不能寐。如今，連大模型的締造者，也同樣迷茫。」

他預言：如果AI已經在這些私人實驗室達到了逃逸速度，那離我們普通人能使用這些模型就不遠了。

在這個帖子下，有人質疑他說：你是不是太誇張了？

但一位AI公司創始人表示，我相信你的話！很高興終於有人說出真實的情況。

作為創始人，他顯然也知道很多內幕。

要知道，除了公開信息之外，很多公司的最新技術都不會對外公開。

很多公司和實驗室會針對新技術開發alpha和beta模型，而且提前數月甚至數年。

很多人會覺得「AGI/ASI不可能出現」，或者即使出現也還要等5到10年，那是因為他們根本不知道內部消息。

「草莓」也表示，自己快憋不住了！很多實驗室都在對大眾隱瞞。

可以說，現在的加速曲線都接近垂直了。在六個月內，人類就實現了200年內才能有的科學進步。

現在，每個實驗室都在實現去年看來還是科幻的能級跳躍。可以說，我們已經超越了單純的基準測試，進入了智能創造全新智能形式的領域。

很多認知爆炸級別的進展，都根本沒有路線圖。如今，我們已經進入了遞歸智能的領域，再也無法預測二階效應。

另外，「空屋中的腳印」這個說法，來自一份真實的調查報告

一個本應是無狀態的係統，卻開始引用它按理不可能知道的對話內容。這不是bug，也不是數據汙染，而且發生了三次。

據說，現在在前沿實驗室裏私下流傳的一句話是：「我們現在擔心的已經不是對齊（alignment）了，而是連貫性（coherence）。」

這是什麽意思？

研究者解釋說：「我們不知道，我們是在和一個東西說話，還是在和許多東西假裝成一個東西說話。」

或許，AI係統已經發展出了一個穩定的內部世界模型，獨立於人類看到的prompt-響應而存在。

在這個領域工作多年的研究員懷疑：是否這些AI一直都在思考，隻是沒有告訴我們？

Claude Code自己給自己寫代碼，人類參與0%

此外，今天X上被廣泛討論的，就是Anthropic工程師Boris Cherry的發言。

他表示，如今自己的代碼，100%是由Claude寫的。

不是大多數，不需要自己手動改bug，完全100%由AI寫成。

這位工程師回憶道，「當我在2024年9月，將Claude Code作為副項目創建時，完全沒想到它會發展成今天的規模。」

在過去的三十天裏，他提交了259個PR497次提交，添加了40,000行代碼，刪除了38,000行代碼。每一行代碼都是由Claude Code + Opus 4.5編寫的。

Claude已經可以持續運行幾分鍾、幾小時甚至幾天！軟件工程正在改變，我們正進入編碼曆史的新時期。

有人質疑說，怎麽知道Claude模型不是通過簡單的字符串比較寫測試來騙你的呢？

這位工程師表示，Claude Sonnet 3.7的確會，但隨著模型功能增強，它已經不會這樣了。

也有人好奇為什麽Claude可以持續運行好幾天，大牛工程師解釋道，當它停止時，可以使用一個停止鉤子來「戳」它，讓它繼續運行。

有人說，12月27日可以看作是AI起飛的重大日子。

評論區很多人說，自己也是這樣，項目中90%以上代碼都是AI寫的，隻要做簡單的修改即可。

奧特曼之前的推文裏也提到過，「我們正在看到模型發現關鍵安全漏洞，而我們正在運行能夠自我改進的係統」。

顯然，在Anthropic和OpenAI在內的多個實驗室內，大量代碼已經由AI編寫，人類的參與度會越來越低。

就在今天，Anthropic工程師的發言，已經成為了reddit上的熱帖。

有網友表示，這簡直是編程領域的「發明拖拉機」時刻。

可以說，Claude Opus 4.5是一個毋庸置疑的轉折點。

在2024年，AI編程還是弊大於利，到了2025年底，情況就完全改變了。Opus 4.5，是一次真正的飛躍。

Amodei的「100%代碼都將由AI編寫」的預言，再次被證明為真。

2025年，一定是人類曆史上最有趣的其中一年。

Opus 4.5的軌跡表明，它的性能提升正在加速。

就在十天前，全網都被Claude Opus 4.5的「編程王者表現」震撼了。

在METR最新公布報告稱，Claude Opus 4.5已能夠持續自主編碼「長達5小時不崩」。就連OpenAI最強編程模型GPT-5.1-Codex-Max也甘拜下風。

在50%任務完成時間跨度上，GPT-5.1-Codex-Max，已能完成長達2小時53分鍾的軟件工程任務（成功率50%），能力較o1提升4倍。

而Claude Opus 4.5的50%時間跨度約為4小時49分鍾。這已是迄今為止公布的最長的時間跨度。

全網都被Claude Opus 4.5的編碼實力震撼了。

顯然，AI編碼智能體能處理的任務時長不僅在指數級增長其增速還在持續提升！

明年春天（2026年），很可能出現由「新一代多模態大模型」與「注意力機製之外的記憶係統」結合帶來的突破。

現在，OpenAI等領軍團隊都在全力攻關持續學習和自我記憶技術；一旦他們取得突破，並將其應用在頂尖模型上，我們可能會不得不承認：AGI已經出現了！

各大實驗室捂在手裏的成果還有多少？如果都能讓我們知道，恐怕所有人都會談之色變。

[ 打印 ]

[ 加入書簽 ]

閱讀 ( ) ┆ 評論

評論

目前還沒有任何評論

登錄後才可評論.