西東大俠昨天扯到了Sora,其實我並沒有關心過AI工具的進化,知道現在這麽多熱錢,它肯定發展很快而已。既然大俠建議我去學了以後再和年輕人裝牛逼,咱這就得去學習啊,以後好裝逼。我看到第一篇中文科普,把Sora寫成個神乎其神的世界模擬器的稱呼,看到我就想笑了。不就是個視頻生成器嘛,熱炒成這樣啊。不過前段時間矽穀中國小美女的視頻生成器,成為風投的標杆,也是這麽熱炒的。
我不是說熱炒不代表什麽----我沒那麽天真----熱炒代表很多很多的巨大的意義,代表了人類近期的巨額投資和真正的利益。我有一次和一個風投的人聊天,他說,沒有做不出來的東西,就是看資本願不願意砸錢----當時的確把我震了一下----突然讓我從另外一個意義上理解了人類的群體自大,和其他的聰明人在如何理性的利用這個群體自大,把社會的閑置資源化為我用。
前麵一段時間我起了興趣,在MIT的公開平台課上聽了幾節神經學的課,很有意思,但是幾十節課,我沒聽完就被別的有意思的東西打斷了。聽到了老師講到我們對人的大腦對人臉識別的各種當今比較先進的模型,實在是太有意思了。而且她的解說,直接讓我把現在最先進的AI的人臉識別模型打入了九層地獄,哪怕它可以把犯罪分子無誤地揪出來。總結一下,我的直覺就是人類當今的人臉識別技術和真正的人腦識別人臉不是一回事。這個不是一回事,老師是通過茫茫人海中的人類的不同常人的病特例,以及我們認出陌生人的例子來解釋的。她最說服我的是,我們識別人臉和其他物品,是不一樣的功能。人腦識別人臉,是識別人這個個體的複雜函數裏的一部分。我們至今不清楚這個函數,而且它一定不是從數據庫裏學習的結果。
簡言之,這位MIT的老師認為我們識別別的人,是自主的學習新的東西的過程,而不是被動的複習舊的東西的過程。神經學科領域有兩大school of thoughts,直到現在還在相當精彩的彼此批判,將來一定也不會停息---和任何的科學領域一樣一樣的。
AI的生成模型,在圖片和視頻領域成功一點也不驚訝----因為人們往往忽視了我們人類對這些機器學習的結果認可的時候,在進行一個全人類的第三次功能驗證的validation, 這個validatuon不是訓練數據庫和驗證數據庫的結構關係,這個validation已經脫離那個建模的科研小組的研究過程,而成為一個功能驗證。這個validation, 通過我們全體人類的眼睛和我們所有人的大腦成為了一個功能數據庫,是另外一個如阿基米德的地球外的杠杆的光譜驗證器。我們所有的人,在使用機器學習的軟件時,我們無形且自動地成為了那個功能驗證器。明白這個全體人類的功能驗證,而現在的所有機器學習模型,隻是重複生成模型,而不是功能生成模型,對於理解未來的AI什麽能做,什麽不能做,非常非常的重要。
我和一個小孩拚了老命,試圖說服他想要使用生成模型來學習和研究一個很基礎的功能問題是不會成功的,他不願意相信我。其實他和我說,主要是因為他想學了這個以後,好華麗轉身,找份更賺錢的工作。我說服不了他幹啥別的更加賺錢,那就由他去吧。找工作是一回事,什麽語言都可以學習,隻要找到一個合適的插入點,Python可以使用軟件包裏的東西,編任何的程----可是被放棄的計算機語言少了去了?我不學計算機的,沒資格評判這個。但是從小孩的出發點來說,這麽功利並沒有錯,但是你目前得找個普世的人眼可以驗證的模型去做啊。你就找二維的,而且隻需要視覺效果,不需要再獨立發展功能驗證的第三維實驗的研究對象,你抱著你的機器怎麽學習都沒關係!
我隻是卜一下卦,在本世紀的生成AI,凡是能學習成功和再應用的技術,絕對脫離不了人的視覺效應可以驗證的任何學習過程。一旦脫離了視覺效應而進入功能預測,本世紀的機器學習模型絕對無法學習成功。----本質就是因為,我們當今人類對世界功能的認識模型還太膚淺----或者說,一片空白。
信一個宗教和擁有一定程度上的哲學反思能力很重要----尤其在機器學習的時代喔。圖靈和香農其實都是哲學家。