ChatGPT隻是壯年的學習模型, 很快會日薄西山

來源: kirn 2023-03-11 07:07:19 [] [博客] [舊帖] [給我悄悄話] 本文已被閱讀: 次 (1799 bytes)

俺此時在診所等醫生助理,那就隨便扯扯吧。我不是做數據的,所以也就是作為一個外行人胡扯一下。openAI 作為一個語言輸出結合文字分析模型, 也就是一個正當壯年, 但是絕對活不過二十年。這個平台,和穀歌在竭力完善它的算法,成為領域寡頭之後,這個技術方法,也就是幾十年的壽命無異。

為啥這麽說呢?原因很簡單,因為未來的大數據大部分不會是文字數據, 而是視頻數據。因為我不知道視頻數據和文字數據的結構以及分析學習的算法需要怎樣的不同,但是可以肯定的是,如果需要在未來二十年以後,還要在大數據獨居鼇頭的話,任何模型需要處理的該是短視頻或少量的長視頻數據。

為啥我這麽覺得呢?因為博客或普通網頁那時早已日落西山,就算存在,也是老舊無人打理的幽靈網頁。活躍的網頁,也早就從閱讀量巨大的html模式變成了圖片或小視頻的聚集點。起碼我看我娃和她們的朋友們,如果他們將來還有人寫博客,那真的是老古董,要被人笑死。而現在每天新的上來的短視頻,那真是數據驚人。同時我近來通過穀歌搜信息時,越來越發現浮上來的前幾條,都是視頻。這在三年前,是不可以想象的事情。而那時,我們也還隻是在慢慢習慣於穀歌的語音輸入。

也許最簡單的處理就是直接把視頻數據轉換為語音數據,然後可以使用同樣的算法,但是這樣學習肯定學不過對語音和圖片數據的同步分析模型吧。

我也就胡扯一下,哪位數據大拿看到了,有空的話指教一下視頻數據如何學習。

 

所有跟帖: 

Google在matrix運作方麵已經能到十幾維,這是其TensorFlow處理圖像等厲害的關鍵技術。但是文字不會消失, -nearby- 給 nearby 發送悄悄話 nearby 的博客首頁 (35 bytes) () 03/11/2023 postreply 07:15:38

文字是肯定不會消失,而且維度肯定不是問題。其他數據最後也就是簡化到一樣的格式。視頻數據需要被分解嗎? -kirn- 給 kirn 發送悄悄話 kirn 的博客首頁 (0 bytes) () 03/11/2023 postreply 07:24:52

一般數據是二維標準格式,但是圖像、錄像等維數更高。簡化成二維容易處理些 -nearby- 給 nearby 發送悄悄話 nearby 的博客首頁 (0 bytes) () 03/11/2023 postreply 07:33:25

我不懂,所以覺得這是問題的關鍵。如何把數據的維度進行最有效的管理和規化,和在對數據的處理上拿到最優化的算法,哪個更重要? -kirn- 給 kirn 發送悄悄話 kirn 的博客首頁 (199 bytes) () 03/11/2023 postreply 09:57:40

小K,口氣好大,“像”專家評論。可惜。。。。。。。。。 -lovecat08- 給 lovecat08 發送悄悄話 lovecat08 的博客首頁 (0 bytes) () 03/11/2023 postreply 07:22:42

你那馬夾2,怎不來評評。你倆好像從不同台跟貼,有鬼哦.! -lovecat08- 給 lovecat08 發送悄悄話 lovecat08 的博客首頁 (0 bytes) () 03/11/2023 postreply 07:24:16

沒看過“日薄西山”,請附照片說明! -lovecat08- 給 lovecat08 發送悄悄話 lovecat08 的博客首頁 (0 bytes) () 03/11/2023 postreply 07:26:42

我要是專家,那一定去你家吃飯,算吃貨,我是專家。別的都不是,我都是混混,哈哈哈 -kirn- 給 kirn 發送悄悄話 kirn 的博客首頁 (0 bytes) () 03/11/2023 postreply 07:26:30

考小k一個文字處理的經典: king - man = ? -nearby- 給 nearby 發送悄悄話 nearby 的博客首頁 (0 bytes) () 03/11/2023 postreply 07:35:36

楊偉? -lovecat08- 給 lovecat08 發送悄悄話 lovecat08 的博客首頁 (0 bytes) () 03/11/2023 postreply 07:41:45

這個是去問穀歌呢,還是 Chat?其實我更喜歡穀歌,經常翻到第五頁第六頁的 -kirn- 給 kirn 發送悄悄話 kirn 的博客首頁 (0 bytes) () 03/11/2023 postreply 09:58:31

貓貓、小k、國王早上在書香娛樂開心,等貓貓的仿詩,鄰兄要做監工培養孩子們做飯菜去了 -nearby- 給 nearby 發送悄悄話 nearby 的博客首頁 (0 bytes) () 03/11/2023 postreply 07:43:56

啊哈,我跑路去了,今天一定要效率大高! -kirn- 給 kirn 發送悄悄話 kirn 的博客首頁 (0 bytes) () 03/11/2023 postreply 07:45:45

高見! -梧桐之丘- 給 梧桐之丘 發送悄悄話 梧桐之丘 的博客首頁 (0 bytes) () 03/11/2023 postreply 08:26:07

別嚇我,我在等醫生無聊才碼的字,沒想到招呼了這麽多沒見過的ID 來了書版~~梧桐還請幫我找k駭客來,頂一陣子 -kirn- 給 kirn 發送悄悄話 kirn 的博客首頁 (0 bytes) () 03/11/2023 postreply 10:09:06

也許未來有更強大的AI,但是chatGpt絕對是這個方向的開山之作, 現在chatGpt能幫你看YouTube 視頻。 -pichawxc- 給 pichawxc 發送悄悄話 pichawxc 的博客首頁 (0 bytes) () 03/11/2023 postreply 09:08:55

謝謝,我猜我想問的問題其實是,到底未來的贏家是對數據的規劃優勝者,還是算法的優勝者 -kirn- 給 kirn 發送悄悄話 kirn 的博客首頁 (0 bytes) () 03/11/2023 postreply 09:53:47

贏家的問題也太遠了。隻要算法不公開,算法肯定是的優勝者。對於利用公共數據的AI, 數據不是決定性的。 -pichawxc- 給 pichawxc 發送悄悄話 pichawxc 的博客首頁 (0 bytes) () 03/11/2023 postreply 10:47:32

一針見血, openAI比的是算法。不公開的數據比的是數據。我明白了。前麵一直沒想清楚,哈哈哈 -kirn- 給 kirn 發送悄悄話 kirn 的博客首頁 (0 bytes) () 03/11/2023 postreply 11:00:44

ChatGPT基於OpenAI的GPT3.5,即將出台的GPT-4不限於文字,是多模態,包括文字,語音,圖像,視頻。 -泥川- 給 泥川 發送悄悄話 (0 bytes) () 03/11/2023 postreply 09:48:27

進步是通過迭代,一代代更新,現在的ChatGPT,也就相當於福特當年的Model-T。 -泥川- 給 泥川 發送悄悄話 (81 bytes) () 03/11/2023 postreply 10:00:56

產業總要更新換代。前麵高科技大下崗我才知道原來推特和臉書都在做生物化學模型,這些人都下崗了,不能直接產業化~~~ -kirn- 給 kirn 發送悄悄話 kirn 的博客首頁 (258 bytes) () 03/11/2023 postreply 10:05:41

電動車隻是馬斯克這個大牛炒作出來的,其實一點都不更清潔。不是技術突破,是 PR突破 -kirn- 給 kirn 發送悄悄話 kirn 的博客首頁 (0 bytes) () 03/11/2023 postreply 10:06:48

你既然是外行來扯專業知識,你覺得有意義嗎?當然誰都可以瞎扯蛋,言論自由 -青裁- 給 青裁 發送悄悄話 (0 bytes) () 03/11/2023 postreply 09:57:00

那當然有意義了,我天天做我專業的,下班了還扯豈不煩死。我又不發表論文,愛扯扯啥,不愛聽不愛看的嫌無聊的就別和我扯唄 -kirn- 給 kirn 發送悄悄話 kirn 的博客首頁 (0 bytes) () 03/11/2023 postreply 10:01:11

GPT會影響文教。像80s NCR後來變成90s ATM 又變成現在Costco/HD 結帳機器(須人類看著:),影響了銀行/零 -AP33912- 給 AP33912 發送悄悄話 AP33912 的博客首頁 (0 bytes) () 03/11/2023 postreply 10:30:00

也就隻能說AI和紡織機一樣,但是人類高效率織布後很快就會發展出別的需要。俺問的是,誰的織布機最強,還保留到了21世紀:) -kirn- 給 kirn 發送悄悄話 kirn 的博客首頁 (112 bytes) () 03/11/2023 postreply 10:59:00

嗬嗬,20年chatGPT還活著?您老也太寬宏大量廖。回首20年前,矽穀都有啥呢?舊的死了新的闖天下,才是正道。 -吃素的狼- 給 吃素的狼 發送悄悄話 (164 bytes) () 03/11/2023 postreply 15:09:23

那到底會有幾年呢?微軟重金加入,就算穀歌在前期數據處理更勝一籌的話,就算以後輸了,我覺得GPT怎麽也能風光幾年 -kirn- 給 kirn 發送悄悄話 kirn 的博客首頁 (0 bytes) () 03/11/2023 postreply 18:53:19

說的對,現在短視頻真是大行其道呀,不知道若幹年後是不是大家就都不寫字了 -浮雲馳- 給 浮雲馳 發送悄悄話 浮雲馳 的博客首頁 (0 bytes) () 03/11/2023 postreply 15:39:55

搞得我也學會做短視頻了,俺羞愧一下 -kirn- 給 kirn 發送悄悄話 kirn 的博客首頁 (0 bytes) () 03/11/2023 postreply 18:56:21

最近看了很多免費的影視,感覺大多都是俗套,還是文字帶來的想像力最大 -朱朱莉- 給 朱朱莉 發送悄悄話 朱朱莉 的博客首頁 (0 bytes) () 03/11/2023 postreply 17:58:16

我覺得ChatGPT和大數據追求的都是normalize 的普世信息,如果它太新意了,就脫離算法本身的邏輯了。 -kirn- 給 kirn 發送悄悄話 kirn 的博客首頁 (0 bytes) () 03/11/2023 postreply 19:00:06

請您先登陸,再發跟帖!

發現Adblock插件

如要繼續瀏覽
請支持本站 請務必在本站關閉/移除任何Adblock

關閉Adblock後 請點擊

請參考如何關閉Adblock/Adblock plus

安裝Adblock plus用戶請點擊瀏覽器圖標
選擇“Disable on www.wenxuecity.com”

安裝Adblock用戶請點擊圖標
選擇“don't run on pages on this domain”