我是這樣看人工智能生成圖像的

來源: 京男 2024-02-26 02:27:55 [] [博客] [舊帖] [給我悄悄話] 本文已被閱讀: 次 (3800 bytes)

幾個星期以前, OpenAI 公布了 Sora, 網上給出了美倫美奐的生成例子, 一時間, 互聯網上齊聲歡呼。 

論壇裏有些外行,比如偉哥, 認為萬物皆可生成的時代到來了。 

穀歌為了表示不落後, 馬上公布自己的人工智能也能生成圖像, 結果網上測試, 生成的馬斯克是個黑人, 生成的教父是個黑人, 生成的所有人是黑人...

我的感覺, Sora網上隻是顯示了一種可能, 就是AI能理解人們的語言表述, 用自己的Video數據庫裏已有的Video碎片合成新的錄像。 其實穀歌也是表示自己也能做同樣的事。

區別是, Sora隻是有例子, 並沒開放讓大家生成自己想要的Video

穀歌那個傻大個, 為了不落後, 直接讓客戶生成。

大家知道, 生成的錄像, 不是天馬行空地用模型造出來的, 而是用理解你的語言要求,把學習到的錄像碎片組合到一起, 生成的錄像。 

那麽, Sora生成的例子, 也許隻要庫裏學習過東京街頭的片段, 就可以生成很高質量的東京街頭錄像。 學習過某種鳥, 就可以生成同等質量的那種鳥的錄像。 人們所顯示的,其實是能理解你的要求。 

如果讓Sora隻學習了王家衛的繁花, 讓它生成上海90年代的黃河路, 那麽大概率的生成的錄像是王家衛的風格, 而不是聰明的一休的風格。 

如果錄像庫裏沒有足夠的你要求的錄像, 那麽就生成不出來。 好比穀歌的用的庫都是用黑人的錄像學習的, 生成才會出現黑人馬斯克。 但是不能說明穀歌的理解語言, 生成錄像的技術, 就一定比Sora差。也許隻能說明, 它理解的馬斯克, 它的知識範圍裏,在Video庫裏找到的最相近的, 是個黑人模型。

大家知道,文字信息到聲音信息, 存儲量差別是幾何數量級的, 而聲音到圖形在到Video, 每一級的存儲量差別都是幾何級別的。 

Chat GPT學習了多少億語言模型, 才真正能生成語言。 

那麽Sora要搜索多少億Video, 才能生成任意要求的錄像。生成的質量,完全取決於誰所擁有的錄像庫更大, 誰的算力更高, 誰的存儲空間能大。

 

人工智能生成錄像, 還有很長路要走, Sora隻是指明路是有可能可行的。 

 

 

 


更多我的博客文章>>>

 

 




更多我的博客文章>>>

所有跟帖: 

把學畫畫的,搞廣告的嚇得夠嗆,哈哈 -laonong0min- 給 laonong0min 發送悄悄話 (0 bytes) () 02/26/2024 postreply 03:06:13

要想保護自己的行業 -京男- 給 京男 發送悄悄話 京男 的博客首頁 (664 bytes) () 02/26/2024 postreply 03:13:50

那專利怎麽辦? -laonong0min- 給 laonong0min 發送悄悄話 (0 bytes) () 02/26/2024 postreply 04:14:22

Gemini的問題最關鍵不在於圖片的質量,而是在於Google人為操控了圖片的生成。 -不能再沉默- 給 不能再沉默 發送悄悄話 (0 bytes) () 02/26/2024 postreply 03:50:22

不是操縱了生成 -京男- 給 京男 發送悄悄話 京男 的博客首頁 (237 bytes) () 02/26/2024 postreply 03:55:45

庫裏沒有怎麽長的像馬斯克 -Bob007- 給 Bob007 發送悄悄話 (0 bytes) () 02/26/2024 postreply 05:16:58

學習的時候沒有用上啊 -京男- 給 京男 發送悄悄話 京男 的博客首頁 (0 bytes) () 02/26/2024 postreply 05:33:43

Sora是可以自己試的。我試過,目前它的理解能力還很低級,我讓它給我畫一個灶台,它死活畫不出來。我連形狀都描述 -hkzs- 給 hkzs 發送悄悄話 hkzs 的博客首頁 (231 bytes) () 02/26/2024 postreply 05:13:26

因為它沒學習過灶台 -京男- 給 京男 發送悄悄話 京男 的博客首頁 (308 bytes) () 02/26/2024 postreply 05:32:59

確實 -京男- 給 京男 發送悄悄話 京男 的博客首頁 (268 bytes) () 02/26/2024 postreply 06:51:05

不是這個原理 sora基本模式和NLP大模型相似 都將圖像和語言 encode到latent 空間 沒有保存任何圖像 -人在美途- 給 人在美途 發送悄悄話 (0 bytes) () 02/26/2024 postreply 07:38:52

SORA is not even released -矽穀工匠- 給 矽穀工匠 發送悄悄話 矽穀工匠 的博客首頁 (400 bytes) () 02/26/2024 postreply 15:14:11

請您先登陸,再發跟帖!

發現Adblock插件

如要繼續瀏覽
請支持本站 請務必在本站關閉Adblock

關閉Adblock後 請點擊

請參考如何關閉Adblock

安裝Adblock plus用戶請點擊瀏覽器圖標
選擇“Disable on www.wenxuecity.com”

安裝Adblock用戶請點擊圖標
選擇“don't run on pages on this domain”