字節跳動公布大語言模型 chatbot 豆包達到chtgpt4的水平,訓練成本隻要6百萬。難怪MSFT放棄OpenAi

本帖於 2025-01-23 18:55:01 時間, 由普通用戶 whaled 編輯

https://youtu.be/MozJ43LMR6I?si=-8mjn8HJG9vpF2vE

看來也不需要那麽多的核電站和上千億的投資也可以做高質量的LLM和AI。

所有跟帖: 

那個隻是訓練成本,隻是一次性的,不是訓練好後deploy運作的成本。AI數據中心主要是deploy後運作的算力。 -大觀園的賈探春- 給 大觀園的賈探春 發送悄悄話 大觀園的賈探春 的博客首頁 (0 bytes) () 01/23/2025 postreply 18:36:25

實在忍不住。你懂你自己mumbling bumbling的東西麽? -我是誰的誰- 給 我是誰的誰 發送悄悄話 (0 bytes) () 01/23/2025 postreply 18:42:09

她連啥叫checkpoint 和 inference都不懂,就知道嚷嚷data center, power plant -bagel_bites- 給 bagel_bites 發送悄悄話 (0 bytes) () 01/23/2025 postreply 19:03:09

先裝上再說,嗬嗬 -我是誰的誰- 給 我是誰的誰 發送悄悄話 (0 bytes) () 01/23/2025 postreply 19:06:21

嗯, 隻要能偷到就行 -湖上散人- 給 湖上散人 發送悄悄話 湖上散人 的博客首頁 (0 bytes) () 01/23/2025 postreply 18:36:44

WTF is wrong with you? -bagel_bites- 給 bagel_bites 發送悄悄話 (83 bytes) () 01/23/2025 postreply 18:42:42

這裏太多了 -我是誰的誰- 給 我是誰的誰 發送悄悄話 (0 bytes) () 01/23/2025 postreply 18:45:10

一群既不懂行又看不起中國人智商的弱勢群體 -bagel_bites- 給 bagel_bites 發送悄悄話 (0 bytes) () 01/23/2025 postreply 18:59:21

這裏某些人設連AI是什麽都搞不懂,一直喋喋不休,煩死了 -我是誰的誰- 給 我是誰的誰 發送悄悄話 (0 bytes) () 01/23/2025 postreply 19:03:04

這個冒傻氣了 -凊荷- 給 凊荷 發送悄悄話 凊荷 的博客首頁 (131 bytes) () 01/23/2025 postreply 19:18:52

哈哈,在美華人自恨的真多啊!和烙印對比真是鮮明。看數據所有美國亞裔rank眾多亞洲國家都是 -tidytiger- 給 tidytiger 發送悄悄話 tidytiger 的博客首頁 (164 bytes) () 01/23/2025 postreply 19:19:32

這個是中國人的問題,還是中國政府的問題,還是文化的問題,還是都有問題? 赫赫。。 -Midwestrural- 給 Midwestrural 發送悄悄話 (0 bytes) () 01/23/2025 postreply 19:25:44

不知道原因,但有人認為可能是被survey的在美華人人年齡偏大。就紫檀看,這個數據還是比較真實的。 -tidytiger- 給 tidytiger 發送悄悄話 tidytiger 的博客首頁 (0 bytes) () 01/23/2025 postreply 19:32:14

這些年齡偏大的人三十年前也是這樣的認識麽?赫赫。。現在年輕的三十年後又會有多少保存現在的想法呢? -Midwestrural- 給 Midwestrural 發送悄悄話 (220 bytes) () 01/23/2025 postreply 19:34:25

跟這種賴在我們美國的中國人浪費什麽口舌麽。嘿嘿 -Feinbery- 給 Feinbery 發送悄悄話 (0 bytes) () 01/23/2025 postreply 19:43:39

赫赫,三十年前我在同學家的飯桌上把我同學的爹說得是滿臉通紅,隻因他去了趟日本回來後,飯桌上說起中日的不同。。 -Midwestrural- 給 Midwestrural 發送悄悄話 (641 bytes) () 01/23/2025 postreply 19:54:55

你和我黨極力宣傳的越出國越愛國背道而馳啊。嘿嘿 -Feinbery- 給 Feinbery 發送悄悄話 (0 bytes) () 01/23/2025 postreply 19:58:41

現在這些年輕人多是還沒有真正進入過中國的社會就出來了,沒有體會和見識過我黨的黑。。赫赫。。其實隻要回去工作個三五年。。 -Midwestrural- 給 Midwestrural 發送悄悄話 (205 bytes) () 01/23/2025 postreply 20:03:17

我不覺得,因為中國人民斯德哥爾摩症多啊 -Feinbery- 給 Feinbery 發送悄悄話 (0 bytes) () 01/23/2025 postreply 20:07:00

賴在美國?您臉真大,可真會侮辱人。我真於自己的本心,身份認同上沒有覺得自己是個真正的美國人, -tidytiger- 給 tidytiger 發送悄悄話 tidytiger 的博客首頁 (59 bytes) () 01/23/2025 postreply 20:05:29

兔媽,快來,這位在說你無傲骨不誠實呢。嘿嘿 -Feinbery- 給 Feinbery 發送悄悄話 (0 bytes) () 01/23/2025 postreply 20:08:51

你個大男人,行事如此不磊落,我鄙夷你。我說你呢,你導向兔媽。 -tidytiger- 給 tidytiger 發送悄悄話 tidytiger 的博客首頁 (0 bytes) () 01/23/2025 postreply 20:14:01

所有有野心的人都是這樣吧?美國偷英國紡織技術,台積電偷TI,華為偷思科,關鍵是把偷的東西變成自己的然後超越前人 -Amita- 給 Amita 發送悄悄話 (0 bytes) () 01/23/2025 postreply 20:18:30

是挺散的 :)老了就老了,跟不上就跟不上了。。自愛一點。 -DukeAB- 給 DukeAB 發送悄悄話 (0 bytes) () 01/24/2025 postreply 18:28:21

你這也信? -12度圓缺- 給 12度圓缺 發送悄悄話 (0 bytes) () 01/23/2025 postreply 18:37:26

雖然對祖國的東西絕大部分不信。但字節跳動還是很牛的。居然這麽多美國高科技公司幹不過它。讓我百思不得其解。 -Feinbery- 給 Feinbery 發送悄悄話 (0 bytes) () 01/23/2025 postreply 18:42:49

這個我同意 -12度圓缺- 給 12度圓缺 發送悄悄話 (0 bytes) () 01/23/2025 postreply 18:48:37

有什麽百思不得其解?共黨邪惡唄 -我是誰的誰- 給 我是誰的誰 發送悄悄話 (0 bytes) () 01/23/2025 postreply 18:50:45

希特勒不邪惡麽?德國那時出多少牛科學家?我黨治下10來億人,才出幾個? -Feinbery- 給 Feinbery 發送悄悄話 (0 bytes) () 01/23/2025 postreply 19:34:32

這。。。那些科學家幾乎都是猶太人。難道是希特勒培養的?他說量子力學是猶太人的科學。所以不相信核武研究 -Bailey4321- 給 Bailey4321 發送悄悄話 (33 bytes) () 01/23/2025 postreply 19:43:03

誰說幾乎都是猶太人的?諾獎近半德裔,近1/4猶太裔。當然按人口比例還是猶太人牛些 -Feinbery- 給 Feinbery 發送悄悄話 (0 bytes) () 01/23/2025 postreply 19:45:58

這個不是孤立的,不太像依次放衛星 -古代的事物- 給 古代的事物 發送悄悄話 古代的事物 的博客首頁 (0 bytes) () 01/23/2025 postreply 18:43:55

也要open minded. Alex Wang這樣的專家都認為測試結果在同一檔。也許不是通用,但這種開源係統,公司可 -quantnj- 給 quantnj 發送悄悄話 (38 bytes) () 01/23/2025 postreply 18:43:56

有本事讀code去呀。中國的是open source,已經放出來了 -凊荷- 給 凊荷 發送悄悄話 凊荷 的博客首頁 (56 bytes) () 01/23/2025 postreply 19:20:51

去看看美國人的評價,不要一說起中國的東西好像一文不值 -lionhill- 給 lionhill 發送悄悄話 (164 bytes) () 01/23/2025 postreply 19:37:22

自己上X去讀讀評論,不要忘自菲薄! -lionhill- 給 lionhill 發送悄悄話 (0 bytes) () 01/23/2025 postreply 19:39:15

這是豆包和GPT-4兩種不同的approach的優劣比較,according to ChapGPT: -大觀園的賈探春- 給 大觀園的賈探春 發送悄悄話 大觀園的賈探春 的博客首頁 (28775 bytes) () 01/23/2025 postreply 18:44:19

OpenAI以前指責過豆包用它的API輸出訓練模型。豆包承認是有一個小組用OpenAI訓練很小部分但後來把數據清理出來了 -whaled- 給 whaled 發送悄悄話 (0 bytes) () 01/23/2025 postreply 18:49:45

但根本問題是OpenAI花幾百上千億做訓練路子對不對 -whaled- 給 whaled 發送悄悄話 (0 bytes) () 01/23/2025 postreply 18:51:32

AI Infrastructure花的錢建的數據中心的算力主要不是做訓練,而是訓練後deploy持續運作的算力。 -大觀園的賈探春- 給 大觀園的賈探春 發送悄悄話 大觀園的賈探春 的博客首頁 (0 bytes) () 01/23/2025 postreply 18:58:13

英偉達和幾個頭部AI公司股票懸了 -青裁- 給 青裁 發送悄悄話 (0 bytes) () 01/23/2025 postreply 19:01:00

我估計是用它的輸出逆向工程,揣摩OAI的架構 -bagel_bites- 給 bagel_bites 發送悄悄話 (533 bytes) () 01/23/2025 postreply 18:57:34

這個和我兒子說的一樣,他也說RL才有課題可做,GenAI做得太多了 -whaled- 給 whaled 發送悄悄話 (0 bytes) () 01/23/2025 postreply 19:02:18

同意,RL是主方向 -青裁- 給 青裁 發送悄悄話 (0 bytes) () 01/23/2025 postreply 19:04:00

Hinton 的 Boltzmann Machine 實踐上落後了,理論還是站得住的 -bagel_bites- 給 bagel_bites 發送悄悄話 (210 bytes) () 01/23/2025 postreply 19:14:46

RL隻能是domain narrow,所以不會有什麽AGI -我是誰的誰- 給 我是誰的誰 發送悄悄話 (0 bytes) () 01/23/2025 postreply 19:16:42

policy是可以學習和鞏固的,這就是人腦學習的過程 -bagel_bites- 給 bagel_bites 發送悄悄話 (51 bytes) () 01/23/2025 postreply 19:18:51

產生聯想是不可逾越的鴻溝,因為電腦沒有自主意識,人腦才有 -我是誰的誰- 給 我是誰的誰 發送悄悄話 (0 bytes) () 01/23/2025 postreply 19:21:39

這個將來的事情不好說,我覺得可能。 -bagel_bites- 給 bagel_bites 發送悄悄話 (84 bytes) () 01/23/2025 postreply 19:24:10

情感是關鍵詞here。。。哪天電腦有了情感,人類就準備後事吧。不過我認為不可能。 -我是誰的誰- 給 我是誰的誰 發送悄悄話 (0 bytes) () 01/23/2025 postreply 19:25:46

顯而易見 -bagel_bites- 給 bagel_bites 發送悄悄話 (201 bytes) () 01/23/2025 postreply 19:05:33

這裏大部分連皮毛都沒有搞懂 -我是誰的誰- 給 我是誰的誰 發送悄悄話 (0 bytes) () 01/23/2025 postreply 19:07:46

穀歌DeepMind的Demis那個是RL,和Altman的Generative AI是AI裏不同的兩個門派。 -大觀園的賈探春- 給 大觀園的賈探春 發送悄悄話 大觀園的賈探春 的博客首頁 (0 bytes) () 01/23/2025 postreply 19:03:54

Demis也搞生成式人工智能的,大姐 -bagel_bites- 給 bagel_bites 發送悄悄話 (0 bytes) () 01/23/2025 postreply 19:06:39

一年後達到便宜的多,超過更貴 -wass- 給 wass 發送悄悄話 wass 的博客首頁 (0 bytes) () 01/23/2025 postreply 21:18:00

請您先登陸,再發跟帖!