從穀歌Gemini失利,談中國DeepSeek到底是中草藥還是AI利器?

本帖於 2025-01-26 21:15:35 時間, 由普通用戶 金筆 編輯

上一篇我說到:中美在人工智能領域裏的競爭實際上就是西藥和中草藥的競爭!有人不服氣說中國的DeepSeek需要更少很多的電力(俗話:輕快),因而具有更為先進的算法,可以跟美國最為先進的OpenAI媲美或更好。

真的是這樣嗎?

人工智能,說到底就是模擬人的大腦。我們知道人腦的智慧(智力)取決於兩個方麵:記憶力(或記憶量)以及“閃存”(即獲取和解讀記憶的速度濾過能力)來決定的。

在OpenAI上線以前,我們知道穀歌,臉書,特斯拉以及微軟(OpenAI)之間的競爭是很激烈的。但當OpenAI推出以後,這個號稱收集了2022年為止的所有數據庫(圖書,資料,Internet等),而訓練出來的人工智能ChatGPT開始麵向市場以後,實際上這個競爭就已經結束了。注意,OpenAI訓練時使用的數據庫,基本都是免費的。

當ChatGPT開始推出收費服務,所有的數據庫都開始收費了。即使富有多錢的公司,如穀歌,臉書等,實際上也無法購買和支付所有這些數據庫了,太昂貴了。因此人工智能的訓練,即向它喂資料就變的很局限了。這也就是為什麽馬斯克和OpenAI的CEO翻臉的原因(罵他是騙子等)。因為OpenAI即沒有公布他們的算法,還推出了收費服務。這就實際上阻礙了AI界的繼續競爭,也阻礙了AI的發展。結論:ChatGPT的模式變得不可重複。

現在AI的競爭主要局限在專業的公司間了,如ChatGPT,Cloude等。如果沒有大量的資料庫來充實和支撐,人工智能實際上還是一台電腦。

那麽再說中國推出的DeepSeek,它區區的五百萬美金,能夠喂食多少資料呢?

據說它很輕快(所謂算法先進?),但實際上就很說明問題。DeepSeek要讀取的記憶量可能就很小。

那麽,你們說它的人工智能AI會高到哪裏去呢?

所有跟帖: 

Bingo! 擊中要害,厲害!數據庫。對的。數據庫收費,那也就是數據收費了。以後再搞到免費的數據就難了。這個就像人腦一 -越活越有勁- 給 越活越有勁 發送悄悄話 (144 bytes) () 01/26/2025 postreply 21:19:26

嗬嗬,終於有人讚同我的了~! -金筆- 給 金筆 發送悄悄話 金筆 的博客首頁 (0 bytes) () 01/26/2025 postreply 21:24:00

用“蒸餾”過的數據,直接上RL,省了pre-taining ,是大膽,也算是“二次開發”。當然省時省錢。 -kl3527- 給 kl3527 發送悄悄話 kl3527 的博客首頁 (0 bytes) () 01/26/2025 postreply 21:43:00

蒸餾?那就更沒有原汁原味了。謝謝補充。沒有花時間研究它,隻是覺得DeepSeek不會靠譜而已。。。! -金筆- 給 金筆 發送悄悄話 金筆 的博客首頁 (0 bytes) () 01/26/2025 postreply 21:57:51

蒸餾是指從用大模型比如DeepSeek R1去訓練參數少的小模型,從而得到8B,14B,32B等等對資源要求較少的版本。 -監考老師- 給 監考老師 發送悄悄話 監考老師 的博客首頁 (0 bytes) () 01/26/2025 postreply 22:55:17

看AI所實現的方向。如果是推理性的,數據大小並不重要。好比google 的alphaZero戰勝AlphaGo並不是通過 -小八臘子2- 給 小八臘子2 發送悄悄話 小八臘子2 的博客首頁 (164 bytes) () 01/27/2025 postreply 10:50:13

DeepSeek沒有從原數據開始,是用現存的開源模型,可能還蹭了ChatGPT的input/output -破棉襖- 給 破棉襖 發送悄悄話 (0 bytes) () 01/27/2025 postreply 13:28:04

同意~ -oldpp- 給 oldpp 發送悄悄話 oldpp 的博客首頁 (0 bytes) () 01/27/2025 postreply 20:52:05

數據庫?GOOGLE早就定時存互聯網數據了。 -ahhhh- 給 ahhhh 發送悄悄話 (159 bytes) () 01/27/2025 postreply 19:46:50

啥都不懂啥都敢說,無知者無畏 -zxw968- 給 zxw968 發送悄悄話 (0 bytes) () 01/27/2025 postreply 20:19:51

GOOGLE的數據集如何?就算不和OpenAI比,比Claude都差。 -busboy- 給 busboy 發送悄悄話 (0 bytes) () 01/27/2025 postreply 22:39:33

請您先登陸,再發跟帖!