評論: Altman讚DeepSeek"表現出色"曝OpenAI不同路徑
隻有登錄用戶才能發表評論,
點擊此處
登錄
返回新聞帖
不可以使用
發表評論於 2025-01-28 12:07:26
bsmile 發表評論於 2025-01-28 10:16:05還有一個問題,是下載的deepseek在沒有下載chatGPT的app的機器上也能順利運行,這似乎看起來和chatGPT沒有關係,請幫助解惑一下
-----------------------------------
能問這個問題,證明你純粹IT白吃,如果有調用,你以為調用是在客戶端調用的?就你這水平就別參與這個級別的討論了。
bsmile
發表評論於 2025-01-28 10:16:05
theriver1 發表評論於 2025-01-28 08:21:51
昨晚仔細研究了一下DeepSeek-R1,終於冷靜下來了。現在基本上傾向於DeepSeek是AI拚多多的說法。因為DeepSeek算法根本就沒有什麽自己的革命性的創新!
========
還有一個問題,是下載的deepseek在沒有下載chatGPT的app的機器上也能順利運行,這似乎看起來和chatGPT沒有關係,請幫助解惑一下
bsmile
發表評論於 2025-01-28 10:11:22
theriver1 發表評論於 2025-01-28 08:21:51
昨晚仔細研究了一下DeepSeek-R1,終於冷靜下來了。現在基本上傾向於DeepSeek是AI拚多多的說法。因為DeepSeek算法根本就沒有什麽自己的革命性的創新!它隻不過是集成了以下一係列美國人發明(都是美國公司公開發表的論文和技術)的成熟或不太成熟的優化算法的架構模型和創新,最終達到靠壓縮整體工作量和壓榨每個任務(不讓任務閑下來)的路徑來最大限度地降低算力資源的成本:
1.MLA多層注意力架構
2.FP8混合精度訓練框架
3.DualPipe跨節點通信
4.無輔助損失的負載均衡策略
5.跨節點全對全通信內核
6.MTP技術
7.數據精篩
8.DeepSeek-R1蒸餾
其中最重要的是前兩個架構,它們都是為了壓縮工作量的,也是其與ChatGpt等美國公司大模型的最主要區別。
==========
可以解釋一下為什麽deepseek比chatGPT快那麽多嗎?還有,chatGPT沒有開源的,deepseek是如何和chatGPT建立交互的?
theriver1
發表評論於 2025-01-28 09:44:43
各種優化算法都有自己的優缺點,不同的公司采取不同的優化思路,說白了就是在性能、價格和結果上達到“符合本公司目標”的平衡。比如Deepseek-R1不同於ChatGPT的架構-FP8混合精度訓練框架,這裏的FP8就是二進製裏8個比特位,位數越多代表精度越高,ChatGPT是32位和16位,Deepseek-R1是8位,這就比ChatGPT少了一半的計算量和內存,由此帶來的精度誤差用“混合精度”來彌補(對於精度要求高的數據,先用類似四舍五入的方法快速計算,再每128個數的結果交給32位的會計程序精算),最終大大壓縮了計算量,但是精度肯定遠遠不如ChatGPT。這種方法就是DS在平衡了性價比和結果後選擇的偏向性價比的優化思路。
藍天大地
發表評論於 2025-01-28 08:43:04
完全同意。DS隻不過是個Distill流程而已。我對軟件一竅不通,但卻對3D建模感興趣。
最近在做一個地球模型玩,於是我花了很大的時間和資源(create a mesh,UV mapping,material,shading,geometry modification,etc.)把這個地球做出來了。
但我的牌友跟我說,這個地球上的澳洲地區森林覆蓋麵不夠廣,要再加點綠色。他就把我的模型拿過去,用shading nodes加了點綠色,使我的這個地球更漂亮些了。這個地球就是ChatGpt,這個朋友做的就是DS。
但是,如果我不把這個地球模型給他,他就不能讓這個地球更漂亮。所以,DS根本不算什麽。
所以說,DS對NVDIA的芯片根本沒有影響,華爾街那幫人不懂技術,過一陣子NVIDIA的股票就會漲回來。因為,pre-training & post-training,任然需要很多的芯片。
更進一步說,類似DS的東西有可能反而會更加推進對NVIDIA芯片的需求。DS最大的貢獻在於細分化(segmentation),這就給跟多專業的細分化公司提供了機會。它們單個公司所需要的芯片也許不多,但是如果有很多各類做細分化為專長的公司出現,那麽累計起來對NVIDIA芯片的需求還是會越來越大。
所以,我繼續看好NVIDIA,ChatGpt這類公司的前途!
毛毛們可以閉嘴了。哈哈哈哈哈哈。
------------------------------------------------------------
theriver1 發表評論於 2025-01-28 08:21:51
theriver1
發表評論於 2025-01-28 08:21:51
昨晚仔細研究了一下DeepSeek-R1,終於冷靜下來了。現在基本上傾向於DeepSeek是AI拚多多的說法。因為DeepSeek算法根本就沒有什麽自己的革命性的創新!它隻不過是集成了以下一係列美國人發明(都是美國公司公開發表的論文和技術)的成熟或不太成熟的優化算法的架構模型和創新,最終達到靠壓縮整體工作量和壓榨每個任務(不讓任務閑下來)的路徑來最大限度地降低算力資源的成本:
1.MLA多層注意力架構
2.FP8混合精度訓練框架
3.DualPipe跨節點通信
4.無輔助損失的負載均衡策略
5.跨節點全對全通信內核
6.MTP技術
7.數據精篩
8.DeepSeek-R1蒸餾
其中最重要的是前兩個架構,它們都是為了壓縮工作量的,也是其與ChatGpt等美國公司大模型的最主要區別。
海灣1013
發表評論於 2025-01-28 07:53:00
樓下 大河邊的人 真酸!
大河邊的人
發表評論於 2025-01-28 07:22:27
民兵偶爾也可以用最低成本幹出正規軍的大事,但要使得AI成長能夠辦大事,還得靠裝備齊全不缺經費的正規軍。何況目前AI的效能還非常低下,當個玩具不錯,但很多事情不能信賴。
西門雪
發表評論於 2025-01-28 07:15:44
中國新五大【發明】
高鐵
共享單車
網購
移動支付
DICK SHIT
西門雪
發表評論於 2025-01-28 07:11:11
回複:‘竹天 發表評論於 2025-01-28 05:40:48
剛問了chatgpt and deepseek 一個高中數學tan題。兩者答案不同,DS給了不知所雲的長長刷屏的過程。’
**================**
DS===dick shit !!
ca_lowhand
發表評論於 2025-01-28 06:31:00
ds的訓練過程有不少新東西。一些還在理論驗證階段的ai理論它都拿出來實驗並且結果都挺好。它使用chatgpt做訓練員所以最終性能不能超越GPT,但看它的推理步驟和GPT完全不同,用另一種極低成本的方式實現了比擬GPT的推理能力。
滅獨者
發表評論於 2025-01-28 06:25:10
在浙江海清,我們去過幾家做LV、愛馬仕等仿冒包包的公司展覽門市部,通過關係,買一個A貨的LV隻買300元人民幣,成本也隻有100元左右,買一個A貨的愛馬仕隻要600元人民幣,成本也就200元左右。所謂A貨,就是仿造的很像真的。還要所謂B貨。更便宜。所謂DeepSeek,也隻是仿chatGPT和OPAI而已。中共有本身,自己搞出一個新的原創的發明,仿造出別人的東西,還說比別人的先進,更省錢,真是可恥至極。就像互聯網是美國發明的,結果中共每年還召開世界互聯網大會,真的很滑稽,更可笑的是中共的互聯網與世界更不就不互連。
DANIU_S
發表評論於 2025-01-28 06:19:00
Deepseek 最主要的貢獻是免費開源、省錢,對科技界多少都是個貢獻。而且創始人梁文鋒,還是個20 幾歲的小朋友。
彎刀月
發表評論於 2025-01-28 06:04:00
這個精油被套上了GPT之父?貌似這個行業不需要科學家,數學家,奧數天才。
閑看江湖
發表評論於 2025-01-28 05:42:39
大勢所趨,勢不可擋。下一步就是匹配匹配該算法的硬件拓撲結構硬件的提升。中國算力僅僅打開半扇門。
竹天
發表評論於 2025-01-28 05:40:48
剛問了chatgpt and deepseek 一個高中數學tan題。兩者答案不同,DS給了不知所雲的長長刷屏的過程。
夢想天空
發表評論於 2025-01-28 05:27:51
這哥們費了不少力氣才把open ai從開源轉成閉源收費,結果自己收費的產品竟然比不上一群剛畢業學生搞的開源免費產品,確實有點兒尷尬
ca_lowhand
發表評論於 2025-01-28 05:08:00
meta已經在全麵研究ds的思路,相信美國大廠會在短期內推出超越ds技術的產品
正人偽君子
發表評論於 2025-01-28 04:37:00
這種AI主要是Data。既然開源,不就知道算法了,有什麽先進的。
mcsquare
發表評論於 2025-01-28 04:31:00
看看哪個賺錢最快最多吧。別的都是瞎扯。電動車就是一個實力:隻有馬斯克賺錢多。哈哈哈。
歐洲知青
發表評論於 2025-01-28 04:00:24
中文版有審查,英文版沒有,不要用Qwen
荒野獵人 發表評論於 2025-01-28 01:40:00
deepseek雖然是開源模式,但無疑通過了政府的相關審查。deepseek的表現是最好的,與chapgpt處於同一水平,但經過中國政府審查後有可能演變成一部巨大的宣傳工具!
slipknot
發表評論於 2025-01-28 03:35:00
不要秀下限了,人家開源的,華爾街人都比你傻
hachimada
發表評論於 2025-01-28 02:17:30
胡說,這論壇裏很多噴子都證實了DeepSeek是假的!是Deepshit!哈哈。
maina
發表評論於 2025-01-28 02:02:00
我的理解是deep seek表現出色,如果配備更高算力的硬件表現會更出色,所以更高算力的芯片還是會搶手的。
XM25
發表評論於 2025-01-28 01:58:00
如果它不懂就去問ChatGPD, 那它根本不需要訓練大模型,當然也不需要那麽多算力和金錢。
東北爺們
發表評論於 2025-01-28 01:55:00
還能怎麽說?不能承認投資失敗
荒野獵人
發表評論於 2025-01-28 01:40:00
deepseek雖然是開源模式,但無疑通過了政府的相關審查。deepseek的表現是最好的,與chapgpt處於同一水平,但經過中國政府審查後有可能演變成一部巨大的宣傳工具!
XM25
發表評論於 2025-01-28 01:36:00
如果真是這樣,我是第一個發現的哈!
XM25
發表評論於 2025-01-28 01:32:00
我和國內網友合作,問了兩個物理問題,第二個問題非常個性化,是我自己的猜想或者胡扯。結果回答非常相像,連鼓勵我的方式和要點都一樣。懷疑不懂的問題,直接問ChatGPD,改寫一下回國內網友。如果真是這樣,那就是另一個龍芯。
頁次:
1
/1
每頁
50
條記錄, 本頁顯示
1
到
29
, 共
29
分頁: [
1
]
-----------------------------------
能問這個問題,證明你純粹IT白吃,如果有調用,你以為調用是在客戶端調用的?就你這水平就別參與這個級別的討論了。