評論:Altman讚DeepSeek"表現出色"曝OpenAI不同路徑

bsmile 發表評論於 2025-01-30 12:48:56

不可以使用發表評論於 2025-01-28 12:07:26
bsmile 發表評論於 2025-01-28 10:16:05還有一個問題，是下載的deepseek在沒有下載chatGPT的app的機器上也能順利運行，這似乎看起來和chatGPT沒有關係，請幫助解惑一下

-----------------------------------
能問這個問題，證明你純粹IT白吃，如果有調用，你以為調用是在客戶端調用的？就你這水平就別參與這個級別的討論了。
============
那你認為的調用在哪裏呢？如果是程序內部的API接口，這不是給自己找堵讓人扒自己的短褲嗎？我敢肯定，deepseek的源代碼一點問題都沒有，訓練數據的來源可能有chatGPT的幫忙，而不是純粹的原始標記

不可以使用 發表評論於 2025-01-28 12:07:26

bsmile 發表評論於 2025-01-28 10:16:05還有一個問題，是下載的deepseek在沒有下載chatGPT的app的機器上也能順利運行，這似乎看起來和chatGPT沒有關係，請幫助解惑一下

-----------------------------------
能問這個問題，證明你純粹IT白吃，如果有調用，你以為調用是在客戶端調用的？就你這水平就別參與這個級別的討論了。

bsmile 發表評論於 2025-01-28 10:16:05

theriver1 發表評論於 2025-01-28 08:21:51
昨晚仔細研究了一下DeepSeek-R1,終於冷靜下來了。現在基本上傾向於DeepSeek是AI拚多多的說法。因為DeepSeek算法根本就沒有什麽自己的革命性的創新！
========
還有一個問題，是下載的deepseek在沒有下載chatGPT的app的機器上也能順利運行，這似乎看起來和chatGPT沒有關係，請幫助解惑一下

bsmile 發表評論於 2025-01-28 10:11:22

theriver1 發表評論於 2025-01-28 08:21:51
昨晚仔細研究了一下DeepSeek-R1,終於冷靜下來了。現在基本上傾向於DeepSeek是AI拚多多的說法。因為DeepSeek算法根本就沒有什麽自己的革命性的創新！它隻不過是集成了以下一係列美國人發明（都是美國公司公開發表的論文和技術）的成熟或不太成熟的優化算法的架構模型和創新，最終達到靠壓縮整體工作量和壓榨每個任務（不讓任務閑下來）的路徑來最大限度地降低算力資源的成本：
1.MLA多層注意力架構
2.FP8混合精度訓練框架
3.DualPipe跨節點通信
4.無輔助損失的負載均衡策略
5.跨節點全對全通信內核
6.MTP技術
7.數據精篩
8.DeepSeek-R1蒸餾
其中最重要的是前兩個架構，它們都是為了壓縮工作量的，也是其與ChatGpt等美國公司大模型的最主要區別。
==========
可以解釋一下為什麽deepseek比chatGPT快那麽多嗎？還有，chatGPT沒有開源的，deepseek是如何和chatGPT建立交互的？

theriver1 發表評論於 2025-01-28 09:44:43

各種優化算法都有自己的優缺點，不同的公司采取不同的優化思路，說白了就是在性能、價格和結果上達到“符合本公司目標”的平衡。比如Deepseek-R1不同於ChatGPT的架構-FP8混合精度訓練框架，這裏的FP8就是二進製裏8個比特位，位數越多代表精度越高，ChatGPT是32位和16位，Deepseek-R1是8位，這就比ChatGPT少了一半的計算量和內存，由此帶來的精度誤差用“混合精度”來彌補（對於精度要求高的數據，先用類似四舍五入的方法快速計算，再每128個數的結果交給32位的會計程序精算），最終大大壓縮了計算量，但是精度肯定遠遠不如ChatGPT。這種方法就是DS在平衡了性價比和結果後選擇的偏向性價比的優化思路。

藍天大地 發表評論於 2025-01-28 08:43:04

完全同意。DS隻不過是個Distill流程而已。我對軟件一竅不通，但卻對3D建模感興趣。

最近在做一個地球模型玩，於是我花了很大的時間和資源（create a mesh，UV mapping，material，shading，geometry modification，etc.）把這個地球做出來了。

但我的牌友跟我說，這個地球上的澳洲地區森林覆蓋麵不夠廣，要再加點綠色。他就把我的模型拿過去，用shading nodes加了點綠色，使我的這個地球更漂亮些了。這個地球就是ChatGpt，這個朋友做的就是DS。

但是，如果我不把這個地球模型給他，他就不能讓這個地球更漂亮。所以，DS根本不算什麽。

所以說，DS對NVDIA的芯片根本沒有影響，華爾街那幫人不懂技術，過一陣子NVIDIA的股票就會漲回來。因為，pre-training & post-training，任然需要很多的芯片。

更進一步說，類似DS的東西有可能反而會更加推進對NVIDIA芯片的需求。DS最大的貢獻在於細分化（segmentation），這就給跟多專業的細分化公司提供了機會。它們單個公司所需要的芯片也許不多，但是如果有很多各類做細分化為專長的公司出現，那麽累計起來對NVIDIA芯片的需求還是會越來越大。

所以，我繼續看好NVIDIA，ChatGpt這類公司的前途！

毛毛們可以閉嘴了。哈哈哈哈哈哈。

------------------------------------------------------------

theriver1 發表評論於 2025-01-28 08:21:51

theriver1 發表評論於 2025-01-28 08:21:51

昨晚仔細研究了一下DeepSeek-R1,終於冷靜下來了。現在基本上傾向於DeepSeek是AI拚多多的說法。因為DeepSeek算法根本就沒有什麽自己的革命性的創新！它隻不過是集成了以下一係列美國人發明（都是美國公司公開發表的論文和技術）的成熟或不太成熟的優化算法的架構模型和創新，最終達到靠壓縮整體工作量和壓榨每個任務（不讓任務閑下來）的路徑來最大限度地降低算力資源的成本：
1.MLA多層注意力架構
2.FP8混合精度訓練框架
3.DualPipe跨節點通信
4.無輔助損失的負載均衡策略
5.跨節點全對全通信內核
6.MTP技術
7.數據精篩
8.DeepSeek-R1蒸餾
其中最重要的是前兩個架構，它們都是為了壓縮工作量的，也是其與ChatGpt等美國公司大模型的最主要區別。

海灣1013 發表評論於 2025-01-28 07:53:00

樓下大河邊的人真酸！

大河邊的人 發表評論於 2025-01-28 07:22:27

民兵偶爾也可以用最低成本幹出正規軍的大事，但要使得AI成長能夠辦大事，還得靠裝備齊全不缺經費的正規軍。何況目前AI的效能還非常低下，當個玩具不錯，但很多事情不能信賴。

西門雪 發表評論於 2025-01-28 07:15:44

中國新五大【發明】
高鐵
共享單車
網購
移動支付
DICK SHIT

西門雪 發表評論於 2025-01-28 07:11:11

回複：‘竹天發表評論於 2025-01-28 05:40:48
剛問了chatgpt and deepseek 一個高中數學tan題。兩者答案不同，DS給了不知所雲的長長刷屏的過程。’

**================**

DS===dick shit !!

ca_lowhand 發表評論於 2025-01-28 06:31:00

ds的訓練過程有不少新東西。一些還在理論驗證階段的ai理論它都拿出來實驗並且結果都挺好。它使用chatgpt做訓練員所以最終性能不能超越GPT，但看它的推理步驟和GPT完全不同，用另一種極低成本的方式實現了比擬GPT的推理能力。

滅獨者 發表評論於 2025-01-28 06:25:10

在浙江海清，我們去過幾家做LV、愛馬仕等仿冒包包的公司展覽門市部，通過關係，買一個A貨的LV隻買300元人民幣，成本也隻有100元左右，買一個A貨的愛馬仕隻要600元人民幣，成本也就200元左右。所謂A貨，就是仿造的很像真的。還要所謂B貨。更便宜。所謂DeepSeek,也隻是仿chatGPT和OPAI而已。中共有本身，自己搞出一個新的原創的發明，仿造出別人的東西，還說比別人的先進，更省錢，真是可恥至極。就像互聯網是美國發明的，結果中共每年還召開世界互聯網大會，真的很滑稽，更可笑的是中共的互聯網與世界更不就不互連。

DANIU_S 發表評論於 2025-01-28 06:19:00

Deepseek 最主要的貢獻是免費開源、省錢，對科技界多少都是個貢獻。而且創始人梁文鋒，還是個20 幾歲的小朋友。

彎刀月 發表評論於 2025-01-28 06:04:00

這個精油被套上了GPT之父？貌似這個行業不需要科學家，數學家，奧數天才。

閑看江湖 發表評論於 2025-01-28 05:42:39

大勢所趨，勢不可擋。下一步就是匹配匹配該算法的硬件拓撲結構硬件的提升。中國算力僅僅打開半扇門。

竹天發表評論於 2025-01-28 05:40:48

剛問了chatgpt and deepseek 一個高中數學tan題。兩者答案不同，DS給了不知所雲的長長刷屏的過程。

夢想天空 發表評論於 2025-01-28 05:27:51

這哥們費了不少力氣才把open ai從開源轉成閉源收費，結果自己收費的產品竟然比不上一群剛畢業學生搞的開源免費產品，確實有點兒尷尬

ca_lowhand 發表評論於 2025-01-28 05:08:00

meta已經在全麵研究ds的思路，相信美國大廠會在短期內推出超越ds技術的產品

正人偽君子 發表評論於 2025-01-28 04:37:00

這種AI主要是Data。既然開源，不就知道算法了，有什麽先進的。

mcsquare 發表評論於 2025-01-28 04:31:00

看看哪個賺錢最快最多吧。別的都是瞎扯。電動車就是一個實力：隻有馬斯克賺錢多。哈哈哈。

歐洲知青 發表評論於 2025-01-28 04:00:24

中文版有審查，英文版沒有，不要用Qwen

荒野獵人發表評論於 2025-01-28 01:40:00
deepseek雖然是開源模式，但無疑通過了政府的相關審查。deepseek的表現是最好的，與chapgpt處於同一水平，但經過中國政府審查後有可能演變成一部巨大的宣傳工具！

slipknot 發表評論於 2025-01-28 03:35:00

不要秀下限了，人家開源的，華爾街人都比你傻

hachimada 發表評論於 2025-01-28 02:17:30

胡說，這論壇裏很多噴子都證實了DeepSeek是假的！是Deepshit！哈哈。

maina 發表評論於 2025-01-28 02:02:00

我的理解是deep seek表現出色，如果配備更高算力的硬件表現會更出色，所以更高算力的芯片還是會搶手的。

XM25 發表評論於 2025-01-28 01:58:00

如果它不懂就去問ChatGPD, 那它根本不需要訓練大模型，當然也不需要那麽多算力和金錢。

東北爺們 發表評論於 2025-01-28 01:55:00

還能怎麽說？不能承認投資失敗

荒野獵人 發表評論於 2025-01-28 01:40:00

deepseek雖然是開源模式，但無疑通過了政府的相關審查。deepseek的表現是最好的，與chapgpt處於同一水平，但經過中國政府審查後有可能演變成一部巨大的宣傳工具！

XM25 發表評論於 2025-01-28 01:36:00

如果真是這樣，我是第一個發現的哈！

XM25 發表評論於 2025-01-28 01:32:00

我和國內網友合作，問了兩個物理問題，第二個問題非常個性化，是我自己的猜想或者胡扯。結果回答非常相像，連鼓勵我的方式和要點都一樣。懷疑不懂的問題，直接問ChatGPD,改寫一下回國內網友。如果真是這樣，那就是另一個龍芯。

評論: Altman讚DeepSeek"表現出色"曝OpenAI不同路徑