評論:DeepSeek新模型大揭秘，為何它能震動全球AI圈

ajaychen_2024 發表評論於 2025-01-28 20:02:45

如果美國人都有你這麽幼稚狹隘的想法，美國永遠也不會進步。

生肖迷宮發表評論於 2025-01-28 12:44:51世界AI人才的一半在中國，當中國與外國的開發思想不一樣，中國AI主要用於維護極權統治，以後Deep Seek會取代五毛黨，屆時又會有幾千萬人失業，那些腦殘粉紅五毛黨歡呼個啥勁，飯碗馬上就沒了

ajaychen_2024 發表評論於 2025-01-28 18:24:57

結果知恥後勇，現在中國國產成熟製成芯片傾銷全球，國產七納米已經成功，光刻機也將有重大突破。

灣區範兒發表評論於 2025-01-28 09:52:56別忘了中國十多年前還研製成了最先進的漢芯芯片呢，結果呢？

abcdaren 發表評論於 2025-01-28 14:02:50

聰明的訓練方法，硬件沒有太多突破。。。
這人的腦子不可小視。
老美的搞法太燒錢：正是時候檢討自己、迎頭趕上。。。使新科技更接地氣！！！

生肖迷宮 發表評論於 2025-01-28 12:44:51

世界AI人才的一半在中國，當中國與外國的開發思想不一樣，中國AI主要用於維護極權統治，以後Deep Seek會取代五毛黨，屆時又會有幾千萬人失業，那些腦殘粉紅五毛黨歡呼個啥勁，飯碗馬上就沒了。

灣區範兒 發表評論於 2025-01-28 09:52:56

別忘了中國十多年前還研製成了最先進的漢芯芯片呢，結果呢？

abcdaren 發表評論於 2025-01-28 09:05:55

轉發：
一，它是迄今最好的中文大模型平台，從理解能力和答案輸出能力來看，遠超此前百度的文心一言和抖音豆包。說掀翻ChatGPT尚顯誇張，但確實掀翻了國內的BAT和字節跳動，比起美國科技巨頭，更應該陷入恐慌的是國內互聯網大廠。
二、根據這位中國博士朋友的說法，deepseek基於開源的Transformer模型，而Transformer模型由穀歌開發。所以國內媒體宣傳deepseek“純自研”“純國產”是不準確的。而且deepseek的算力基礎仍然來源於英偉達顯卡。
中國內行朋友還透露deepseek團隊非常有錢，提前囤了1萬多張英偉達高端顯卡，而華科大和中科大的實驗室搞顯卡如今都不太容易。從網上公開信息看，DeepSeek擁有1萬張老的A100卡和3000張禁令之前的H800卡‌。按照H800顯卡20萬一片的價格，deepseek購買這3000張顯卡就花費了超6億元。成本不像說的那麽低。。。
也就是說，deepseek的軟硬件基礎仍然是基於美國產品之上。
三、目前使用下來最大的缺點是比老美慢，我輸出一句“你好”，它的“深度思考”時間就花費了8秒，基本一個問題想得到答案，需要等待幾十秒甚至幾分鍾時間，這和ChatGPT的“秒回”能力形成了鮮明對比。但deepseek的差異之處在於，它把原本置於後台的機器人“深度思考”程序，轉為前台公開化顯示，你可以理解為能部分掩蓋輸出答案的緩慢，也能理解為展現其“深度思考”功能的精妙和“人性化”。
四、此前ChatGPT被詬病簡中能力低下，一個原因是簡中文體用戶較少，導致抓取樣本數據少，但deepseek擁有的先天優勢是海量的中文數據抓取基礎，也能夠學習模擬不同的中文語氣和風格，比如可以生成“貼吧老哥體”“小紅書體”，你也可以通過輸入指令“言辭激烈或溫和”，來改變其文風。deepseek的寫作能力，已經大大降低了“AI味”。毫不誇張的說，deepseek未來可以取代大部分的公文寫作甚至社論寫作，這對評論員來說都是不小的挑戰。
五、和所有的國產大模型一樣，deepseek繞不開的是審核，特別是應對政治類曆史類問題。但令人詫異的是，deepseek的尺度遠超BAT和字節大模型，一些敏感信息也被抓取，比如詢問其對當前仿製藥問題的看法，它可以生出一篇言辭尖銳的批評性文章。

矽穀工匠 發表評論於 2025-01-28 08:41:13

its like Korean war ... US has advanced weapons, Mao's team had not even winter coats.

新燕山夜話 發表評論於 2025-01-28 08:08:40

我不懂AI模型的標準和細節，但是我從美國股票市場的反應來看，DeepSeek新模型就是一匹“大黑馬”。華爾街的投資人可是全世界人尖子裏的尖子。再一個就是看同行對手的評價，如果他們的評論裏充滿了“羨慕嫉妒恨”，那Deepseek R1肯定就是個“真家夥”。如果不是，他們連正眼都不會看一看它。

GP2X 發表評論於 2025-01-28 04:06:00

從這篇裏還是明顯看到了幻方量化的身影。股票交易隻要結果贏錢就行，不需要解釋甚至科普來龍去脈。這玩兒的基礎就跟那些類似算命先生的GenAI不一樣。

ajaychen_2024 發表評論於 2025-01-28 03:45:59

你自己用過嗎？沒有調查沒有發言權。我用它寫過廣告方案，雖然不是最好，但是也是十分不錯，足夠用了

銀河的天空發表評論於 2025-01-28 00:35:37測試後英文結果差距太大，準確率很低。中文還行，也就是說，糊弄鬼還行，就是適合中國的產物，對於寫論文和校正以及引用文獻而言，毫無作用。蒙鬼的騙騙外行的東西。

銀河的天空 發表評論於 2025-01-28 00:35:37

測試後英文結果差距太大，準確率很低。中文還行，也就是說，糊弄鬼還行，就是適合中國的產物，對於寫論文和校正以及引用文獻而言，毫無作用。蒙鬼的騙騙外行的東西。

wd01702 發表評論於 2025-01-27 23:15:37

成本這麽低，時間這麽短，效果卻剛好和open ai相當。有那麽巧？openAI又不是智能的極限。

wd01702 發表評論於 2025-01-27 23:06:15

既然開源，其他人就可以重複。同樣的算法，更高算力的芯片，可以用更短的時間訓練出同樣的模型。就如同科學論文發現需要其他人重複來證明，如果我是做這行的，就會叫人按照開源算法從頭複製。是真是假，很快就有結果。

俺是農民 發表評論於 2025-01-27 21:26:47

樓下，我們這兒的計算機club, 還是有一些白人的，不過，你這回答跟我說的有什麽關聯嗎？

bigcatf4 發表評論於 2025-01-27 21:04:28

俺是農民發表評論於 2025-01-27 20:40:49哈哈，其實它的出現，最重要的是告訴老川，他不需要讓別人投資5000個億了，最多隻需要五個億，剩下的近5000億還是搞美國的基建吧
------------
你這話確實像農民
我們小孩學校的計算機CLUB，一個白人黑人沒有，90%的印度人，剩下的華人韓國人

俺是農民 發表評論於 2025-01-27 20:40:49

哈哈，其實它的出現，最重要的是告訴老川，他不需要讓別人投資5000個億了，最多隻需要五個億，剩下的近5000億還是搞美國的基建吧。

wyx2000 發表評論於 2025-01-27 19:12:55

”DeepSeek-R1 Zero 有的隻是一套最簡單的獎勵係統，來激發AI的推理能力。“

又好又便宜，簡單又有效。所以那些AI的各種高手都是拋開簡單的搞一些複雜又低效的東西？

旁觀者XWY 發表評論於 2025-01-27 19:12:00

聰明學生做題舉一反三，給出多種解答方式。為什麽都是人類大腦，思維能力不同？

kingdale1 發表評論於 2025-01-27 18:32:47

這個和當年AlphaGo Zero 無師自通學出的圍棋套路一樣，天下無敵。

0101011 發表評論於 2025-01-27 18:30:58

內行看門道，外行看熱鬧

評論: DeepSeek新模型大揭秘，為何它能震動全球AI圈