評論: DeepSeek新模型大揭秘,為何它能震動全球AI圈
隻有登錄用戶才能發表評論,
點擊此處
登錄
返回新聞帖
ajaychen_2024
發表評論於 2025-01-28 20:02:45
如果美國人都有你這麽幼稚狹隘的想法,美國永遠也不會進步。
生肖迷宮 發表評論於 2025-01-28 12:44:51世界AI人才的一半在中國,當中國與外國的開發思想不一樣,中國AI主要用於維護極權統治,以後Deep Seek會取代五毛黨,屆時又會有幾千萬人失業,那些腦殘粉紅五毛黨歡呼個啥勁,飯碗馬上就沒了
ajaychen_2024
發表評論於 2025-01-28 18:24:57
結果知恥後勇,現在中國國產成熟製成芯片傾銷全球,國產七納米已經成功,光刻機也將有重大突破。
灣區範兒 發表評論於 2025-01-28 09:52:56別忘了中國十多年前還研製成了最先進的漢芯芯片呢,結果呢?
abcdaren
發表評論於 2025-01-28 14:02:50
聰明的訓練方法,硬件沒有太多突破。。。
這人的腦子不可小視。
老美的搞法太燒錢:正是時候檢討自己、迎頭趕上。。。使新科技更接地氣!!!
生肖迷宮
發表評論於 2025-01-28 12:44:51
世界AI人才的一半在中國,當中國與外國的開發思想不一樣,中國AI主要用於維護極權統治,以後Deep Seek會取代五毛黨,屆時又會有幾千萬人失業,那些腦殘粉紅五毛黨歡呼個啥勁,飯碗馬上就沒了。
灣區範兒
發表評論於 2025-01-28 09:52:56
別忘了中國十多年前還研製成了最先進的漢芯芯片呢,結果呢?
abcdaren
發表評論於 2025-01-28 09:05:55
轉發:
一,它是迄今最好的中文大模型平台,從理解能力和答案輸出能力來看,遠超此前百度的文心一言和抖音豆包。說掀翻ChatGPT尚顯誇張,但確實掀翻了國內的BAT和字節跳動,比起美國科技巨頭,更應該陷入恐慌的是國內互聯網大廠。
二、根據這位中國博士朋友的說法,deepseek基於開源的Transformer模型,而Transformer模型由穀歌開發。所以國內媒體宣傳deepseek“純自研”“純國產”是不準確的。而且deepseek的算力基礎仍然來源於英偉達顯卡。
中國內行朋友還透露deepseek團隊非常有錢,提前囤了1萬多張英偉達高端顯卡,而華科大和中科大的實驗室搞顯卡如今都不太容易。從網上公開信息看,DeepSeek擁有1萬張老的A100卡和3000張禁令之前的H800卡。按照H800顯卡20萬一片的價格,deepseek購買這3000張顯卡就花費了超6億元。成本不像說的那麽低。。。
也就是說,deepseek的軟硬件基礎仍然是基於美國產品之上。
三、目前使用下來最大的缺點是比老美慢,我輸出一句“你好”,它的“深度思考”時間就花費了8秒,基本一個問題想得到答案,需要等待幾十秒甚至幾分鍾時間,這和ChatGPT的“秒回”能力形成了鮮明對比。但deepseek的差異之處在於,它把原本置於後台的機器人“深度思考”程序,轉為前台公開化顯示,你可以理解為能部分掩蓋輸出答案的緩慢,也能理解為展現其“深度思考”功能的精妙和“人性化”。
四、此前ChatGPT被詬病簡中能力低下,一個原因是簡中文體用戶較少,導致抓取樣本數據少,但deepseek擁有的先天優勢是海量的中文數據抓取基礎,也能夠學習模擬不同的中文語氣和風格,比如可以生成“貼吧老哥體”“小紅書體”,你也可以通過輸入指令“言辭激烈或溫和”,來改變其文風。deepseek的寫作能力,已經大大降低了“AI味”。毫不誇張的說,deepseek未來可以取代大部分的公文寫作甚至社論寫作,這對評論員來說都是不小的挑戰。
五、和所有的國產大模型一樣,deepseek繞不開的是審核,特別是應對政治類曆史類問題。但令人詫異的是,deepseek的尺度遠超BAT和字節大模型,一些敏感信息也被抓取,比如詢問其對當前仿製藥問題的看法,它可以生出一篇言辭尖銳的批評性文章。
矽穀工匠
發表評論於 2025-01-28 08:41:13
its like Korean war ... US has advanced weapons, Mao's team had not even winter coats.
新燕山夜話
發表評論於 2025-01-28 08:08:40
我不懂AI模型的標準和細節,但是我從美國股票市場的反應來看,DeepSeek新模型就是一匹“大黑馬”。華爾街的投資人可是全世界人尖子裏的尖子。再一個就是看同行對手的評價,如果他們的評論裏充滿了“羨慕嫉妒恨”,那Deepseek R1肯定就是個“真家夥”。如果不是,他們連正眼都不會看一看它。
GP2X
發表評論於 2025-01-28 04:06:00
從這篇裏還是明顯看到了幻方量化的身影。股票交易隻要結果贏錢就行,不需要解釋甚至科普來龍去脈。這玩兒的基礎就跟那些類似算命先生的GenAI不一樣。
ajaychen_2024
發表評論於 2025-01-28 03:45:59
你自己用過嗎?沒有調查沒有發言權。我用它寫過廣告方案,雖然不是最好,但是也是十分不錯,足夠用了
銀河的天空 發表評論於 2025-01-28 00:35:37測試後英文結果差距太大,準確率很低。中文還行,也就是說,糊弄鬼還行,就是適合中國的產物,對於寫論文和校正以及引用文獻而言,毫無作用。蒙鬼的騙騙外行的東西。
銀河的天空
發表評論於 2025-01-28 00:35:37
測試後英文結果差距太大,準確率很低。中文還行,也就是說,糊弄鬼還行,就是適合中國的產物,對於寫論文和校正以及引用文獻而言,毫無作用。蒙鬼的騙騙外行的東西。
TitaniumAtlas
發表評論於 2025-01-27 23:37:05
更正一下,模型是開源的,數據沒有
TitaniumAtlas
發表評論於 2025-01-27 23:33:35
樓下這位,不是完全開源,隻是代碼開源,數據和模型本身還是私有的,也就是你可以複製這麽個軀體,但得從頭教它學習。
TitaniumAtlas
發表評論於 2025-01-27 23:30:11
感覺有點玄學的意思,很好奇對於“習近平是獨裁者嗎”這樣一個問題它是如何頓悟的。
wd01702
發表評論於 2025-01-27 23:15:37
成本這麽低,時間這麽短,效果卻剛好和open ai相當。有那麽巧?openAI又不是智能的極限。
wd01702
發表評論於 2025-01-27 23:06:15
既然開源,其他人就可以重複。同樣的算法,更高算力的芯片,可以用更短的時間訓練出同樣的模型。就如同科學論文發現需要其他人重複來證明,如果我是做這行的,就會叫人按照開源算法從頭複製。是真是假,很快就有結果。
俺是農民
發表評論於 2025-01-27 21:26:47
樓下,我們這兒的計算機club, 還是有一些白人的,不過,你這回答跟我說的有什麽關聯嗎?
bigcatf4
發表評論於 2025-01-27 21:04:28
俺是農民 發表評論於 2025-01-27 20:40:49哈哈,其實它的出現,最重要的是告訴老川,他不需要讓別人投資5000個億了,最多隻需要五個億,剩下的近5000億還是搞美國的基建吧
------------
你這話確實像農民
我們小孩學校的計算機CLUB,一個白人黑人沒有,90%的印度人,剩下的華人韓國人
俺是農民
發表評論於 2025-01-27 20:40:49
哈哈,其實它的出現,最重要的是告訴老川,他不需要讓別人投資5000個億了,最多隻需要五個億,剩下的近5000億還是搞美國的基建吧。
wyx2000
發表評論於 2025-01-27 19:12:55
”DeepSeek-R1 Zero 有的隻是一套最簡單的獎勵係統,來激發AI的推理能力。“
又好又便宜,簡單又有效。所以那些AI的各種高手都是拋開簡單的搞一些複雜又低效的東西?
旁觀者XWY
發表評論於 2025-01-27 19:12:00
聰明學生做題舉一反三,給出多種解答方式。為什麽都是人類大腦,思維能力不同?
kingdale1
發表評論於 2025-01-27 18:32:47
這個和當年AlphaGo Zero 無師自通學出的圍棋套路一樣,天下無敵。
0101011
發表評論於 2025-01-27 18:30:58
內行看門道,外行看熱鬧
頁次:
1
/1
每頁
50
條記錄, 本頁顯示
1
到
23
, 共
23
分頁: [
1
]
生肖迷宮 發表評論於 2025-01-28 12:44:51世界AI人才的一半在中國,當中國與外國的開發思想不一樣,中國AI主要用於維護極權統治,以後Deep Seek會取代五毛黨,屆時又會有幾千萬人失業,那些腦殘粉紅五毛黨歡呼個啥勁,飯碗馬上就沒了