評論: 中國AI黑馬撼矽穀!DeepSeek創始人梁文峰經曆曝

隻有登錄用戶才能發表評論,點擊此處登錄    返回新聞帖
abcdaren 發表評論於 2025-01-28 07:25:00
轉發:
一,它是迄今最好的中文大模型平台,從理解能力和答案輸出能力來看,遠超此前百度的文心一言和抖音豆包。說掀翻ChatGPT尚顯誇張,但確實掀翻了國內的BAT和字節跳動,比起美國科技巨頭,更應該陷入恐慌的是國內互聯網大廠。
二、根據這位中國博士朋友的說法,deepseek基於開源的Transformer模型,而Transformer模型由穀歌開發。所以國內媒體宣傳deepseek“純自研”“純國產”是不準確的。而且deepseek的算力基礎仍然來源於英偉達顯卡。
中國內行朋友還透露deepseek團隊非常有錢,提前囤了1萬多張英偉達高端顯卡,而華科大和中科大的實驗室搞顯卡如今都不太容易。從網上公開信息看,DeepSeek擁有1萬張老的A100卡和3000張禁令之前的H800卡‌。按照H800顯卡20萬一片的價格,deepseek購買這3000張顯卡就花費了超6億元。成本不像說的那麽低。。。
也就是說,deepseek的軟硬件基礎仍然是基於美國產品之上。
三、目前使用下來最大的缺點是比老美慢,我輸出一句“你好”,它的“深度思考”時間就花費了8秒,基本一個問題想得到答案,需要等待幾十秒甚至幾分鍾時間,這和ChatGPT的“秒回”能力形成了鮮明對比。但deepseek的差異之處在於,它把原本置於後台的機器人“深度思考”程序,轉為前台公開化顯示,你可以理解為能部分掩蓋輸出答案的緩慢,也能理解為展現其“深度思考”功能的精妙和“人性化”。
四、此前ChatGPT被詬病簡中能力低下,一個原因是簡中文體用戶較少,導致抓取樣本數據少,但deepseek擁有的先天優勢是海量的中文數據抓取基礎,也能夠學習模擬不同的中文語氣和風格,比如可以生成“貼吧老哥體”“小紅書體”,你也可以通過輸入指令“言辭激烈或溫和”,來改變其文風。deepseek的寫作能力,已經大大降低了“AI味”。毫不誇張的說,deepseek未來可以取代大部分的公文寫作甚至社論寫作,這對評論員來說都是不小的挑戰。
五、和所有的國產大模型一樣,deepseek繞不開的是審核,特別是應對政治類曆史類問題。但令人詫異的是,deepseek的尺度遠超BAT和字節大模型,一些敏感信息也被抓取,比如詢問其對當前仿製藥問題的看法,它可以生出一篇言辭尖銳的批評性文章。
abcdaren 發表評論於 2025-01-28 07:11:16
聰明的訓練方法,硬件沒有太多突破。。。
這人的腦子不可小視。
老美的搞法太燒錢:正是時候檢討自己、迎頭趕上。。。使新科技更接地氣!!!
missC 發表評論於 2025-01-28 00:22:09
羅馬軍團 發表評論於 2025-01-27 13:21:27豬圈國的問題是民族人種能力的問題?是豬圈的問題,是把人當豬的問題。

+100
Daoao 發表評論於 2025-01-27 20:32:43
在論文裏,DeepSeek的訓練和其他的AI完全不同,它沒有預訓練和指導,直接給問題給AI,然後用一個簡單的獎勵機製來優化,我覺得是0到1,完全自己的創新。
S7Exam 發表評論於 2025-01-27 17:51:02
openGPT是啥? 是 chatGPT 二哥嗎, Google transformer又是啥 ?


旁觀者XWY 發表評論於 2025-01-27 17:38:00deepseek 的大模型訓練是建立在OpenGPT之上,行話叫distillation,是典型的1到2. 它用軟件大幅降低訓練成本,對英偉達台積電博通等硬件公司打擊最大。對衝基金籍口做空。
旁觀者XWY 發表評論於 2025-01-27 17:38:00
deepseek 的大模型訓練是建立在OpenGPT之上,行話叫distillation,是典型的1到2. 它用軟件大幅降低訓練成本,對英偉達台積電博通等硬件公司打擊最大。對衝基金籍口做空。
5mslj 發表評論於 2025-01-27 16:32:10
長劍倚天 發表評論於 2025-01-27 14:11:30
完全同意樓下capitaltwo網友的評論!
中國數理化人才濟濟,不論出國的還是在國內的,都是頂尖高手。
那麽,為什麽出國的,隻能成為打工人?
而留在國內的,反而出類拔萃?
製度,環境,文化的不同,才是深刻原因!
———————————
目前各領域,做出重大成績的,似乎和你說的完全相反啊。

按照你的意思,不用美國限製中國留學生了,中共自己就應該關上留學的大門,你有機會向你敬愛的習主席建議一下,看看他老人家什麽反應。
chinesegod3 發表評論於 2025-01-27 16:06:31
Daoao 發表評論於 2025-01-27 15:59:11DeepSeek是開源,它的論文在網上有,我看過,我覺得它這個應該算得上是0到1.
---------------------------------------------
每個開源的模型都有論文,這個可以說開源的模型裏麵最接近Chat GPT的,但訓練成本比Chat GPT低很多。用到的技術原則上還是已有的組合一下。所以不算0到1。
Daoao 發表評論於 2025-01-27 15:59:11
DeepSeek是開源,它的論文在網上有,我看過,我覺得它這個應該算得上是0到1.
chinesegod3 發表評論於 2025-01-27 15:57:23
青山留夕陽 發表評論於 2025-01-27 15:38:56今天高科技股確實經曆了前所未有的因稀有孤立事件的崩盤。顯然這家不起眼的公司折服了華爾街。
我好奇的:中國的科技曆來都屬於 1 到 100 的優化,鮮有 0 到1 的初創 - 那這次究竟算那個檔次?
-------------------------------------------------------------------------
顯然1到100啊,0到1是今年諾貝爾獎的幾位,還有google的transformer可能可以算一個。
S7Exam 發表評論於 2025-01-27 15:55:00
V3除了理工男,少有人關心新東西, R1也不能打動花街,AIME高分也不會觸動人們神經!但是當IOS APP下載 排行榜 NO1,這個是撼動main street的, wallstreet 就不能無視了



Yummy2000 發表評論於 2025-01-27 15:35:45應該是華爾街自己拿deepseek來砸盤。 deepseek 在12月26日就發布了這個東西,如果真牛的東西,早就上熱搜了。
青山留夕陽 發表評論於 2025-01-27 15:38:56
今天高科技股確實經曆了前所未有的因稀有孤立事件的崩盤。顯然這家不起眼的公司折服了華爾街。
我好奇的:中國的科技曆來都屬於 1 到 100 的優化,鮮有 0 到1 的初創 - 那這次究竟算那個檔次?
Yummy2000 發表評論於 2025-01-27 15:35:45
應該是華爾街自己拿deepseek來砸盤。 deepseek 在12月26日就發布了這個東西,如果真牛的東西,早就上熱搜了。

===========================================================
哈哈。台蛙隨便吠,三點不容質疑 ( 如果台蛙還有一點智商的話)
1. 經濟戰的珍珠港: 納指600點 3% , 被無名氏人一招擊垮。
2。 Stargate 成馬仕頓防線。
3. Deepseek 是open source, 他們根本沒想著吃肉,甚至沒想著喝湯,他們隻是掀翻桌子.
S7Exam 發表評論於 2025-01-27 15:35:33
1. 從V3發布, 觀點是懷疑, 認為是chatGPT套牌
2. 不到一個月, R1 發布, 業界錯愕之餘開始酸 text base only
3. 今天早晨 Janus Pro 7B 發布, 據R1 才幾天

台蛙都別吠,自己看看GitHub, 下個OLLAMA試試,然後找個犄角安靜的哭吧
S7Exam 發表評論於 2025-01-27 15:25:02
哈哈。台蛙隨便吠,三點不容質疑 ( 如果台蛙還有一點智商的話)
1. 經濟戰的珍珠港: 納指600點 3% , 被無名氏人一招擊垮。
2。 Stargate 成馬仕頓防線。
3. Deepseek 是open source, 他們根本沒想著吃肉,甚至沒想著喝湯,他們隻是掀翻桌子.
Yummy2000 發表評論於 2025-01-27 14:55:16
DeepSeek 是由 杭州深度求索人工智能基礎技術研究有限公司 開發的,股東是寧波程恩企業管理谘詢合夥企業 99%,梁文鋒 1%。

寧波程恩企業管理谘詢合夥企業的股東是:梁文鋒和寧波程信柔兆企業管理谘詢合夥企業 差不多各50%。

寧波程信柔兆企業管理谘詢合夥企業的股東依然是梁文鋒持股68.14%,其他股東是李歡、鄭達、陳哲等。

所以 DeepSeek 幾乎就是梁文鋒一個人的公司,持股在85%左右,它甚至跟幻方量化都沒直接關係,隻不過是同一個控製人而已
Yummy2000 發表評論於 2025-01-27 14:54:32
這把鐮刀又揮舞起來了,又要在A股市場興風作浪,韭菜們又要被血淋淋收割了。
Yummy2000 發表評論於 2025-01-27 14:50:03
成立2023年7月的公司,浙江人, 金融圈高手。。。。。。。


==========================================
DeepSeek的開發者為杭州深度求索人工智能基礎技術研究有限公司(簡稱“深度求索”),該公司成立於2023年7月份,由寧波程恩企業管理谘詢合夥企業(有限合夥)和梁文鋒共同持股。 據了解,深度求索背後的操盤手梁文鋒是金融圈成名已久的高手。

百家爭鳴2012 發表評論於 2025-01-27 14:42:51
新燕山夜話 發表評論於 2025-01-27 14:18:46長劍倚天 發表評論於 2025-01-27 14:11:30完全同意樓下capitaltwo網友的評論!
中國數理化人才濟濟,不論出國的還是在國內的,都是頂尖高手。
那麽,為什麽出國的,隻能成為打工人?
而留在國內的,反而出類拔萃?
製度,環境,文化的不同,才是深刻原因!
-----------------------------------------------------------------------
除了上麵的原因外,還有很多美國公司的領導位置,都被印三哥占著。中國人和三哥是天生的死對頭,你就是有才能,他也不會讓你發揮。為了防著你超過他,他們寧願讓企業成為下一個波音。
-------------------------------------
美國最喜歡族裔階層固化。不是因為三哥,而是因為那些猶太人根本就不會讓華人上位。
Tan7th 發表評論於 2025-01-27 14:41:00
龍芯V2?
新燕山夜話 發表評論於 2025-01-27 14:18:46
長劍倚天 發表評論於 2025-01-27 14:11:30完全同意樓下capitaltwo網友的評論!
中國數理化人才濟濟,不論出國的還是在國內的,都是頂尖高手。
那麽,為什麽出國的,隻能成為打工人?
而留在國內的,反而出類拔萃?
製度,環境,文化的不同,才是深刻原因!
-----------------------------------------------------------------------
除了上麵的原因外,還有很多美國公司的領導位置,都被印三哥占著。中國人和三哥是天生的死對頭,你就是有才能,他也不會讓你發揮。為了防著你超過他,他們寧願讓企業成為下一個波音。
長劍倚天 發表評論於 2025-01-27 14:11:30
完全同意樓下capitaltwo網友的評論!
中國數理化人才濟濟,不論出國的還是在國內的,都是頂尖高手。
那麽,為什麽出國的,隻能成為打工人?
而留在國內的,反而出類拔萃?
製度,環境,文化的不同,才是深刻原因!
土撥鼠撥土 發表評論於 2025-01-27 14:07:14
羅馬軍團 發表評論於 2025-01-27 13:19:09新燕山夜話 發表評論於 2025-01-27 13:03:4
7所以,中國人一定要對自己有自信。華為的任正非、阿裏的馬雲、騰訊的馬化騰、TicTok的張一鳴、Deepseek的梁文峰都是完全沒有任何國外教育背景的“土八路”。他們一點也不比矽穀那些靠華爾街資本扶植起來的美國人差。再說一遍,中國人你要有民族自信,特別是在這個中華重新騰飛的時代。

=

赤裸裸的種族主義,中國人你要有民族自信,你說哪個民族不該有民族自信?
-------
該有和有沒有是一回事兒?
Capitaltwo 發表評論於 2025-01-27 13:32:38
這都是製度優勢的結果,而梁文峰同期的同學出國後都沒有混出人樣來。
新燕山夜話 發表評論於 2025-01-27 13:25:02
羅馬軍團 發表評論於 2025-01-27 13:19:0
赤裸裸的種族主義,中國人你要有民族自信,你說哪個民族不該有民族自信?
---------------------------------------------------------------------------
何來種族主義一說?我希望所有的民族,都應當有自己的自信心。過去四十年裏,中國在公知殖人們的宣傳下,十分明顯缺乏民族自信。很多人竟認為中國人不適合搞高科技,隻能做低端製造業。現在這種錯誤的迷信被徹底打破了。
羅馬軍團 發表評論於 2025-01-27 13:21:27
豬圈國的問題是民族人種能力的問題?是豬圈的問題,是把人當豬的問題。
羅馬軍團 發表評論於 2025-01-27 13:19:09
新燕山夜話 發表評論於 2025-01-27 13:03:4
7所以,中國人一定要對自己有自信。華為的任正非、阿裏的馬雲、騰訊的馬化騰、TicTok的張一鳴、Deepseek的梁文峰都是完全沒有任何國外教育背景的“土八路”。他們一點也不比矽穀那些靠華爾街資本扶植起來的美國人差。再說一遍,中國人你要有民族自信,特別是在這個中華重新騰飛的時代。

=

赤裸裸的種族主義,中國人你要有民族自信,你說哪個民族不該有民族自信?
Yummy2000 發表評論於 2025-01-27 13:17:27
這些人,很多都是白手套。 任正非,馬雲是最典型的白手套。 馬雲靠後台,拿到了金融牌照,建立金融產業帝國。

=========================================================
新燕山夜話 發表評論於 2025-01-27 13:03:47所以,中國人一定要對自己有自信。華為的任正非、阿裏的馬雲、騰訊的馬化騰、TicTok的張一鳴、Deepseek的梁文峰都是完全沒有任何國外教育背景的“土八路”。他們一點也不比矽穀那些靠華爾街資本扶植起來的美國人差。再說一遍,中國人你要有民族自信,特別是在這個中華重新騰飛的時代。
狄更絲 發表評論於 2025-01-27 13:05:00
讓子彈飛一會
新燕山夜話 發表評論於 2025-01-27 13:03:47
所以,中國人一定要對自己有自信。華為的任正非、阿裏的馬雲、騰訊的馬化騰、TicTok的張一鳴、Deepseek的梁文峰都是完全沒有任何國外教育背景的“土八路”。他們一點也不比矽穀那些靠華爾街資本扶植起來的美國人差。再說一遍,中國人你要有民族自信,特別是在這個中華重新騰飛的時代。
相信事實 發表評論於 2025-01-27 12:54:28
這個新模型砸得今天美國娜指狂跌700點!牛逼。

因為新算法比美國的AI模型效率高一個數量級,導致美國嚴重關切中國的發展速度超過美國。
城頭散仙 發表評論於 2025-01-27 12:53:16
活該美帝把高科技產業拱手讓給老印度混混們。。。
duty 發表評論於 2025-01-27 12:40:57
這個要讚。
頁次:1/1 每頁50條記錄, 本頁顯示133, 共33  分頁:  [1]