評論: 中國用“蒸餾術”構建OpenAI競爭模型?專家:難製止

隻有登錄用戶才能發表評論,點擊此處登錄    返回新聞帖
大豬頭- 發表評論於 2025-01-31 18:19:11
如果是咱文學城論壇群眾有五萬張H100, 咱早就主動向咱爹舉報自己了. 那個所謂的DeepSeek居然還要自己開發模型,這是不把民主自由當回事啊.
半島人 發表評論於 2025-01-31 16:13:41
西方媒體現在還有多少新聞是真實的?你要問 ChatGPT 哪裏發生了種族滅絕:是在新疆還是加沙,ChatGPT 肯定回答是在新疆而不是加沙,這就是西方媒體,早就沒有什麽真實和虛假,一切以 CIA 和猶太媒體大佬的口令定真假。
obamacome 發表評論於 2025-01-31 11:13:03
H100官方價$35000,黃牛市場價$50000以上。因為需要50000塊h100才能構建出GPT-5是早先的預言,所以DS也必須的湊夠50000塊才能運行,哈哈,緣來如此緣來如此緣來如此緣來如此。。。。。。
obamacome 發表評論於 2025-01-31 10:53:06
DeepSeek顯然擁有50,000顆H100芯片,但他們顯然不能公開這些信息,因為那會違反美國的出口管製。”汪滔沒有為他的說法提供證據。

汪滔沒有為他的說法提供證據汪滔沒有為他的說法提供證據汪滔沒有為他的說法提供證據.......

DS初創小公司自己能買下50000塊H100,禁止了渠道暫先不論,它錢是從哪來的?你咋不說是習近平從國庫出錢資助DS買的,這豈不更有可信度?
wumiao 發表評論於 2025-01-31 09:48:00
ZT:一個客觀理性對 deep seek 的分析。按中國人的智商,應該有成百上千個 Elon Musk 。然而缺乏這樣的土壤....。 說到底,還是兩種製度的競爭。從長遠來看,法律和誠信才是取勝的關鍵所在。
真環 發表評論於 2025-01-31 08:27:03
過程 Open AI 做完作業的答案被DS抄走了,傻X按照答案又推了一遍。OpenAI 沒答案的,傻X也做不出來或者傻X做不對。
糖醋鯉魚 發表評論於 2025-01-31 08:20:25
告訴你個不幸的消息,英偉達上線DS的ai模型了,嗬嗬。。。

---------
wumiao 發表評論於 2025-01-31 07:45:41如果你把這幾十年遙遙領先的新聞放在一起對比,會發現一個驚人的規律,每當國外出現什麽重大的科技變革,我們這邊都會立馬有公司宣布遙遙領先。然而過了一段時間以後,你又會發現好像一瞬間再也聽不到這些消息了。”
西岸-影 發表評論於 2025-01-31 08:16:53
這就像假如你想做出什麽力學模型,你需要自己發現牛頓定律一樣,否則就是抄襲。
wumiao 發表評論於 2025-01-31 07:45:41
如果你把這幾十年遙遙領先的新聞放在一起對比,會發現一個驚人的規律,每當國外出現什麽重大的科技變革,我們這邊都會立馬有公司宣布遙遙領先。然而過了一段時間以後,你又會發現好像一瞬間再也聽不到這些消息了。”
==========================
估計不久這個深度探索就深度消失了,因為畢竟偷盜來的東西,如果別人不讓它偷,它就會餓死的。
或者這貨就隻能在國內內循環。
美國國會正在立法要和中國完全斷絕科技支持,包括最低等的芯片也不允許出口中國,這就是深度探索招搖過後的結果。
另外這個深度探索說自己的開發多麽省錢,現在已經查出光它偷買的英偉達芯片就花了幾十億美元,絕對不是隻有5000萬美元的吹噓。一個隻有四個人有五險一金的名不見經傳的小公司,怎麽可能拿出這麽多錢來搞一個免費的東西?這就是一個國家參與的搶奪世界科技資源的行為。
糖醋鯉魚 發表評論於 2025-01-31 07:09:48
DS開源的做法很聰明,這讓無數小型ai公司有機會提供低成本的訓練模型打破這些openai大公司的壟斷。挺好的,嗬嗬。
糖醋鯉魚 發表評論於 2025-01-31 07:06:54
笑死了,一個100多人的杭州公司硬要說人家有幾萬顆英偉達芯片。不就是為了替自己效率低下的ai訓練模型找借口麽,哈哈哈。。。
麥迪拉 發表評論於 2025-01-31 07:03:04
Open ai 偷了全世界的數據, 分文不付
TXZS 發表評論於 2025-01-31 06:42:47
“有證據表明DeepSeek使用OpenAI專有模型來訓練自己的模型,並暗示這可能違反了OpenAI服務條款。美商務部長提名人盧特尼克指責DeepSeek似乎盜用了美國的人工智能技術。新聞可靠性評級機構NewsGuard 稱,Deepseek-V3識別假新聞隻有17%的準確率。”

不矛盾嗎?前麵說DS偷了OpenAI的技術,後麵又說準確率差,到底偷了沒有?還是OpenAI也很差,造成了DS差?
真環 發表評論於 2025-01-31 06:35:46
中國就是美國的蒸餾器,哪止AI。
xiaoxiao雨 發表評論於 2025-01-31 06:34:28
nobody wants to be a rat.
ajaychen_2024 發表評論於 2025-01-31 06:23:00
這個是有聯係的類似案例,OPEN AI 不敢將DS告上法庭,否則這些案例會被他的其他官司的原告反過來告他,那這賠款可多得多。

橡皮潛艇 發表評論於 2025-01-31 06:16:11一碼歸一碼,別搗漿糊
ajaychen_2024 發表評論於 2025-01-31 06:12:16
那open AI 的六個官司正在等著它呢,誰先吃癟還不一定呢

橡皮潛艇 發表評論於 2025-01-31 05:54:58ln2020 發表評論於 2025-01-31 05:49:03 天下AI一大抄,如果來源都付版稅,連OpenAI也早破產百遍不止了:)
DS貢獻主要在算法。

DS的所作所為明顯違反了openai關於共享的T@C,等著吃告
ajaychen_2024 發表評論於 2025-01-31 05:49:06
行了行了,你說是就是了,ok

橡皮潛艇 發表評論於 2025-01-31 05:46:04你一人一家,別扯別人
ln2020 發表評論於 2025-01-31 05:49:03
天下AI一大抄,如果來源都付版稅,連OpenAI也早破產百遍不止了:)
DS貢獻主要在算法。
ajaychen_2024 發表評論於 2025-01-31 05:40:23
是是是,你說是就是,咱們是一家的,高興了吧?

橡皮潛艇 發表評論於 2025-01-31 04:55:55ajaychen_2024 發表評論於 2025-01-31 04:51:12 哈哈哈,雖然我比較傾向認同他們觀點,但是,你猜錯了。

橡皮潛艇 發表評論於 2025-01-31 04:47:28ajaychen_2024 發表評論於 2025-01-31 02:55:36


廣而告之:這個就是“相信事實”,更前也叫“八戒”的另一個馬甲。
大家應心中有數。

你就是。燒成灰也跑不了
亞洲食肉動物 發表評論於 2025-01-31 05:28:00
想起很多年前一個神人搞的bi Google du。輸入搜索詞後,屏幕一分兩塊,一邊Google,一邊百度。這個網站大概活了一年多,被封了
smart321 發表評論於 2025-01-31 05:12:44
中國總是研究別人的技術和數據庫想從中快速的獲得自己需要的東西,這就是模仿,模仿有可能接近但永遠無法超越,這種投資和發展在很多國家看來是沒有意義的,因為你無法得到廣泛市場的認同無法獲得利益,而且還有法律訴訟。但是中國有意義,因為中國是一個封閉市場,國外AI 應有無法在中國使用,而中國這些山寨的東西就能獲得市場和利益,他們並不想到國際上發展
ajaychen_2024 發表評論於 2025-01-31 04:52:47
英偉達(NVDA)今天(31日)早上發表最新消息,表示NVIDIANIM已經可以使用DeepSeek-R1。
英偉達官網發文表示,DeepSeek-R1是一個具備最先進推理能力的開放模型。與其直接提供回應,像DeepSeek-R1這樣的推理模型會對查詢進行多次推理處理,使用連鎖思維、共識和搜尋方法來生成最佳答案。
文章中指出,為了幫助開發者安全地試驗這些功能並構建他們自己的專門代理,
DeepSeek-R1模型現在可作為NVIDIANIM微服務預覽版上使用。開發者可以測試和試驗應用程序介麵(API),該介麵預計將很快作為可下載的NIM微服務提供,這是NVIDIAAI Enterprise軟件平台的一部分。
ajaychen_2024 發表評論於 2025-01-31 04:51:12
哈哈哈,雖然我比較傾向認同他們觀點,但是,你猜錯了。

橡皮潛艇 發表評論於 2025-01-31 04:47:28ajaychen_2024 發表評論於 2025-01-31 02:55:36


廣而告之:這個就是“相信事實”,更前也叫“八戒”的另一個馬甲。
大家應心中有數。
ajaychen_2024 發表評論於 2025-01-31 02:55:36
樓下的表明美國的遠程養殖業還是遙遙領先啊,中國果然是永遠也趕不上。在美國網上各平台,大部分英文的評論都是比較客觀的,大部分肯定DEEPSEEK的實力和真實性,而一邊倒抹黑逢中必反的大部分來自中文用戶,尤其是公知高華恨國黨和1450團體。說一個開源的模型是抄襲是有多低的智商。

deepseek比其他模型更高效的其中一個主要原因是因為用中文語言作為大模型訓練底層結構,中文比英文的信息量高出一個數量級,這也是DS高效的原因之一
會當淩絕頂1 發表評論於 2025-01-31 01:55:00
網友評論、網友文字如下。

問題的關鍵是,在如此短的時間裏,如此低成本,DeepSeek是怎麽做到的?

業內普遍認為:DeepSeek的迅速崛起,皆因不光彩地違規非法蒸餾、偷竊數據、盜用、“山寨”、“整合”他人的模型所致。

彭博社28日報道,微軟和OpenAI正在調查與DeepSeek有關的人,他們在2024年秋天就發現,有人用不正當的手段通過OpenAI的API輸出了大量數據,他們或與DeepSeek有關。

英國的金融時報也於28日報道,OpenAI表示,他們已掌握了證據,證明DeepSeek涉嫌利用所謂的“蒸餾”(distillation)技術盜用其數據進行開發。

對此,業外人士不免感到困惑,因為開發人員是可以通過付費購買許可證的方式,來使用API將OpenAI的專有AI模型集成進自己的應用程序中,這難道不合法?

況且,OpenAI不是鼓勵用戶大量使用它的模型和數據嗎?

既如此,何來不正當、非法、違規和盜用一說呢?

問題的核心在於:你是怎麽利用這些資源的。

OpenAI在開放自己的數據和應用時,並不是無條件開源的,它是有明確的限製條款的。

換句話說,OpenAI的開放前提是說:你可以使用我的訓練數據,在我的訓練模型基礎上,來開發完成你所需要的各類應用,而非是以構建自己的訓練模型為目的,達到未來與我競爭的目的。

而所謂的“蒸餾”技術,正是利用像OpenAI這樣的功能強大的大模型,以及通過長期投入所積累而成的大數據,來訓練屬於自己的較小模型,通過“蒸餾”濃縮的方式,在自己的模型上,以更低的成本、更短的時間取得更好的效能。

這在OpenAI的開放限製條款中,明顯是違法的。

這,或許才是DeepSeek之所以能夠在短時間內,以極低的成本達到可與OpenAI比肩的真正原因。

更進一步,美國人認為,有關中國實體企業在通過“蒸餾”技術訓練自己模型的同時,還竊取了大量數據,而這些數據有可能對美國的安全構成威脅。所以不少人對於這種潛在的侵權行為,以及所帶來的安全問題深表擔憂。

也許有人會爭辯,你憑什麽說DeepSeek是盜用、抄襲?有證據嗎?有!大量證據!

DeepSeek的很多回答,與人們向OpenAI提問所得到的回答一模一樣!也就是說,DeepSeek真正的原始數據來源,就是OpenAI的數據庫。

僅僅改變提問方式就使得抄襲者原形畢現,可不可以抄襲得高明一點,不要這麽赤裸裸!

據說胡錫進也看不下去了,不惜站出來洗地,意思是孔乙己的那句話:竊書者不能算是偷。

結果成了越描越黑,這等於承認了偷的行為。

說到這種行為,美國人有治嗎?

答案是:好像沒有。

如果像類似DeepSeek這樣的事發生在美國或英國,如此高調的宣傳,以及如此有影響的公司和事件,這足以將你送上法庭,不罰你個底兒掉就不算完。

但是在別國,情形可能完全不同。不但不會感到恥辱,而且會被視為一種愛國行為,能夠獲得億萬個點讚!

這分明就是兩個平行世界!

從小在學校就被告知:天下文章一大抄!隻要你抄的,水平高,抄的藝術,不但不會影響到你的信用,而且會成為人人羨慕的英雄!

看看某些人甚至很多人,詭辯,狡辯,小偷邏輯,不以為恥,反以為榮!
京西觀察使 發表評論於 2025-01-31 01:32:30
對,支持用大棒揍它
—//—
TitaniumAtlas 發表評論於 2025-01-30 23:29:31
違反用戶協議,這就是盜竊行為,美國政府不可能袖手旁觀,大棒落下隻是時間問題
ajaychen_2024 發表評論於 2025-01-31 00:49:42
微軟一邊說ds偷數據,一邊又將ds加入自己的客戶的AI資源庫中,是幾個意思啊?

微軟 CEO Nadella 稱讚 DeepSeek,並將其提供給客戶在 Azure AI Foundry 上使用
微軟公司 CEO Satya Nadella 對中國人工智能初創公司 DeepSeek 表示了積極評價。該公司最近推出的開源人工智能模型 R1 引起了美國科技界的廣泛關注,令微軟的股價大跌。

***view.inews.qq***/k/20250131A00SB800?web_channel=wap&openApp=false
size0 發表評論於 2025-01-30 22:32:59
這種大語言模型訓練出來的AI不都是靠相互蒸餾成就的嗎?我們用AI搜索難道不是一種數據蒸餾?!憑什麽給中國公司扣帽子?人家技術行就是行!DeepSeek的最大不問題不是技術以及如何通過學習Open AI發展自己技術的問題,而是它的產品會不會被中國以外市場,特別是外國科技公司以及政府部門信任的問題。華為在歐美市場份額的迅速消失難道不是信任問題造成的?跟技術以及華為技術怎麽來的有關係嗎?!
競選 發表評論於 2025-01-30 22:02:41
喜歡折騰 發表評論於 2025-01-30 21:38:31奇怪,如果中國的什麽“蒸餾術”是偷用你的,那你為什麽不早點用中國的這個“蒸餾術”呢?你也是承認這個術管用了?
---------
OpenAI一直在用,他們的chatGPT就是這樣從低版本一步一步更新到了現在的版本。他們可以這樣做,因為他們有權利這樣做,都是自己的模型,不存在侵犯版權問題,他們有比“蒸餾法”更直接、快速、低成本的做法。但其它公司這樣做構造自己的產品,就違法了。

雖然OpenAI更新其chatGPT版本的成本很低,但他們不能像DS那樣低價向用戶提供服務,因為OpenAI在初始開發chatGPT低版本時投入巨大。DS則沒有這個初期成本,所以他們可以以低價向用戶提供服務,從而以低價打敗chatGPT.
tudoutudou99 發表評論於 2025-01-30 21:53:28
很快就有另外一家公司花50萬元建成模型,怎麽做到的?
直接花錢買通 DeepSeek 的工程師,最省錢,最快捷
喜歡折騰 發表評論於 2025-01-30 21:38:31
奇怪,如果中國的什麽“蒸餾術”是偷用你的,那你為什麽不早點用中國的這個“蒸餾術”呢?你也是承認這個術管用了?
真想發言 發表評論於 2025-01-30 21:05:02
地球人都呼吸了美國人呼吸的空氣,大家把美國空氣給“隔離”了吧,免得地球人都盜竊了美國的空氣
Maui2021 發表評論於 2025-01-30 20:44:03
你估計還支持200斤,人類命運共同體。

luting 發表評論於 2025-01-30 20:27:04應該鼓勵各個模型之間的互相學習比較,談不上盜竊數據,如果這也算盜竊,OpenAI從各大網站和書本上學習就更算了。我支持開源,不相信被有錢人大公司操縱的AI,尤其是OpenAI。建議改名CloseAI,把OpenAI商標送給Deepseek, 不用掛羊頭賣狗肉。
tony0101 發表評論於 2025-01-30 20:38:00
類似於一個搜索引擎其實是跑去google搜索
天乙貴人 發表評論於 2025-01-30 20:32:10
這個很簡單,如果一個ip address連續調用openAI的api3個小時以上,就把它列入黑名單,把它斷開。
luting 發表評論於 2025-01-30 20:27:04
應該鼓勵各個模型之間的互相學習比較,談不上盜竊數據,如果這也算盜竊,OpenAI從各大網站和書本上學習就更算了。我支持開源,不相信被有錢人大公司操縱的AI,尤其是OpenAI。建議改名CloseAI,把OpenAI商標送給Deepseek, 不用掛羊頭賣狗肉。
小毛er 發表評論於 2025-01-30 19:36:22
競選 發表評論於 2025-01-30 19:16:39隻要供人用,就可能被利用。

是否可以限定使用次數,每天20次。
===========================
沒有用的。他們可以用1百萬個假用戶。每個假用戶每天問20個問題。那就是每天2千萬條訓練數據了。
llq中美18 發表評論於 2025-01-30 19:26:00
似乎 懷疑 可能
競選 發表評論於 2025-01-30 19:16:39
隻要供人用,就可能被利用。

是否可以限定使用次數,每天20次。
頁次:1/1 每頁50條記錄, 本頁顯示140, 共40  分頁:  [1]