評論: 特朗普AI顧問:DeepSeek抄襲ChatGPT

隻有登錄用戶才能發表評論,點擊此處登錄    返回新聞帖
fkcom 發表評論於 2025-01-30 08:29:35
``
TXZS 發表評論於 2025-01-30 06:43:08
今年的葡萄真特麽 酸
TXZS 發表評論於 2025-01-30 06:41:53
“有大量證據表明。。。” ?

證據在哪兒呢?拿給瓜民們看看唄?

不會又是一袋洗衣粉吧?
會當淩絕頂1 發表評論於 2025-01-30 06:21:32
DeepSeek “深度尋找”:蒸餾,偷竊數據, 盜用模型,隱瞞使用大量GPU芯片……
ajaychen_2024 發表評論於 2025-01-30 04:02:26
“可能,也許 或者,if, maybe”,又拿不出實證,莫須有罷了,AI業界要向投入幾千億美元的資本大佬交待啊
玻璃坊 發表評論於 2025-01-30 03:23:18
David Sacks原話沒有“抄襲”兩個字、也沒有暗示抄襲。
不知道標題上抄襲兩個字是怎麽來的
ajaychen_2024 發表評論於 2025-01-30 02:16:36
科普一下

大模型的#蒸餾(Distillation) 及#DeepSeek遭遇的指控
***youtu.be/jsLdkrM6RB8?si=m4Qz0BJNkk9X0-6K
Maui2021 發表評論於 2025-01-30 00:25:34
既然是抄作業,那架構和訓練時間都沒意義了。直接作弊,直接當然快。

罵人不好 發表評論於 2025-01-29 19:44:38目前好像主要是集中在DS的數據蒸餾上,對於她的架構和代碼並沒有什麽爭議。transformer 是流行的架構,DS的代碼是開源的。如果用了別的模型的數據蒸餾之後來訓練自己的模型,想想是能夠減少數據量,縮短訓練時間,對於GPU的性能要求也可以降低。如果用於數據蒸餾的數據沒有授權,估計會有問題。
worley 發表評論於 2025-01-29 23:17:05
中共獨裁集團真無恥。

如果可以這麽偷數據,美國的其它AI公司為啥不做?
搜索引擎搜集的是公開數據,如果不小心用了有版權的數據,也會吃官司。

這些公開數據價值並不大,因為隻有信息而沒有答案。
有價值的是“問題,答案,推理思路”,這在互聯網上是搜不到的,都是需要購買的。數據科學家還要測試、驗證,保證答案正確,保證推理思路正確。
而DeepSeek直接偷數據,成本就是零了。
znggg 發表評論於 2025-01-29 22:52:50
deepseek用了chatgpt汙染的數據源,造成deepseek回答自己是chatgpt,這個在很多LLM中發生過,責任在chatgpt
河西海龜 發表評論於 2025-01-29 21:52:00
OpenAI偷全世界的,DeepSeek偷OpenAI的。
edccde 發表評論於 2025-01-29 21:20:57
ChatGPT抄襲全部的互聯網啊,好幾個起訴他侵權的官司還在打呢, 在這裏裝什麽小天真。
泥川 發表評論於 2025-01-29 20:20:58
DeepSeek R1已被提煉到 Llama 70B (Meta 開發的AI模型)中,據基準和人工評估,通過R1改進的Llama 70B 比原來的更智能,並且在需要數學和事實精度的任務上表現尤為出色。

使用 DeepSeek-R1 生成的樣本對 Llama70B 進行微調的版本,現已在 GroqCloud 上線,用於實時推理。
泥川 發表評論於 2025-01-29 20:07:49
微軟 AI 平台副總裁 By Asha Sharma 表示:“在 Azure AI Foundry 上使用 DeepSeek R1 或任何其他模型的主要優勢之一是開發人員可以快速試驗、迭代並將 AI 集成到他們的工作流程中。”“DeepSeek R1 經過了嚴格的紅隊測試和安全評估,包括對模型行為的自動評估和廣泛的安全審查,以減輕潛在風險。”

R1 最初於本月初作為開源模型發布,微軟以驚人的速度將其集成到 Azure AI Foundry 中。該軟件製造商還將很快推出精簡版的 R1,供 Copilot Plus PC 本地運行,我們甚至有可能看到 R1 出現在微軟的其他 AI 服務中。
愛閱讀的人 發表評論於 2025-01-29 19:54:00
千萬別被這些人帶偏了, 中國在2026 初還會上線更牛的,美國自己把產品做的更好才是硬道理. 良性競爭對市場是非常必要的.
罵人不好 發表評論於 2025-01-29 19:52:30
OpenAI如果想,可以用她的代碼和自己的蒸餾後的數據試一下,看能不能複刻她的那些RL的效果和頓悟的現象。如果完全不能,那就像blue tag網友說的,開源的代碼可能就沒有什麽意義。

不過模型已經訓練出來了,周末有時間在自己的機器上裝一個小的,可以和其它的模型對比著用,對於一般用戶也不是什麽壞事。反正我也不會取消ChatGPT的訂閱。
罵人不好 發表評論於 2025-01-29 19:44:38
目前好像主要是集中在DS的數據蒸餾上,對於她的架構和代碼並沒有什麽爭議。transformer 是流行的架構,DS的代碼是開源的。如果用了別的模型的數據蒸餾之後來訓練自己的模型,想想是能夠減少數據量,縮短訓練時間,對於GPU的性能要求也可以降低。如果用於數據蒸餾的數據沒有授權,估計會有問題。
bluetag 發表評論於 2025-01-29 19:34:00
開源不開源並不重要,也沒有人會對它的源代碼感興趣,大家感興趣的是它到底用了什麽訓練數據,它不公開訓練數據,你就沒法驗證它公開的源代碼是不是真實的,也沒法驗證它聲稱的成本是不是真實的,如果它的數據是偷來的,那它就沒有任何價值,因為它的表現也沒有超過之前的模型,頂多就是重複了別人的工作。
時不時來看看 發表評論於 2025-01-29 19:14:15
openai:人家把代碼都拿出來了,也沒有收費,還要咋樣?

是不是讓他們閉源,然後還給微軟?怎麽BillGates的後代也變強權了,以前都是收購,然後慢慢滅掉,比如IE,現在要幹啥?
TitaniumAtlas 發表評論於 2025-01-29 19:14:07
純屬洗地,從來沒有過

supernova13 發表評論於 2025-01-29 18:52:50 關於“如果你問它你是什麽模型,它會說,‘我是 ChatGPT’” 油管上有老美解釋過,是正常現象。ChatGPT也曾自稱是別的模型。訓練模型需要海量數據,借用重疊很正常。就好比有一個著名棋譜,所有下棋的AI都會研究吸收。
長劍倚天 發表評論於 2025-01-29 19:13:47
看來大嘴又被騙了!
什麽顧問,解雇他!
TitaniumAtlas 發表評論於 2025-01-29 19:13:08
不是抄襲,是偷竊
speedingticket 發表評論於 2025-01-29 19:12:17
什麽抄襲不抄襲的,無非是看到中國的進步,自己趕不上,隻能找些借口,騙人騙己罷了。
ds是在chatgpt的基礎上,更進一步,便宜實惠,好用
所有的科研論文都是在別人的成果的基礎上,進一步深入研究的結果,論文後麵有一大堆參考文獻,你能說這個考研論文是抄襲參考文獻的?
中國過去沒有電動車,你能說中國的電動車都是抄襲外國的?
bluetag 發表評論於 2025-01-29 19:01:00
自稱自己是ChatGPT已是鐵證,不用抵賴了。
worley 發表評論於 2025-01-29 18:58:30
代碼是用Meta和其它開源軟件修改的,數據是從ChatGPT非法提取的。
lue96500 發表評論於 2025-01-29 18:53:59
1 你設限、不民主、不自由
2 客戶資料不安全
3 你抄我的
絕口不提任何技術問題
supernova13 發表評論於 2025-01-29 18:52:50
關於“如果你問它你是什麽模型,它會說,‘我是 ChatGPT’” 油管上有老美解釋過,是正常現象。ChatGPT也曾自稱是別的模型。訓練模型需要海量數據,借用重疊很正常。就好比有一個著名棋譜,所有下棋的AI都會研究吸收。
viBravo5 發表評論於 2025-01-29 18:48:25


看來這是一次中美AI戰中的珍珠港事件
新燕山夜話 發表評論於 2025-01-29 18:36:57
什麽混蛋顧問?ChatGPT根本就不開源,沒人知道其源代碼,怎麽抄襲?
頁次:1/1 每頁50條記錄, 本頁顯示129, 共29  分頁:  [1]