評論:特朗普AI顧問：DeepSeek抄襲ChatGPT

fkcom 發表評論於 2025-01-30 08:29:35

``

TXZS 發表評論於 2025-01-30 06:43:08

今年的葡萄真特麽酸

TXZS 發表評論於 2025-01-30 06:41:53

“有大量證據表明。。。” ？

證據在哪兒呢？拿給瓜民們看看唄？

不會又是一袋洗衣粉吧？

會當淩絕頂1 發表評論於 2025-01-30 06:21:32

DeepSeek “深度尋找”：蒸餾，偷竊數據，盜用模型，隱瞞使用大量GPU芯片……

ajaychen_2024 發表評論於 2025-01-30 04:02:26

“可能，也許或者，if， maybe”，又拿不出實證，莫須有罷了，AI業界要向投入幾千億美元的資本大佬交待啊

玻璃坊 發表評論於 2025-01-30 03:23:18

David Sacks原話沒有“抄襲”兩個字、也沒有暗示抄襲。
不知道標題上抄襲兩個字是怎麽來的

ajaychen_2024 發表評論於 2025-01-30 02:16:36

科普一下

大模型的#蒸餾(Distillation) 及#DeepSeek遭遇的指控
***youtu.be/jsLdkrM6RB8?si=m4Qz0BJNkk9X0-6K

Maui2021 發表評論於 2025-01-30 00:25:34

既然是抄作業，那架構和訓練時間都沒意義了。直接作弊，直接當然快。

罵人不好發表評論於 2025-01-29 19:44:38目前好像主要是集中在DS的數據蒸餾上，對於她的架構和代碼並沒有什麽爭議。transformer 是流行的架構，DS的代碼是開源的。如果用了別的模型的數據蒸餾之後來訓練自己的模型，想想是能夠減少數據量，縮短訓練時間，對於GPU的性能要求也可以降低。如果用於數據蒸餾的數據沒有授權，估計會有問題。

worley 發表評論於 2025-01-29 23:17:05

中共獨裁集團真無恥。

如果可以這麽偷數據，美國的其它AI公司為啥不做？
搜索引擎搜集的是公開數據，如果不小心用了有版權的數據，也會吃官司。

這些公開數據價值並不大，因為隻有信息而沒有答案。
有價值的是“問題，答案，推理思路”，這在互聯網上是搜不到的，都是需要購買的。數據科學家還要測試、驗證，保證答案正確，保證推理思路正確。
而DeepSeek直接偷數據，成本就是零了。

znggg 發表評論於 2025-01-29 22:52:50

deepseek用了chatgpt汙染的數據源，造成deepseek回答自己是chatgpt，這個在很多LLM中發生過，責任在chatgpt

河西海龜 發表評論於 2025-01-29 21:52:00

OpenAI偷全世界的，DeepSeek偷OpenAI的。

edccde 發表評論於 2025-01-29 21:20:57

ChatGPT抄襲全部的互聯網啊，好幾個起訴他侵權的官司還在打呢，在這裏裝什麽小天真。

泥川發表評論於 2025-01-29 20:20:58

DeepSeek R1已被提煉到 Llama 70B （Meta 開發的AI模型）中，據基準和人工評估，通過R1改進的Llama 70B 比原來的更智能，並且在需要數學和事實精度的任務上表現尤為出色。

使用 DeepSeek-R1 生成的樣本對 Llama70B 進行微調的版本，現已在 GroqCloud 上線，用於實時推理。

泥川發表評論於 2025-01-29 20:07:49

微軟 AI 平台副總裁 By Asha Sharma 表示：“在 Azure AI Foundry 上使用 DeepSeek R1 或任何其他模型的主要優勢之一是開發人員可以快速試驗、迭代並將 AI 集成到他們的工作流程中。”“DeepSeek R1 經過了嚴格的紅隊測試和安全評估，包括對模型行為的自動評估和廣泛的安全審查，以減輕潛在風險。”

R1 最初於本月初作為開源模型發布，微軟以驚人的速度將其集成到 Azure AI Foundry 中。該軟件製造商還將很快推出精簡版的 R1，供 Copilot Plus PC 本地運行，我們甚至有可能看到 R1 出現在微軟的其他 AI 服務中。

愛閱讀的人 發表評論於 2025-01-29 19:54:00

千萬別被這些人帶偏了，中國在2026 初還會上線更牛的，美國自己把產品做的更好才是硬道理. 良性競爭對市場是非常必要的.

罵人不好 發表評論於 2025-01-29 19:52:30

OpenAI如果想，可以用她的代碼和自己的蒸餾後的數據試一下，看能不能複刻她的那些RL的效果和頓悟的現象。如果完全不能，那就像blue tag網友說的，開源的代碼可能就沒有什麽意義。

不過模型已經訓練出來了，周末有時間在自己的機器上裝一個小的，可以和其它的模型對比著用，對於一般用戶也不是什麽壞事。反正我也不會取消ChatGPT的訂閱。

罵人不好 發表評論於 2025-01-29 19:44:38

目前好像主要是集中在DS的數據蒸餾上，對於她的架構和代碼並沒有什麽爭議。transformer 是流行的架構，DS的代碼是開源的。如果用了別的模型的數據蒸餾之後來訓練自己的模型，想想是能夠減少數據量，縮短訓練時間，對於GPU的性能要求也可以降低。如果用於數據蒸餾的數據沒有授權，估計會有問題。

bluetag 發表評論於 2025-01-29 19:34:00

開源不開源並不重要，也沒有人會對它的源代碼感興趣，大家感興趣的是它到底用了什麽訓練數據，它不公開訓練數據，你就沒法驗證它公開的源代碼是不是真實的，也沒法驗證它聲稱的成本是不是真實的，如果它的數據是偷來的，那它就沒有任何價值，因為它的表現也沒有超過之前的模型，頂多就是重複了別人的工作。

時不時來看看 發表評論於 2025-01-29 19:14:15

openai：人家把代碼都拿出來了，也沒有收費，還要咋樣？

是不是讓他們閉源，然後還給微軟？怎麽BillGates的後代也變強權了，以前都是收購，然後慢慢滅掉，比如IE，現在要幹啥？

長劍倚天 發表評論於 2025-01-29 19:13:47

看來大嘴又被騙了！
什麽顧問，解雇他！

speedingticket 發表評論於 2025-01-29 19:12:17

什麽抄襲不抄襲的，無非是看到中國的進步，自己趕不上，隻能找些借口，騙人騙己罷了。
ds是在chatgpt的基礎上，更進一步，便宜實惠，好用
所有的科研論文都是在別人的成果的基礎上,進一步深入研究的結果，論文後麵有一大堆參考文獻，你能說這個考研論文是抄襲參考文獻的？
中國過去沒有電動車，你能說中國的電動車都是抄襲外國的？

bluetag 發表評論於 2025-01-29 19:01:00

自稱自己是ChatGPT已是鐵證，不用抵賴了。

worley 發表評論於 2025-01-29 18:58:30

代碼是用Meta和其它開源軟件修改的，數據是從ChatGPT非法提取的。

lue96500 發表評論於 2025-01-29 18:53:59

1 你設限、不民主、不自由
2 客戶資料不安全
3 你抄我的
絕口不提任何技術問題

supernova13 發表評論於 2025-01-29 18:52:50

關於“如果你問它你是什麽模型，它會說，‘我是 ChatGPT’” 油管上有老美解釋過，是正常現象。ChatGPT也曾自稱是別的模型。訓練模型需要海量數據，借用重疊很正常。就好比有一個著名棋譜，所有下棋的AI都會研究吸收。

viBravo5 發表評論於 2025-01-29 18:48:25

看來這是一次中美AI戰中的珍珠港事件

新燕山夜話 發表評論於 2025-01-29 18:36:57

什麽混蛋顧問？ChatGPT根本就不開源，沒人知道其源代碼，怎麽抄襲？

評論: 特朗普AI顧問：DeepSeek抄襲ChatGPT