OpenAI: 有證據表明,其模型幫助訓練了中國的 DeepSeek

OpenAI 有證據表明,其模型幫助訓練了中國的 DeepSeek |

中國人工智能公司 DeepSeek 發布了開發成本低廉的 AI 模型,與 OpenAI 的旗艦產品競爭,從而擾亂了矽穀——但這家 ChatGPT 製造商懷疑它們是建立在 OpenAI 數據之上的。

STKB320_DEEPSEEK_AI_CVIRGINIA_D吸收了您未請求許可的數據?聽起來很熟悉。

圖片來源: Cath Virginia / The Verge

彭博社報道,OpenAI 和 Microsoft 正在調查這家中國競爭對手是否使用 OpenAI 的 API 將 OpenAI 的 AI 模型集成到 DeepSeek 自己的模型中。該媒體的消息來源稱,Microsoft 安全研究人員檢測到,2024 年底有大量數據通過 OpenAI 開發者賬戶泄露,該公司認為該賬戶與 DeepSeek 有關。

OpenAI 告訴英國《金融時報》,它發現了將 DeepSeek 與使用蒸餾聯係起來的證據,蒸餾是開發人員通過從更大、更強大的 AI 模型中提取數據來訓練 AI 模型的常用技術。這是一種訓練較小模型的有效方法,而 OpenAI 用於訓練 GPT-4 的 1 億美元隻是其中的一小部分。雖然開發人員可以使用 OpenAI 的 API 將其 AI 與自己的應用程序集成,但提取輸出以構建競爭對手的模型違反了 OpenAI 的服務條款。OpenAI 尚未提供其發現的證據的詳細信息。

這種情況充滿了諷刺意味。畢竟,是 OpenAI 在未經同意的情況下吸收了整個書麵網絡,從而在其 GPT 模型上取得了巨大的飛躍。

唐納德·特朗普總統的人工智能沙皇大衛·薩克斯表示,“有可能”發生了知識產權盜竊。“有大量證據表明,DeepSeek 在這裏所做的是他們從 OpenAI 模型中提煉出知識,我認為 OpenAI 對此並不高興,”薩克斯周二告訴福克斯新聞

“我們知道,總部位於中國(中國)的公司——以及其他公司——一直在試圖提煉美國領先的人工智能公司的模型,”OpenAI 在給彭博社的一份聲明中說。“作為領先的人工智能建設者,我們采取了對策來保護我們的知識產權,包括謹慎地決定在發布的模型中包含哪些前沿功能,並相信,隨著我們的發展,我們與美國政府密切合作,以最好地保護最有能力的模型免受對手和競爭對手試圖奪取美國技術的努力,這一點至關重要。”

FT 的報道說了很清楚,是OpenAI發現的,它正在用API在上麵提煉(“蒸餾”)數據。但這違反服務條款,因為用戶不得複製其任何服務或者使用其模型輸出來開發與其OpenAI競爭的模型。

 

 
 
 
 
 
 
請您先登陸,再發跟帖!