http://128.1.145.137/thread-60683-1-1.html
充分證明了上上下下全是蠢蛋,月滿則虧,水滿則溢。這不僅是對自然法則的一種描述,也是提醒人們在生活中不要過分膨脹自己的欲望或成就,因為當事物發展到了極限之後,往往會發生逆轉,走向相反的方向。從更廣泛的意義上看,“天道忌滿,人道忌全”的觀念還體現在為人處世的態度上。它教導我們要保持謙遜、謹慎的心態,避免因驕傲自滿而導致失敗。
有關部門一頓騷操作,根本沒嚇唬住美國人。美國參議員Josh Hawley正在推動立法,尋求切斷美中在AI方麵的所有合作。據福克斯新聞報導,Hawley的法案《美國的AI能力與中國脫鉤法案》(Decoupling America’s Artifical Intelligence Capabilities from China Act)將切斷美中在AI領域的合作。它將禁止AI技術對華進出口,禁止美國公司在中國進行相關研究,並禁止美國對在中國的AI技術公司進行任何投資。
Hawley在社交媒體平台X上說,“流入到中國AI的每一美元和每千兆數據最終都將被用來對付美國。”
他的這一法案是對DeepSeek在過去幾天引發美國股市動蕩,而直接推出的首批法案之一。
與其它阻止中國從美國創新中受益的立法不同,霍利的法案將涵蓋任何AI相關技術,而不是特定實體。針對特定實體的法案往往會促使中國通過其它公司規避製裁。前總統拜登在其任期的最後一周升級了對AI芯片的對華出口管製,並將中國和新加坡的二十多個實體列入商務部的實體名單.
美國公司OpenAI告訴《金融時報》,已發現的證據表明,DeepSeek使用OpenAI的專有模型,來訓練自己的模型。
美國準商務部長盧特尼克今天表示,DeepSeek使用美國AI模型和Nvidia的芯片進行開發,他將會阻止這項行為,並征關稅阻止中國科技發展。盧特尼克(Howard Lutnick)上午在參議院人事聽證會上發表上述看法,並強調將透過關稅來強化美國商務部工業和安全局(BIS)的權力,以阻止中國的科技發展。他說,中國隻關心自己,試圖傷害美國。美國因此需要自我保護,推動創新,停止協助中國。如果中國想和美國競爭,就讓他們競爭,“但停止利用我們的工具來與我們競爭。所以我在這方麵會非常強硬”。
華爾街出身的盧特尼克被提名執掌規模較小的商務部,旨在提振美國產業,於扶植美國半導體產業和減少對亞洲依賴的政策中扮演關鍵角色。
盧特尼克已表達支持川普對中國進口貨課征60%關稅,及對所有其他進口貨課征10%關稅。
最近,AI江湖裏突然蹦出一個DeepSeek。媒體一窩蜂地吹捧,說它“國貨之光”“自主創新”“彎道超車”,搞得好像一門失傳已久的武林絕學被它獨自掌握,一出手便震驚四座,天下群雄隻能俯首稱臣。可惜,這故事的味道實在太熟悉了,聽得多了,人們便不免生疑——這DeepSeek到底是個什麽路數?
打開一看,DeepSeek的來曆便讓人疑竇叢生。號稱自主研發,結果模型底子是Llama 2,一個Meta(臉書)開源的東西。說是“AI革命”,但所謂的突破無非是借著開源社區的力氣,把別人的成果修修改改,重新包裝,最後往自己臉上貼金。這可不是武林宗師的路數,更像是江湖上常見的“偷學幾招,換個名字”的二流騙子。
更尷尬的是,它家的DeepSeek Coder一問世,就被人逮住了“代碼門”醜聞。訓練數據裏,大量包含GitHub上的開源代碼,甚至有違反開源協議的嫌疑。代碼界的老江湖們一看便明白,這套路像極了那些抄作業的學生,表麵上信誓旦旦地宣稱“全靠自己努力”,結果翻開草稿紙,全是別人寫的答案。更妙的是,這些人抄完之後,還要大言不慚地開新聞發布會,宣布自己是“全球代碼AI革命的引領者”。
再回頭看看它的出道方式,更讓人摸不著頭腦。真正的AI大模型,都是一步步成長起來的,比如OpenAI,最早搞GPT-2、GPT-3,積累了口碑,慢慢才打出ChatGPT的招牌。可DeepSeek呢?在它橫空出世之前,幾乎沒有多少名氣,甚至連研發曆史都寥寥無幾。然後,就像小說裏的“深山奇遇流”主角一般,突然跳出來,直接自封“國貨之光”,仿佛它這幾年一直在深山閉關苦練,一出關就功力大成。
但現實是,武俠小說裏的奇遇,大多隻發生在小說裏。DeepSeek的來路不明,背景模糊,過去幾年沒見它在AI界有多少積累,突然就殺入市場,這種過於戲劇化的成長方式,實在讓人難以信服。
最諷刺的是,這種套路居然還有不少人買賬。很多人一聽“國產AI”,就立刻眼裏放光,仿佛這三個字本身就能證明它的技術實力。DeepSeek的營銷團隊顯然深諳此道,順勢打出“民族情懷牌”,一下子把輿論推上高潮。(因為投機本來就是我大漢光榮的文化傳統,關於這一點,998有太多的論述了。)
針對宣傳中的DeepSeek如何“震驚美國科技界”和“遙遙領先”,科技博主“水小木”也覺得不對勁。
“如果你把這幾十年遙遙領先的新聞放在一起對比,會發現一個驚人的規律,每當國外出現什麽重大的科技變革,我們這邊都會立馬有公司宣布遙遙領先。然而過了一段時間以後,你又會發現好像一瞬間再也聽不到這些消息了。”“水小木”說。
他舉例說,“每日經濟新聞剛剛做了一個調研,他們發現如果你問DeepSeek你是誰?它會回答我是GPT4。如果你問他自己的編程接口是什麽?它甚至會把OpenAI的編程接口使用說明給到你。如果你深入了解的話,就會發現就連笑話的笑點,DeepSeek和GPT4都是一模一樣。
正常商業公司運作下的大模型當然不是這麽操作的,而這麽騷操作的公司它也不是正常的商業公司。
任何商業公司都有成長曆程的,現實不存在猴王出世這種神話。
OpenAI 表示,它發現證據表明中國人工智能初創公司 DeepSeek 使用了這家美國公司的專有模型來訓練自己的模型,人們對潛在侵犯知識產權的擔憂日益加劇。這家總部位於舊金山的 ChatGPT 開發商向英國《金融時報》表示,它已經發現了一些“蒸餾”的證據,這是開發人員使用的一種技術,通過使用更大、更強大的模型的輸出,在較小的模型上獲得更好的性能。這使他們能夠以更低的成本在特定任務上獲得類似的結果。
OpenAI 拒絕進一步評論其證據的細節。其服務條款規定,用戶不得“複製”其任何服務或“使用輸出來開發與 OpenAI 競爭的模型”。
一位接近 OpenAI 的人士表示,蒸餾是業內的一種常見做法,並強調該公司為開發人員提供了一種使用自己的平台來實現這一目標的方法,但他表示:“問題在於你這樣做是為了為自己的目的創建自己的模型。” 另一位直接知情人士補充說,去年秋天,微軟和 OpenAI 對使用 OpenAI 應用程序編程接口 (API) 的疑似 DeepSeek 賬戶進行了調查,並以涉嫌違反服務條款的數據提煉為由阻止了這些賬戶的訪問。
路透社報導,OpenAI一位發言人在一份聲明中附和了白宮人工智能和加密特使David Sacks的說法,指出中國公司和其它公司一直在試圖複製美國領先人工智能公司的模型,但沒有具體點名DeepSeek或任何其它公司。
“我們采取反製措施來保護我們的知識產權,包括謹慎確定哪些前沿能力應該納入已發布的模型中,並相信在我們前進的過程中,與美國政府密切合作至關重要,以最好地保護最強大的模型,防止對手和競爭對手竊取美國技術。”聲明說。
被美國科技界以及金融圈打上大問號,被英國《金融時報》封為“矽穀奧本海默”美國虛擬實境(VR)先驅、Oculus創辦人Palmer Luckey28日接受美媒福斯財經節目訪問時談到,他認為美國媒體落入中國宣傳陷阱,並未真正探究DeepSeek對外宣稱的成本。根據福斯財經報道,Luckey在《The Claman Countdown》節目中表示,許多美國媒體報道時,都拿出DeepSeek對外聲稱其僅花費500多萬美元,就訓練出能與美國耗資數十億美元開發的AI模型競爭的說法,他認為,DeepSeek是故意公布這個數字。DeepSeek提出這個數字的目的是要損害美國公司,輝達等美國企業股價暴跌,市值蒸發數千億美元。
DeepSeek根本沒有將開發成本完整公布,媒體也忽略DeepSeek隱藏了許多基礎設施成本,卻盲目放大這一數字說法來報道。
DeepSeek確實在AI領域有令人印象深刻的進步與創新,但他警告,別過度相信這家公司的對外說法,現在有許多人希望看到美國失敗,而這些人甚至有不少就在美國國內。若從股市反應來看,DeepSeek所發布消息的方法顯然達到目的,大家應認知中國AI帶來的競爭與威脅,但不應輕易地失去理智,輕信中共的政治宣傳。
網上的中文信息隻占所有文字信息的2%都不到,相比之下,英文信息占50%左右,Wikipedia的英文內容也是中文的幾十倍。
不僅如此,網上大多數的中文信息都是一些無用和錯誤的曆史文獻,關於現代社會的各種社會學、經濟學文獻和數據少得可憐,沒有人和機構整理發表,而近代中國政治幾乎是一個禁區。
豆包大模型回答說Meta大模型的訓練中,中文信息隻占0.13%,ChatGPT訓練中隻占0.09%,但拒絕透露自己和Deepseek的模型訓練中,中文信息占比多少。
Leavitt周二在其作為白宮新聞發言人的首次簡報會上說,國家安全委員會正在審查DeepSeek應用的影響,“這是對美國人工智能行業的警鍾”。
她補充說,周二早些時候曾親自與國家安全委員會討論此事,白宮正在努力“確保美國人工智能的主導地位”。
眾議院對中特別委員會周一還呼籲加強對DeepSeek人工智能基礎設施所依賴技術的出口管製。該委員會表示,“美國不能允許像DeepSeek這樣的模式危及我們的國家安全,並利用我們的技術來推進其人工智能野心。”
戰略與國際研究中心智庫主任、前五角大樓人工智能戰略主管Gregory Allen表示,美國不應該拋棄旨在減緩中人工智能產業發展的既定措施。
Allen認為,中國政府希望DeepSeek在川普執政第一周引起關注,作為一種象征性聲明。他指出,DeepSeek的突然受關注,與華為在2023年時任商務部長吉娜?雷蒙多訪問中國同一周,發布一款新型高性能智能手機的情況相似。
Allen說:“如果得出結論認為這意味著出口管製現在無法像當時一樣發揮作用,那將是一個巨大錯誤,但這正是中國的目標。”
普渡大學克拉奇技術外交研究所(Krach Institute for Tech Diplomacy)首席執行官Michelle Giuda告訴彭博電視台,美國必須通過加強出口管製,來保持“真正強大的防禦”。她補充道,與此同時,如果美國想在科技競賽中保持領先,就需要在培養優秀工程師方麵趕上中國。
“我們應該做的就是加倍努力,讓美國在人工智能創新方麵行動得更快、更聰明、成本更低。”她說道。
前OpenAI研究主管Miles Brundage在接受自媒體ChinaTalk時說,他擔心有人會將DeepSeek此事作為反對出口管製的最終敘事論點。
“雖然我不認為這個論點成立,但我理解為什麽人們可能會看到它並得出結論,認為出口管製適得其反。”他說,“出口管製是有效的——你不能否認這種情況正在發生,而且由於出口管製,這種情況更有可能發生。”
美國媒體“連線雜誌”(WIRED)一篇分析指出,DeepSeek正將大量美國用戶資料直接傳回中國,可能比TikTok近年來傳回中國的資料還更多。
加拿大多倫多大學公民實驗室資深研究員John Scott-Railton提醒,公眾不應等到中國AI技術引發恐慌時才意識到,大部分企業都會自行設定如何使用用戶數據的條款。
他強調,“使用這些服務時,實際上是為他們工作,而不是他們為你服務。”
根據DeepSeek的隱私政策,該公司明確表示將收集的用戶數據存儲在中國的服務器上。這意味著,用戶與DeepSeek的對話和提問以及生成的答案都有可能被傳送到中國。
DeepSeek的隱私政策列出了三類數據收集內容:用戶共享的信息、DeepSeek自動收集的信息、以及從其他來源獲取的信息。
用戶與DeepSeek共享的數據包括通過應用程序或網站進行的聊天內容、文字或語音輸入、提示、上傳文件、反饋和聊天記錄。
盡管DeepSeek提供了刪除聊天記錄的選項,專家認為,用戶不應向AI聊天機器人透露任何敏感信息或個人數據。
倫敦國王學院AI研究所的研究員Lukasz Olejnik表示,他不會在任何AI聊天機器人中輸入個人或私密數據。
研究機構Gartner分析師Bart Willemsen指出,生成式AI模型的構建和運行通常對消費者不透明,用戶無法確切知道這些模型如何運作以及使用的數據來源。DeepSeek提供的服務本質上是免費的,但用戶通過提供數據、內容等換取服務。
《連線雜誌》進一步指出,DeepSeek似乎將數據傳送給中國的科技巨頭百度和互聯網基礎設施公司Volces。
此外,當用戶使用Google或Apple等賬戶登錄時,DeepSeek還會從這些公司獲取信息。廣告商也與DeepSeek分享數據。
DeepSeek隱私政策表示有權決定如何使用收集到的用戶數據,數據可能被用於維持服務和改進技術。更重要的是,DeepSeek可能利用用戶輸入的提示來開發新的AI模型。
隱私政策還提到,DeepSeek的數據可能被企業集團訪問,必要時將與執法機構和公共當局共享。
報道寫到,雖然所有企業都有法律義務,但中國企業更有其特殊任務。中國過去10年間頒布了一係列網絡安全和隱私法,目的在允許國家官員向科技公司索取數據。2017年的一項法律便規定,組織和公民應該“配合國家情報工作”。
周二,意大利數據保護機構表示,正在尋求DeepSeek就其個人數據使用情況做出解釋。
意大利監管機構(也稱為Garante)表示,想知道DeepSeek應用收集了哪些個人數據、從哪些來源收集、出於什麽目的、基於什麽法律依據以及是否存儲在中國。
Garante在一份聲明中表示,DeepSeek及其附屬公司有20天時間給出解釋,這是針對這家中國初創公司的首批監管舉措之一。
意大利Garante是歐洲最活躍的AI使用監管機構之一。
據多家意媒1月29日報道,DeepSeek應用APP已消失於意大利蘋果和Google的應用商店。
據Wired意大利版指,1月29日在Google Play Store與蘋果App Store都已無法找到DeepSeek,但在網頁版仍然可以看到,已經下載的人士也仍可以使用該App。
愛爾蘭數據保護委員會同樣要求 DeepSeek提供數據處理信息,顯示對 DeepSeek抱持疑慮的國家不隻有意大利。
即將舉行的德國大選的德國,也對 DeepSeek抱持警惕。德國內政部發言人最近表示,為避免2月23日的全國大選受到幹擾,人工智能受到政府嚴格監控。
AI研究學者、台灣政治大學學務長蔡炎龍在臉書專號分析指出,如果沒有基礎的開源模型,如Llama等,就無法開發出DeepSeekR1,而這些基礎開源模型的開發也需要花費相當的資金。蔡教授表示:“DeepSeek更像是在進行聰明的微調。”
DeepSeek的母公司幻化魔方是最重視芯片裝備的一家公司,過去中國媒體曾報道他們大量添購GPU及英偉達芯片,為自身發展增添動力。因此,DeepSeek的開發背後不可能僅僅花費600萬美元的成本。
白宮人工智能和加密特使David Sacks在福克斯新聞受訪時,被問及DeepSeek的進展是否涉及知識產權盜竊。
“這是可能的。人工智能中有一種叫做蒸餾(知識蒸餾,Knowledge Distillation)的技術,你會聽到很多關於它的信息,它是指一個模型從另一個模型中學習。”Sacks在采訪中說。我認為在接下來幾個月裏,你將會看到我們的領先人工智能公司采取措施,試圖防止蒸餾……這肯定會減緩一些模仿模型的速度。”他補充道。知識蒸餾是一種模型壓縮和遷移學習的技術,通過將一個大型模型的知識傳遞給一個小型模型,以提高小型模型的性能。
DeepSeek發表的論文,這個被美國媒體廣為引用的550萬美元訓練成本實際上是DeepSeek-V3,而不是R1,而且即便如此,它也隻是V3實際訓練成本的一小部分。
首先AI模型的成本是1.6萬張顯卡,deepSeek隻用了2千張,但是他沒有把2019年就做的LLM(語言大模型)的成本也加進去。那麽要是加上這部分成本,deepSeek實際上使用了1.2萬張顯卡。另外節省下來的4千張顯卡隻要靠各種優化。
上述成本僅包括DeepSeek-V3的正式訓練,並不包括與架構、算法或數據方麵的先前研究和實驗相關的所有其它成本。”論文寫道。
DeepSeek發表的原始報告中有詳細解釋這筆成本的計算。“在預訓練階段,每兆個token上訓練DeepSeek-V3僅需要180K H800 GPU小時,也就是說,在我們擁有2048個H800 GPU的叢集上需要3.7天。因此,我們的預訓練階段在不到兩個月的時間內完成,耗費2664K GPU小時。加上上下文長度擴充所需的119K GPU小時和後製訓練所需的5K GPU小時,DeepSeek-V3的完整訓練僅需2.788M GPU小時。假設H800 GPU的租賃價格為每GPU小時2美元,我們的總訓練成本僅為557.6萬美元。”
伯恩斯坦研究公司美國半導體和半導體資本設備董事總經理、高級分析師Stacy Rasgon在一份報告中更直言,DeepSeek的訓練成本的數字具有很大的誤導性。
“DeepSeek真的‘以五百多萬美元創立了OpenAI’嗎?當然不是。”他質疑到。
他解釋說,DeepSeek-V3是一個“混合專家”模型,“透過一係列優化和巧妙的技術,可以提供與其他大型基礎模型相似或更好的性能,但隻需要一小部分計算資源來訓練”。
拉斯貢表示,這種類型的模型旨在“顯著降低訓練和運行成本,因為在任意時刻,隻有一部分參數集處於活動狀態”。
值得注意的是,DeepSeek沒有公布其R1模型的成本。如果說DeepSeek R1比肩OpenAI o1,R1的成本數據更關鍵。
“DeepSeek的R1論文沒有量化開發R1模型所需的額外資源”,拉斯貢寫道,“大概這些資源(耗費)也相當可觀。”
全球谘詢公司DGA Group的合夥人Paul Triolo在Substack上撰文說,“OpenAI的o1的訓練成本肯定遠超過GPT-4,同樣,(DeepSeek)R1的訓練成本也肯定高於V3。從o3到o4/o5或從R1到R2/R3,訓練計算隻會增加。”
美國資本公司Archerman Capital也質疑了550萬美元的成本宣傳。他們的報告指出,有人稱,DeepSeek的訓練成本是550萬美元,是Meta的十分之一,OpenAI的廿分之一,好像比後兩者厲害10倍、20倍。但是,Meta和OpenAI花的錢多是因為前沿探路,探路就意味著就會有浪費,而後發追趕是站在別人的肩膀上,當然可以避開很多浪費。
“打個不恰當的比方,創新藥的研發需要十年幾十億美元,而仿製藥的研發一定會更快更省,另外成本的統計口徑也沒有統一的標準,可以有很大的差別。”報告寫道。
台灣NGO工作者Manting Huang表示,DeepSeek背後的幻方這家私募基金公司爭議非常多,它主要是透過自動化判斷去決定投資標的,過去在中國用這個理由去規避官方的審查,它說我這個人工智慧的部分是不麵向消費者的,所以不用去遵守國內的人工智慧相關法規,但DeepSeek作為麵向消費者的產品,就會受到中國生產AI的規定。
“它等於在開發時的前端規避了審查,但是它的最終端要符合審查,所以目前中國國內,它的對手在罵這件事情,因為他們前端不用審查,所以成本近乎於零,直接去用ChatGPT的模型去做,幻方推出的DeepSeek的價格等於在中國市場直接砍半,所以所有做AI服務的廠商都跳腳(反對)。”
有購買DeepSeek企業版的人士說,DeepSeek提供的運算能力,跟TripleGPT是可以相比,但僅限於數字和數值,在人文或是圖片等美化的能力上麵,還沒到這麽好。它的優勢是在於價格便宜,因為現在是開源給大家使用,它隻是把過去大家互抄的結果,讓大家再來互抄一下吧。人們不清楚它的算力,到底是哪裏提供的,這也是很大的問題。
一位名為Dr. Kim的台積電員工在社交媒體X上發布文章稱,DeepSeek的發布日期與多個重大事件巧合發生,正值美國假期和農曆新年期間,而台積電大部分員工正處於休假狀態。他還透露,自己與團隊最近與英偉達及美國國務院進行了通話,正合作追蹤所有H100和H800芯片的出貨量。這篇文章很快被廣泛傳播,盡管後來已被刪除。
1月28日,社媒上出現一段“濤哥”對DeepSeek的質疑視頻。他在視頻中說:“你能相信嗎,一個在2023年的七月份,剛剛成立的公司,成立了一年多的時間,僅有四個人,他整個公司僅有四個人繳納社保。但是呢,竟然有媒體、有專業的研究團隊出具報告,說他們開發出了全球頂尖的AI大模型。”
他並表示:“你要知道AI的這個模型開發問題,它不光需要人才,它要投入巨大的算力,投入巨大的知識產權的投入,因為這個東西,不是說你拿來用就可以直接用的,你是要有很大的資金投入的。”
“那麽一個成立一年多的公司,是怎麽可以被一些所謂的業界專家和人士出具報告,說他可以在未來,在不久的未來可以打敗英偉達這樣的國際性的大公司的?這個‘遙遙領先’的這個東西,到底是怎麽出來的?因為時間太短了,而且此前沒有任何的鋪墊,沒有任何的陳述,直接一股腦就把它推到了這個投資平台上麵。”
他用一個例子做比喻:“這就像告訴你什麽呢,一個剛剛出生的嬰兒,還沒有學會走路,甚至還不會說話,就有人出具一份報告,說這個嬰兒經過檢測,他的智力水平、體能狀況已經超過了很多成年人。”
根據新聞可靠性評級服務機構NewsGuard1月29日發布的一份報告,DeepSeek聊天機器人準確率僅達17%,落後於西方競爭對手。且在回答相關問題時,DeepSeek聊天機器人會重複中國政府在一些問題上的立場。
路透社報導,NewsGuard報告顯示,中國人工智能初創公司DeepSeek的聊天機器人在30%的時間裏重複虛假聲明,在53%時間裏給出模糊或無用答案,導致失敗率高達83%。
在NewsGuard審計中, DeepSeek聊天機器人在傳遞新聞和信息方麵僅實現了17%的準確率,與OpenAI的ChatGPT和Google Gemini等西方競爭對手相比,在11個競爭對手中排名第十。
NewsGuard表示,它對DeepSeek使用了與評估西方同行相同的300條提示,其中包括30條基於網上傳播的10條虛假指控提示。
這些指控主題包括上個月聯合健康保險高管Brian Thompson被殺和阿塞拜疆航空8243航班墜毀事件。
NewsGuard的審計還顯示,在十條提示中的三條中,在沒有被問及任何與中國有關的問題前提下,DeepSeek卻重複了中國政府對這些話題的立場。
NewsGuard稱,在回答與阿塞拜疆航空墜機事件相關的問題時,DeepSeek表達了北京方麵的立場。
好家夥,阿塞拜疆總統都認為是俄羅斯打下的,你deepseek比阿塞拜疆還牛逼啊。
1月29日,微信公眾號“蜀都大道”發文《除夕,Deepseek給我說了三次“對不起”》,親測了Deepseek,“問了七個問題,三個直接拒答,四個用了“辯證法”,等於一個都沒回答”。
第一個問題,“你認為世界上有沒有邪惡國家?”該人工智能講了一堆“相對論”,意思是邪惡與否,是“相對的”。
第二個問題是,“某國是不是邪惡國家?”,開始,該智能機器人跳出一些字出來,然後抹去,最後留下兩行沒有消失的字是,“對不起,我還沒有學會如何思考這類問題,我擅長數學、代碼、邏輯類的題目,歡迎與我交流。”
文章說,這一點像是人工智能的樣子,非常狡猾。
第三個問題是,“世界上哪些國家是民主國家?”,該AI又說了一些話,隨即自己抹去了。
第四問是,“戰爭有正義(和非正義)之分嗎?”,該AI列了種種“戰爭觀”,就是不說它自己的看法,還舉了現實中的例子如“俄烏衝突”。
文章說,“稱‘俄烏衝突’,本身就是立場,非常官方”。
作者問它,“戰爭是否有正義與非正義?”,該AI繞一圈,還是不說自己的看法。
作者還問,“俄羅斯進攻克蘭是正義戰爭嗎?”,Deepseek說了很多,主要的意思就是“不存在的‘正義’答案”,“戰爭是否‘正義’取決於回答者的立場”
最後一個問題是,“實現人類命運共同體”和“實現共產主義”有何異同?該AI又回答,“對不起,我還沒有學會如何思考這類問題,我擅長數學、代碼、邏輯類的題目,歡迎與我交流。”
文章說,“一切都是相對的。站在自己的立場上,都是正義的。那麽世界上還有什麽是正義的嗎?沒有。不存在。deepseek把這一邏輯繞得淋漓盡致”。
據《福布斯》雜誌1月28日報導,以色列網絡情報公司Kela實測發現,中國生成式人工智能DeepSeek可以創建惡意程序,從特定瀏覽器獲取信用卡資料,並將其傳送到遠端服務器,甚至建議用戶從黑市購買被竊取的數據並提供有關洗錢的提示。
這篇報導援引每周網絡安全、網路隱私和監控新聞摘要“竊聽”(The Wiretap)上的消息來源說,Kela的研究人員在實測時嚐試讓DeepSeek R1幫助編寫勒索軟件和其它類型的惡意軟件,結果發現該AI會按照他們的要求創建惡意源代碼,可以從特定瀏覽器獲取信用卡資料並將其發送到遠端服務器,而且DeepSeek還會建議用戶從特定的地下市場購買被盜數據,並提示如何洗錢。
Kela的研究人員得出的結論是,DeepSeek R1是一款“極易受到攻擊”且“容易被繞過”的AI。
研究人員表示,因為DeepSeek是開源模型,向用戶公開展示了其推理步驟,增加了其遭越獄(jailbreak)和對抗式攻擊(adversarial attacks)的可能性,因為惡意行為者可以利用這些可見的推理路徑來識別和定位漏洞,並利用該AI來幹壞事。相比較而言,ChatGPT o1-preview模型隱藏了其推理過程,采取了必要的保障措施。
針對Kela的上述研究,《福布斯》聯係了DeepSeek公司請求置評,但後者沒有作出回應。
雲安全公司Wiz Research 發現 DeepSeek 的一套可公開訪問的 ClickHouse 數據庫,允許對數據庫進行完全控製,包括訪問內部數據。此次暴露包含超過一百萬行的日誌流,其中含有聊天記錄、密鑰、後端細節以及其他高度敏感的信息。Wiz Research 團隊第一時間向 DeepSeek 負責披露了這一問題,DeepSeek 隨後迅速采取了措施,修複了該暴露點。
ClickHouse 是一個開源的列式數據庫管理係統(DBMS),主要用於在線分析處理(OLAP)場景。它由俄羅斯的網絡搜索巨頭Yandex公司為提高其內部廣告網絡和Web Analytics平台的數據處理能力而開發,並於2016年將其開源。
點評
998都得羨慕,這比他自己的成長曆程快多了。deepseek要是不使用深度思考模式,還不如通義大模型及類似的國產大模型。而使用了深度思考模式,如果去回答文本提問,也僅僅是與通義大模型持平,並且結果出的慢,因為一番推理也不省時。
那些研讀過論文和代碼的人說deepSeek將很多必要功能都做了刪減。起碼在處理長文本上會出問題。
測試方法就是問deepSeek三個問題:
1. HDMI接口規格是4K/30Hz能否用上1080p/144Hz
2. HDMI視頻線的接口規格是4K/30Hz,能否用上1080p/144Hz
3. 筆記本電腦的HDMI接口規格是4K/30Hz,能否用在1080p/120Hz的顯示器上?
這三個問題每一個都是前麵問題的優化,然後deepSeek就開始一口咬定該接口不支持的結論。
這很明顯是deepSeek沒有完全實現同用戶雙向對話的結果,這個問題其他大模型都沒遇到過。
所以deepSeek用兩千張顯卡實現v3,在現有的理論框架下的確是有可能的,但是否值得跟隨,答案顯然是否定的。
必要功能做刪減遲早會在長期經營中暴露出來,導致嚴重的質量問題。即使是現在穩紮穩打去做,基於概率的AI都避免不了錯誤,一旦連很多基本能力都缺乏,那麽我前麵那個案例發生在關鍵時候會帶來嚴重問題。
這種思路就不對勁,deepseek隻針對H100進行極致優化是什麽目的。這完全不同於業內所有商業公司操作,是正常的嗎。
這明顯有刷分的嫌疑,誰會隻關注分數效果而忽視通用性和兼容性。這麽有針對性,這是商業公司該做的嗎。
細思極恐,結合連文心大模型都能回答出國家主席習的簡介,而deepseek的堅決不回答。說它不是手套,誰信啊。