聖誕節的第二天,一家名為深度求索(DeepSeek)的中國小型初創公司發布了一個新的人工智能係統,其功能可與OpenAI和穀歌等公司的尖端聊天機器人相媲美。
能做到這點本已是一個裏程碑。但這個名為DeepSeek-V3的大模型背後的團隊描述了一個更大的進步。深度求索的工程師在介紹他們如何構建這個大模型的研究論文中寫道,他們在訓練該係統時隻用了領先人工智能公司用的高度專業化計算機芯片的一小部分。
這些芯片是美中激烈技術競爭的核心。隨著美國政府努力保持本國在全球人工智能競爭中的領先地位,它正在試圖對能出售給中國以及其他競爭對手的高性能芯片(如矽穀公司英偉達生產的那些)進行限製。
但DeepSeek大模型的表現讓人們對美國政府貿易限製的意外後果產生了質疑。美國的出口管製措施已迫使中國研究人員使用互聯網上免費提供的各種工具來發揮創造力。