中國人工智能初創公司深度求索(deepseek)在矽穀和華爾街引發的震動餘波未平,另一家科技巨頭阿裏巴巴周三也發布了其人工智能模型新版本,通義千問旗艦版模型Qwen2.5-Max。據稱該模型超越了近期備受關注的深度求索版本
DeepSeek-V3。
阿裏巴巴雲部門在其官方微信公眾號上發布的聲明中表示: “Qwen 2.5-Max 的表現幾乎全麵優於OpenAI
,Meta最先進的開源 AI 模型,也優於剛剛發布的DeepSeek-V3 。
報道稱,阿裏巴巴的新AI工具可以通過 API的方式進行訪問,也可以登錄Qwen
Chat進行體驗,例如直接與模型對話,或者使用artifacts、搜索等功能。
路透社報道分析則認為,深度求索在過去三周的迅速崛起不僅給海外競爭對手帶來了壓力,也給國內競爭對手帶來了壓力。因為阿裏巴巴千問旗艦版的發布時間比較特殊,正值農曆新年的第一天,也就是大多數中國人都休假回家與家人團聚之際。
深度求索於1月10日發布了基於DeepSeek-V3模型的人工智能助手,並於1月20日發布了R1模型,此舉震驚了矽穀,並導致科技股暴跌。這家中國初創公司據稱低廉的開發和使用成本促使投資者對美國領先人工智能公司的巨額支出計劃提出質疑。
但深度求索的成功也引發了國內競爭對手競相升級自己的AI模型。
DeepSeek-R1 發布兩天後,TikTok
所有者字節跳動發布了其旗艦AI模型的更新,聲稱該模型在一項基準測試 (AIME )中的表現優於微軟支持的OpenAI的
o1,AIME用於衡量AI模型對複雜指令的理解和響應能力。
這與DeepSeek的說法相呼應,即其R1模型在多個性能基準測試中可與 OpenAI的o1相媲美。
DEEPSEEK與國內競爭對手
路透社報道稱,深度求索V3模型的前身V2在去年5月發布後,曾引發了國內AI模型價格戰。
由於 DeepSeek-V2 是開源的,且價格空前便宜,每100萬個代幣(或 AI 模型處理的數據單位)僅需1元人民幣(0.14
美元),阿裏巴巴的雲部門宣布將多款型號的價格下調高達97%。
其他中國科技公司也紛紛效仿,其中包括百度和騰訊,百度於2023年3月發布了中國首個自己的 ChatGPT 版本。
DeepSeek 的神秘創始人梁文峰7 月在接受中國媒體 Waves 的罕見采訪時表示,這家初創公司“並不關心”價格戰,實現
通用人工智能(AGI)才是其主要目標。