看了一下deepseek的官網介紹

DeepSeek是中國知名私募巨頭幻方量化旗下人工智能公司深度求索(DeepSeek)自主研發的AI大模型,深度求索致力於研究和開發先進的通用人工智能模型AGI。目前DeepSeek的模型全部開源,包括通用大模型DeepSeek LLM、MoE模型DeepSeek MoE、DeepSeek V2、DeepSeek-V3、代碼模型DeepSeek Coder、DeepSeek Coder V2、數學模型DeepSeek Math、多模態大模型DeepSeek-VL、DeepSeek VL2等。幻方量化不僅為DeepSeek提供強大的資金支持,例如第一期研發投入預計就達30億元,還為DeepSeek提供了 “螢火超算” 萬卡級別的算力支持。

過去幾天以來,低調上線的DeepSeek V3在國內外引起了不小的轟動。根據國外網友們的說法,盡管DeepSeek V3可以算是第一梯隊AI大模型,卻隻用了2048張H800 GPU顯卡、2個月不到時間訓練完畢,計算預算也隻有不到600萬美元;在性能方麵幾乎追上了Claude 3.5 Sonnet 和 GPT-4o,如編程、數學等;每百萬Token的價格可以壓到不到0.5美金,是用1/10的價格達到OpenAI和Anthropic同級的水平。

 

 

請您先登陸,再發跟帖!