簡體 | 繁體

loading...

熱點論壇

全部論壇列表

那是老的ML的做法。Transformer是pre-train（模型自學生成以後用訓練微調）。學習的時候需要大規模並行。

來源: uptrend 於 2024-02-21 08:27:21 [檔案] [博客] [舊帖] [給我悄悄話] 閱讀數 : (0 bytes)

字體:調大/重置/調小 | 加入書簽 | 打印 | 所有跟帖 | 加跟貼 | 當前最熱討論主題

本文內容已被 [ uptrend ] 在 2024-02-21 08:32:06 編輯過。如有問題，請報告版主或論壇管理刪除.

回答: 訓練模型是後端運行，計劃好了可以用多個SERVER一起訓，不一定非要好的GPU，模型輸出在前端，速度要快，因為人在等結果由 testmobile 於 2024-02-21 08:24:41

您的位置：文學城 » 論壇 » 大千股壇 » 那是老的ML的做法。Transformer是pre-train（模型自學生成以後用訓練微調）。學習的時候需要大規模並行。

所有跟帖：

• Pre-trained Model是一直需要的，可以Freezing a layer，不可能完全一邊學習一邊輸出的， -testmobile- ♀ (0 bytes) () 02/21/2024 postreply 08:32:06

• 實事擺在那裏。GROQ的AI隻是輸出快，智能不夠的AI有用嗎？就像挑戰iPhone的手機一大堆，但芯片低能，沒用。 -uptrend- ♂ (0 bytes) () 02/21/2024 postreply 08:36:29

• 前端和後端是兩種架構，後端的複雜邏輯很難放到GPU裏，GPU是處理簡單的並發，microservices是後端的大方向， -testmobile- ♀ (328 bytes) () 02/21/2024 postreply 08:45:15

• NVDA 的新架構, 在一個巨大的Superchip上同時提供AI 和Kubernetes 服務。 -uptrend- ♂ (0 bytes) () 02/21/2024 postreply 11:08:54

請您先登陸，再發跟帖！