這文章的方法是對大模型不需要強解超級規模的矩陣,記住每個細節,用-1,0,1三種狀態就好,因此不需要GPU了

來源: 2024-06-30 08:25:15 [舊帖] [給我悄悄話] 本文已被閱讀: