類似這種公式全是別人發明的,從neural net到transformer到MOE到RL

來源: 2025-01-29 06:21:01 [舊帖] [給我悄悄話] 本文已被閱讀: