另一個是:當前的大型語言模型的訓練分兩步進行,第一步是自我學習,第二步是從人類的反饋中強化學習。GPT4 不斷改進,因為它已經在全球範圍內上線(從人類那裏不斷獲得反饋而改進),但穀歌的 Bard 剛剛開始在內部進行 Beta 測試並且缺少很多功能。