預測是需要reward反饋的,原始數據需要標記才能參與訓練。

請您先登陸,再發跟帖!