它用蒙地卡羅模擬許多可能,再用算法決定最好的一步。所以這一步是唯一的。那它開局應該每手棋都一樣啊?當然據說它會從下過的棋學習。那第四盤它輸了它怎麽知道是那幾手下錯了?前三盤李輸了,它也能知道李那幾手下錯了?