1. 使用一種獎懲機製訓練模型。所以更有效。
2. 目前邏輯,code能力強,語言能力稍差
3. Performance 強,$2 per M token, 國外大模型$60 per M token.
4. Free. 開源。