我覺得來阜真的應該試著使用一下AI來做這個模型,但是最大的難題是不能對類似的字的類似程度進行定量,就是哪個字和哪個字更像。
所以這樣就很難teach他的模型,除非他隻使用0/1來teach他的模型。這樣0/1處理的優勢就是,他的數據庫質量也會比較高,同時training的數據庫也足夠大。
假設來阜探究文字是做這個專業的,不是業餘愛好,把數據庫做好需要比較大的資源投入。來阜還可以把語音的類似也做成模型embed進去,這樣可能更準確。可惜他做的這個文字太小資了,不知道能拿到多少資源來做這個。很有意思。
哈哈,我最近在做AI灌水,所以知道一點毛皮,覺得非常powerful.