正文

IT精英們:如何判斷兩個字符串的相似程度?

(2007-01-31 00:09:14) 下一個
我有兩個數組A和B,A和B均由數量不等的字符串組成。我需要為A數組中的每個字符串找到在B數組中最相似的一個。

A和B中的字符串有以下特點:
A中的所有字符串符合特定規律: 長度24個字符,前十個字符表示產品型號,接著是2個表示年份,接著6個字符表示序列號。最後六個字符分別由製造廠家、銷售區域和填充字符組成。

B中的字符串可能部分符合相同規律,但也可能miss或者多了不定長度的字符。出現差異的字符多數在係列號和最後6個字符處。

有什麽好的算法可以匹配A和B中的字符串,讓A中的字符串可以找到最近似的B中的字符串來匹配(不一定都能有。因為A和B中的字符串數量可能不同)?

請指教!
[ 打印 ]
閱讀 ()評論 (0)
評論
目前還沒有任何評論
登錄後才可評論.