利用编辑距离(EditDistance)计算两个字符串的相似度编辑距离(EditDistance),又称Levenshtein距离,是指两个字串之间,由一个转成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。一般来说,编辑距离越小,两个串的相似度越大。例如将kitten一字转成sitting:sitten(k→s)sittin(e→i)sitting(→g)俄罗斯科学家VladimirLevenshtein在1965年提出这个概念...
查看全文