最近因为工作需要,学习了NLP的相关知识,简单动手实现了一下计算Edit Distance的算法,就是计算一个字符串要变成另一个字符串需要的代价,这其中采用Levenshtein方式,即规定一个插入和一个删除的代价是1,一次替换的代价是2. 简单的逻辑: 对于长度为M的字符串X,长度为N的字符串Y, Initialization: D(i,0)=i D(0,j)=j Recurrence Relation: for each i=1...M for each j=1...N D(i,j)=Min…