lintcode：最小编辑距离

最小编辑距离

给出两个单词word1和word2，计算出将word1 转换为word2的最少操作次数。

你总共三种操作方法：

插入一个字符
删除一个字符
替换一个字符

样例

给出 work1="mart" 和 work2="karma"

返回 3

解题

动态规划解题

定义矩阵dp[][]

dp[i][j] 表示word1前i个字符 [0,1,2,...,i-1] 和 word2前j个字符 [0,1,2,...,j-1]的编辑距离

ch1 = word1.charAt(i)

ch2 = word2.charAt(j)

当 ch1== ch2：word1[0--(i-1)] 与word2[0--(j-1)] 的编辑距离dp[i][j] = dp[i-1][j-1] 不需要修改

当ch1!=ch2: 有三种修改方式

　　　　　　ch1替换word2中的ch2,此时的编辑距离受上一位的编辑距离影响，编辑距离是：dp[i-1][j-1] + 1
ch2插入到word1中ch1的前面，word1中的ch2还没有比较，编辑距离是:dp[i-1][j] + 1
删除ch2 编辑距离：dp[i][j-1] + 1

选取上面的最小值更新dp[i][j]的值

Java程序定义的dp矩阵长度是len1 + 1 * len2 + 1 的和上面有一点区别

import java.util.Scanner;

// write your code here

public class Main{

    public static void main(String[] args){

        Scanner in = new Scanner(System.in);

        Main m = new Main();

        while(in.hasNext()){

            String[] str = in.nextLine().split(" ");

            String word1 = str[0];

            String word2 = str[1];

            int min = m.minDistance(word1,word2);

            System.out.println(min);

        }

    }

    public  int minDistance(String word1,String word2){

        int len1 = word1.length();

        int len2 = word2.length();

        int[][] dp = new int[len1+1][len2+1];

        for(int i =0;i<=len1;i++){

            dp[i][0] = i;

        }

        for(int j =0;j<= len2;j++){

            dp[0][j] = j;

        }

        for(int i =0;i< len1;i++){

            char ch1 = word1.charAt(i);

            for(int j =0;j< len2;j++){

                char ch2 = word2.charAt(j);

                if(ch1 == ch2){

                    dp[i+1][j+1] = dp[i][j];

                }else{

                    int replace = dp[i][j] +1;// ch1 代替 ch2

                    int insert = dp[i][j+1] + 1;// ch2 插入到 ch1 前面的位置

                    int delete = dp[i+1][j] + 1;// 删除ch2

                    int min =replace>insert?insert:replace;

                    min = min>delete?delete:min;

                    dp[i+1][j+1] = min;

                }

            }

        }

        return dp[len1][len2];

    }

}

注：搜狐2016实习笔试题目

lintcode：最小编辑距离的更多相关文章

C#实现Levenshtein distance最小编辑距离算法
Levenshtein distance,中文名为最小编辑距离,其目的是找出两个字符串之间需要改动多少个字符后变成一致.该算法使用了动态规划的算法策略,该问题具备最优子结构,最小编辑距离包含子最小编辑 ...
stanford NLP学习笔记3：最小编辑距离（Minimum Edit Distance）
I. 最小编辑距离的定义最小编辑距离旨在定义两个字符串之间的相似度(word similarity).定义相似度可以用于拼写纠错,计算生物学上的序列比对,机器翻译,信息提取,语音识别等. 编辑距离就 ...
自然语言处理(5)之Levenshtein最小编辑距离算法
自然语言处理(5)之Levenshtein最小编辑距离算法题记:之前在公司使用Levenshtein最小编辑距离算法来实现相似车牌的计算的特性开发,正好本节来总结下Levenshtein最小编辑距离 ...
POJ 3356 AGTC(最小编辑距离)
POJ 3356 AGTC(最小编辑距离) http://poj.org/problem?id=3356 题意: 给出两个字符串x 与 y,当中x的长度为n,y的长度为m,而且m>=n.然后y能 ...
Minimum edit distance（levenshtein distance）(最小编辑距离)初探
最小编辑距离的定义:编辑距离(Edit Distance),又称Levenshtein距离.是指两个字串之间,由一个转成还有一个所需的最少编辑操作次数.许可的编辑操作包含将一个字符替换成还有一个字符. ...
【NLP_Stanford课堂】最小编辑距离
一.什么是最小编辑距离最小编辑距离:是用以衡量两个字符串之间的相似度,是两个字符串之间的最小操作数,即从一个字符转换成另一个字符所需要的操作数,包括插入.删除和置换. 每个操作数的cost: 每个操 ...
牛客寒假算法基础集训营2 【处女座与复读机】DP最小编辑距离【模板题】
链接:https://ac.nowcoder.com/acm/contest/327/G来源:牛客网一天,处女座在牛客算法群里发了一句“我好强啊”,引起无数的复读,可是处女座发现复读之后变成了“处女 ...
最小编辑距离python
1 什么是编辑距离在计算文本的相似性时,经常会用到编辑距离(Levenshtein距离),其指两个字符串之间,由一个字符串转成另一个所需的最少编辑操作次数.在字符串形式上来说,编辑距离越小,那么两个文 ...
通俗解析莱文斯坦距离(Levenshtein Distance)计算原理(最小编辑距离)
[版权声明]:本文章由danvid发布于http://danvid.cnblogs.com/,如需转载或部分使用请注明出处最近看到一些动态规划的东西讲到莱文斯坦距离(编辑距离)的计算,发现很多都讲的 ...

随机推荐

ListView usage in ERP-DEV
ListView Learning Note how to add double click event to listviewitem in ListView. refer link in stac ...
42.JTAG接口使用注意
无论是客户反馈,还是自己亲身经历,USB-Blaster不能下载配置FPGA的情况时有出现.究其原因,大致有如下几条: 1. FPGA器件上的JTAG相关引脚出现故障: 2. USB-Blaster坏 ...
JavaScript美术馆进化史
内容选自<<JavaScript DOM 编程艺术>>第4-6章,跟着作者一起见证美术馆的进化吧. 先放效果图,然后一步步做出每个效果.每个效果都有它实用的地方,且知道过程可以 ...
Eigen库实现简单的旋转、平移操作
本来课程要求用GUI界面来实现Eigen的旋转.平移操作的,但是接触GUI编程时间太短,虽然要求很简单,但是做了几天还是没有完成.就把命令行下面的简单的贴一下吧. main.cpp #include ...
程序调试手段之gdb, vxworks shell
调试一个程序主要用到的功能: 启动程序设置函数断点设置数据断点单步执行查看内存值修改内存值 linux下的gdb,和vxworks下的shell 虽然使用方式和调试命令略有不同,但是都能满足 ...
Careercup - Google面试题 - 5377673471721472
2014-05-08 22:42 题目链接原题: How would you split a search query across multiple machines? 题目:如何把一个搜索que ...
三门概率问题之C#版
前言: 早上看到一片关于三门问题的博客http://www.cnblogs.com/twocats/p/3440398.html,抱着该博客结论的怀疑态度用C#语言写了一些代码.实验证明该博客的结论是 ...
PHP数组的定义和遍历
//常用函数//生成随机数//echo rand(3,33); //两个参数来确定随机数的范围为3-33 //日期时间函数echo time(); //取当前时间的UNIX时间戳//date_defa ...
JQuery选择器使用
问题描述: JQuery选择器使用问题说明: 1.在页面中创建一个导航条,单击标题时,可以伸缩导航条的内容,标题中的提示图片也随之改变 2.单击" ...
bzoj 1028 暴力枚举判断
昨天梦到这道题了,所以一定要A掉(其实梦到了3道,有两道记不清了) 暴力枚举等的是哪张牌,将是哪张牌,然后贪心的判断就行了. 对于一个状态判断是否为胡牌,1-n扫一遍,然后对于每个牌,先mod 3, ...

lintcode：最小编辑距离

最小编辑距离

lintcode：最小编辑距离的更多相关文章

随机推荐

热门专题