72. 编辑距离

2019/02/01 11:46 上午 posted in  LeetCode

题目

给定两个单词 word1 和 word2,计算出将 word1 转换成 word2 所使用的最少操作数 。

你可以对一个单词进行如下三种操作:

插入一个字符
删除一个字符
替换一个字符
示例 1:

输入: word1 = "horse", word2 = "ros"
输出: 3
解释:
horse -> rorse (将 'h' 替换为 'r')
rorse -> rose (删除 'r')
rose -> ros (删除 'e')
示例 2:

输入: word1 = "intention", word2 = "execution"
输出: 5
解释:
intention -> inention (删除 't')
inention -> enention (将 'i' 替换为 'e')
enention -> exention (将 'n' 替换为 'x')
exention -> exection (将 'n' 替换为 'c')
exection -> execution (插入 'u')

解题思路

  1. 先作弊了,看到要用dp。思考许久还是没有想法。
    解析一下自己的错误思路。
    看到有三种变换方式,有一点不知道该怎么处理。

  2. 看了网上的解题报告,写下自己理解后的东西。

    首先,确认dp的含义
    word1记为s1, word2记为s2
    dp[i][j] = s1 从0...i, s2从0...j 两个字符串的编辑距离。所以dp的大小应该是dp[s1.length + 1][s2.length + 1].

  • 转换公式
    计算dp[i][j]有三种变化方式

    1. dp[i - 1][j], 由于对比dp[i][j],s1少了一个,所以要insert一个,编辑距离 + 1
    2. dp[i][j - 1] 由于对比dp[i][j],s1少了一个,所以要delete一个,编辑距离 + 1
    3. dp[i - 1][j - 1],对比s1[i - 1] 和 s2[j - 1]的情况,如果相等,编辑距离不变,否则需要+1(替换)

    从上文可以看出,三种变换方式都有了。

    接下来处理边界条件

    dp[0][i] = i和dp[i][0] = i,分别代表增加i个,和删除i个。

代码

 public int minDistance(String word1, String word2) {
    int[][] dp = new int[word1.length() + 1][word2.length() + 1];
    for (int i = 0; i <= word1.length(); i++) {
        dp[i][0] = i;
    }
    for (int j = 0; j <= word2.length(); j++) {
        dp[0][j] = j;
    }
    for (int i = 1; i <= word1.length(); i++) {
        for (int j = 1; j <= word2.length(); j++) {
            int a = Math.min(dp[i - 1][j] + 1, dp[i][j - 1] + 1);
            int cost = word1.charAt(i - 1) == word2.charAt(j - 1) ? 0 : 1;
            dp[i][j] = Math.min(a, dp[i - 1][j - 1] + cost);
        }
    }
    return dp[word1.length()][word2.length()];
}