本文介绍一下笔试面试算法经典–最长公共子串(Longest Common SubString)问题。
1. 最长公共子串
最长公共子串(Longest Common Substring): 是指两个字符串中最长连续相同的子串长度。
例如: str1=”1AB2345CD”,str2=”12345EF”,则str1,str2的最长公共子串为2345。
1.1 解法1
如果str1的长度为N,str2的长度为M,生成大小为M*N
的数组dp, dp[i][j]表示str2[0…i]
与str1[0…j]
的最长公共子串的长度。
计算dp[i][j] 的方法如下:
1)矩阵dp的第一列dp[0…m-1][0]: 对于 某个位置(i,0), 如果str1[0]==str2[i],则dp[i][0]=1,否则dp[i][0]=0
2)矩阵dp的第一行dp[0][0…n-1]: 对于 某个位置(0,j), 如果str1[j]==str2[0],则dp[0][j]=1,否则dp[0][j]=0
3) 其他位置从左到右从上到下计算,dp[i][j]的值只有两种情况:
-
str1[i]==str2[j], 则dp[i][j]=dp[i-1][j-1]+1;
-
str1[i]!=str2[j], 则dp[i][j]=0;
str1=”abc”,str2=”caba”的 dp 矩阵如下:
a b c
------------------------
c 0 0 1
a 1 0 0
b 0 2 0
a 1 0 0
代码如下:
1.2 解法2
经典动态规划的方法需要大小为M*N的dp矩阵,但实际上是可以减少至O(1)的,因为计算每一个dp[i][j]的时候只需要计算dp[i-1][j-1],所以按照斜线方向计算所有的值,只需要一个变量就可以计算:
[参看]:
- 最长公共子串