问题描述
给定两个字符串 text1
和 text2
,返回这两个字符串的最长公共子序列的长度。如果不存在公共子序列,返回 0。
一个字符串的子序列是指这样一个新的字符串:它是由原字符串在不改变字符的相对顺序的情况下删除某些字符(也可以不删除任何字符)后组成的新字符串。
例如,“ace” 是 “abcde” 的子序列,但 “aec” 不是 “abcde” 的子序列。
两个字符串的公共子序列是这两个字符串所共同拥有的子序列。
示例 1:
输入:text1 = “abcde”, text2 = “ace”
输出:3
解释:最长公共子序列是 “ace”,它的长度为 3。
示例 2:
输入:text1 = “abc”, text2 = “abc”
输出:3
解释:最长公共子序列是 “abc”,它的长度为 3。
示例 3:
输入:text1 = “abc”, text2 = “def”
输出:0
解释:两个字符串没有公共子序列,返回 0。
提示:
1 <= text1.length, text2.length <= 1000
text1
和text2
仅由小写英文字符组成。
解题思路
这道题是典型的动态规划问题。动态规划的核心思想是将一个大问题分解为若干个子问题,通过解决这些子问题,并存储它们的结果,来最终解决大问题。
1. 定义 DP 数组的含义
我们创建一个二维数组 dp
,其中 dp[i][j]
用来存储字符串 text1
的前 i
个字符(即子串 text1[0...i-1]
)与字符串 text2
的前 j
个字符(即子串 text2[0...j-1]
)的最长公共子序列的长度。
例如,如果 text1 = "abc"
,text2 = "axc"
:
dp[1][1]
表示text1
的前 1 个字符 “a” 和text2
的前 1 个字符 “a” 的最长公共子序列长度。dp[3][2]
表示text1
的前 3 个字符 “abc” 和text2
的前 2 个字符 “ax” 的最长公共子序列长度。
2. 状态转移方程
当我们计算 dp[i][j]
时,我们需要观察 text1
的第 i
个字符(即 text1[i-1]
)和 text2
的第 j
个字符(即 text2[j-1]
):
-
情况一:
text1[i-1] == text2[j-1]
如果这两个字符相等,那么这个相等的字符text1[i-1]
(或text2[j-1]
) 必然可以作为text1[0...i-1]
和text2[0...j-1]
的最长公共子序列的最后一个字符。
因此,dp[i][j]
就等于text1[0...i-2]
和text2[0...j-2]
的最长公共子序列的长度,再加上这个共同的字符(长度加 1)。
所以,dp[i][j] = dp[i-1][j-1] + 1
。 -
情况二:
text1[i-1] != text2[j-1]
如果这两个字符不相等,那么text1[i-1]
和text2[j-1]
中至少有一个字符不能包含在text1[0...i-1]
和text2[0...j-1]
的最长公共子序列中。
这时,dp[i][j]
的值取决于以下两种可能中较大的那个:- 不考虑
text1[i-1]
,即text1[0...i-2]
和text2[0...j-1]
的最长公共子序列长度,也就是dp[i-1][j]
。 - 不考虑
text2[j-1]
,即text1[0...i-1]
和text2[0...j-2]
的最长公共子序列长度,也就是dp[i][j-1]
。
所以,dp[i][j] = max(dp[i-1][j], dp[i][j-1])
.
- 不考虑
3. 初始化 DP 数组(边界条件)
dp[0][j]
:表示text1
为空字符串(长度为 0)与text2
的前j
个字符的最长公共子序列。空字符串与任何字符串的公共子序列长度都是 0。所以dp[0][j] = 0
对所有j
成立。dp[i][0]
:表示text1
的前i
个字符与text2
为空字符串(长度为 0)的最长公共子序列。同理,长度也是 0。所以dp[i][0] = 0
对所有i
成立。- 因此,
dp[0][0]
(空串与空串的 LCS) 自然也是 0。
在 Go 语言中,make
创建的int
类型切片默认值为 0,所以这部分初始化可以省略显式赋值。
4. 填表顺序与最终结果
我们从 dp[1][1]
开始,逐行逐列地填充 dp
表,直到 dp[n][m]
,其中 n
是 text1
的长度,m
是 text2
的长度。
最终 dp[n][m]
就是我们要求的 text1
和 text2
整个字符串的最长公共子序列的长度。
举例手动推演:
假设 text1 = "ab"
,text2 = "axb"
。
n = 2
, m = 3
。
DP 表大小为 (2+1) x (3+1) = 3x4
.
初始化:
dp
表所有元素为 0。
1 | "" a x b (text2) |
开始填充:
i=1, j=1
:text1[0]
(‘a’) ==text2[0]
(‘a’)
dp[1][1] = dp[0][0] + 1 = 0 + 1 = 1
1 | "" a x b |
i=1, j=2
:text1[0]
(‘a’) !=text2[1]
(‘x’)
dp[1][2] = max(dp[0][2], dp[1][1]) = max(0, 1) = 1
1 | "" a x b |
i=1, j=3
:text1[0]
(‘a’) !=text2[2]
(‘b’)
dp[1][3] = max(dp[0][3], dp[1][2]) = max(0, 1) = 1
1 | "" a x b |
i=2, j=1
:text1[1]
(‘b’) !=text2[0]
(‘a’)
dp[2][1] = max(dp[1][1], dp[2][0]) = max(1, 0) = 1
1 | "" a x b |
i=2, j=2
:text1[1]
(‘b’) !=text2[1]
(‘x’)
dp[2][2] = max(dp[1][2], dp[2][1]) = max(1, 1) = 1
1 | "" a x b |
i=2, j=3
:text1[1]
(‘b’) ==text2[2]
(‘b’)
dp[2][3] = dp[1][2] + 1 = 1 + 1 = 2
1 | "" a x b |
最终结果 dp[2][3] = 2
。最长公共子序列是 “ab”.
最终的结果是 dp[n][m]
,其中 n
是 text1
的长度,m
是 text2
的长度。
代码实现
1 | // filepath: /Users/adrianwang/.leetcode/1143.最长公共子序列.go |
注意: 上述代码中 max
函数在 LeetCode 环境中通常是内置的或可以直接使用,如果本地运行需要自行定义。在 1143.最长公共子序列.go
文件中,max
函数是存在的。
复杂度分析
- 时间复杂度: O(n*m),其中
n
是text1
的长度,m
是text2
的长度。我们需要填充一个n*m
大小的 DP 表。 - 空间复杂度: O(n*m),用于存储 DP 表。
关键收获
- 动态规划是解决最长公共子序列问题的经典方法。
- 正确定义 DP 状态
dp[i][j]
的含义至关重要,通常表示考虑子问题text1[0...i-1]
和text2[0...j-1]
. - 仔细推导状态转移方程,考虑字符匹配和不匹配两种情况。
- 注意 DP 表的初始化和边界条件。