news 2026/5/25 17:28:33

动态规划在字符串匹配中的艺术:从编辑距离到正则匹配

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
动态规划在字符串匹配中的艺术:从编辑距离到正则匹配

探索动态规划如何优雅地解决复杂的字符串匹配问题,从基础编辑操作到强大的模式匹配引擎

字符串处理是计算机科学的核心问题之一,而动态规划为字符串匹配提供了系统性的解决方案框架。本文将深入探讨几种经典的字符串匹配问题及其动态规划解法,并使用C++实现完整解决方案。

1. 字符串匹配问题的动态规划视角

动态规划解决字符串匹配问题的核心思想是:将复杂匹配问题分解为子问题,利用重叠子问题性质避免重复计算,并通过最优子结构找到最优解

1.1 动态规划在字符串问题中的优势

  • 系统化:提供统一的解题框架

  • 高效性:时间复杂度通常为O(n²)或O(nm)

  • 灵活性:可处理各种约束条件

  • 可解释性:递推关系清晰反映问题本质

2. 编辑距离:字符串相似度度量

编辑距离(Levenshtein距离)衡量两个字符串的相似程度,定义为将一个字符串转换为另一个字符串所需的最少操作次数,允许的操作包括插入、删除、替换。

2.1 问题定义

给定两个字符串word1word2,计算它们的最小编辑距离。

示例:输入: word1 = "horse", word2 = "ros"
输出: 3
解释:
horse -> rorse (将'h'替换为'r')
rorse -> rose (删除第二个'r')
rose -> ros (删除'e')

2.2 动态规划解法

状态定义

定义dp[i][j]表示word1的前i个字符转换为word2的前j个字符所需的最小操作数。

if (word1[i-1] == word2[j-1]) {
dp[i][j] = dp[i-1][j-1]; // 字符相同,无需操作
} else {
dp[i][j] = 1 + min(
dp[i-1][j], // 删除word1[i-1]
dp[i][j-1], // 在word1中插入word2[j-1]
dp[i-1][j-1] // 替换word1[i-1]为word2[j-1]
);
}

完整实现

#include <iostream>
#include <vector>
#include <string>
#include <algorithm>
using namespace std;

class EditDistance {
public:
int minDistance(string word1, string word2) {
int m = word1.length();
int n = word2.length();

// 创建DP表
vector<vector<int>> dp(m + 1, vector<int>(n + 1, 0));

// 初始化边界条件
for (int i = 0; i <= m; i++) {
dp[i][0] = i; // 将word1的前i个字符变为空串
}
for (int j = 0; j <= n; j++) {
dp[0][j] = j; // 将空串变为word2的前j个字符
}

// 状态转移
for (int i = 1; i <= m; i++) {
for (int j = 1; j <= n; j++) {
if (word1[i-1] == word2[j-1]) {
dp[i][j] = dp[i-1][j-1];
} else {
dp[i][j] = 1 + min({
dp[i-1][j], // 删除
dp[i][j-1], // 插入
dp[i-1][j-1] // 替换
});
}
}
}

return dp[m][n];
}

// 空间优化版本
int minDistanceOptimized(string word1, string word2) {
int m = word1.length();
int n = word2.length();

// 确保word1是较短的字符串,以优化空间
if (m < n) {
swap(word1, word2);
swap(m, n);
}

vector<int> prev(n + 1, 0);
vector<int> curr(n + 1, 0);

// 初始化第一行
for (int j = 0; j <= n; j++) {
prev[j] = j;
}

for (int i = 1; i <= m; i++) {
curr[0] = i; // 对应dp[i][0]
for (int j = 1; j <= n; j++) {
if (word1[i-1] == word2[j-1]) {
curr[j] = prev[j-1];
} else {
curr[j] = 1 + min({
prev[j], // 删除
curr[j-1], // 插入
prev[j-1] // 替换
});
}
}
prev = curr;
}

return prev[n];
}
};

int main() {
EditDistance ed;

vector<pair<string, string>> testCases = {
{"horse", "ros"},
{"intention", "execution"},
{"", "abc"},
{"abc", ""},
{"abc", "abc"}
};

cout << "编辑距离测试:" << endl;
for (auto& test : testCases) {
int result1 = ed.minDistance(test.first, test.second);
int result2 = ed.minDistanceOptimized(test.first, test.second);
cout << "minDistance(\"" << test.first << "\", \"" << test.second
<< "\") = " << result1
<< " (优化版本: " << result2 << ")" << endl;
}

return 0;
}

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/25 20:33:34

一篇拿下!C++:类和对象(上)、封装、实例化和this指针详解

一、类的定义类的定义格式class为定义类的关键字&#xff0c;Stack为类的名字&#xff0c;{}中为类的主体&#xff0c;注意类定义结束时后面分号不能省略。类体中内容称为类的成员&#xff1a;类中的变量称为类的属性或成员变量; 类中的函数称为类的方法或者成员函数。为了区分…

作者头像 李华
网站建设 2026/5/26 5:55:54

板栗矮砧密植:水肥一体化系统的铺设要点指南

认识板栗矮砧密植板栗矮砧密植&#xff0c;简单来说就是选用矮化砧木嫁接的板栗品种&#xff08;Dwarf rootstock variety&#xff09;&#xff0c;通过科学增加种植密度来提高产量的创新栽培模式。就像在有限的果园空间里&#xff0c;精心规划每一寸土地&#xff0c;让更多果树…

作者头像 李华
网站建设 2026/5/26 3:29:25

LeetCode 3606.优惠券校验器:分类 + 排序

【LetMeFly】3606.优惠券校验器&#xff1a;分类 排序 力扣题目链接&#xff1a;https://leetcode.cn/problems/coupon-code-validator/ 给你三个长度为 n 的数组&#xff0c;分别描述 n 个优惠券的属性&#xff1a;code、businessLine 和 isActive。其中&#xff0c;第 i 个…

作者头像 李华
网站建设 2026/5/24 4:25:06

ensp vlan实验作业

一、实验拓扑&#xff08;截自己的拓扑图&#xff0c;附加上地址分配情况&#xff09;二、实验需求1、全网可达&#xff1b;2、使用DHCP获取IP地址&#xff1b;三、配置思路1、在各个交换机上创建vlan2、分析链路类型&#xff0c;配置相应的接口为access口或是trunk口3、配置路…

作者头像 李华
网站建设 2026/5/25 8:08:16

24、网页开发技术综合解析

网页开发技术综合解析 1. 基础概念与环境搭建 在网页开发领域,有众多基础概念和环境搭建的要点需要掌握。首先是互联网相关的概念,互联网地址、IP 协议以及互联网服务提供商(ISP)是网络连接的基础。而在操作系统方面,Linux 是一个重要的选择。Linux 有多种发行版,如 Re…

作者头像 李华
网站建设 2026/5/23 0:44:02

39、SQL Server管理与监控全解析

SQL Server管理与监控全解析 1. 服务器端代码管理 在SQL Server中,创建T - SQL服务器端代码,如存储过程、视图、函数和触发器后,可能需要对其进行修改或删除。每种对象类型都支持与CREATE语法对应的ALTER和DROP T - SQL版本。 当使用ALTER修改服务器端编程对象(如存储过…

作者头像 李华