雷火电竞-中国电竞赛事及体育赛事平台

歡迎來(lái)到入門(mén)教程網(wǎng)!

C語(yǔ)言

當(dāng)前位置:主頁(yè) > 軟件編程 > C語(yǔ)言 >

利用C++實(shí)現(xiàn)最長(zhǎng)公共子序列與最長(zhǎng)公共子串

來(lái)源:本站原創(chuàng)|時(shí)間:2020-01-10|欄目:C語(yǔ)言|點(diǎn)擊:

一、問(wèn)題描述

子串應(yīng)該比較好理解,至于什么是子序列,這里給出一個(gè)例子:有兩個(gè)母串

cnblogs

belong

比如序列bo, bg, lg在母串cnblogs與belong中都出現(xiàn)過(guò)并且出現(xiàn)順序與母串保持一致,我們將其稱為公共子序列。最長(zhǎng)公共子序列(Longest Common Subsequence, LCS),顧名思義,是指在所有的子序列中最長(zhǎng)的那一個(gè)。子串是要求更嚴(yán)格的一種子序列,要求在母串中連續(xù)地出現(xiàn)。在上述例子的中,最長(zhǎng)公共子序列為blog(cnblogs, belong),最長(zhǎng)公共子串為lo(cnblogs, belong)。

二、求解算法

對(duì)于母串X=<x1,x2,⋯,xm>X=<x1,x2,⋯,xm>, Y=<y1,y2,⋯,yn>Y=<y1,y2,⋯,yn> ,求LCS與最長(zhǎng)公共子串。

暴力解法

假設(shè) m<nm<n, 對(duì)于母串XX,我們可以暴力找出2m2m個(gè)子序列,然后依次在母串YY中匹配,算法的時(shí)間復(fù)雜度會(huì)達(dá)到指數(shù)級(jí)O(n∗2m)O(n∗2m) 。顯然,暴力求解不太適用于此類問(wèn)題。

動(dòng)態(tài)規(guī)劃

假設(shè)Z=<z1,z2,⋯,zk>Z=<z1,z2,⋯,zk>是XX與YY的LCS, 我們觀察到

     如果xm=ynxm=yn,則zk=xm=ynzk=xm=yn,有Zk−1Zk−1是Xm−1Xm−1與Yn−1Yn−1的LCS;

     如果xm≠ynxm≠yn,則ZkZk是XmXm與Yn−1Yn−1的LCS,或者是Xm−1Xm−1與YnYn的LCS。

因此,求解LCS的問(wèn)題則變成遞歸求解的兩個(gè)子問(wèn)題。但是,上述的遞歸求解的辦法中,重復(fù)的子問(wèn)題多,效率低下。改進(jìn)的辦法——用空間換時(shí)間,用數(shù)組保存中間狀態(tài),方便后面的計(jì)算。這就是動(dòng)態(tài)規(guī)劃(DP)的核心思想了。

DP 求解 LCS

用二維數(shù)組c[i][j]記錄串x1x2⋯xix1x2⋯xi與y1y2⋯yjy1y2⋯yj的LCS長(zhǎng)度,則可得到狀態(tài)轉(zhuǎn)移方程

代碼實(shí)現(xiàn)

public static int lcs(String str1, String str2) {
 int len1 = str1.length();
 int len2 = str2.length();
 int c[][] = new int[len1+1][len2+1];
 for (int i = 0; i <= len1; i++) {
 for( int j = 0; j <= len2; j++) {
  if(i == 0 || j == 0) {
  c[i][j] = 0;
  } else if (str1.charAt(i-1) == str2.charAt(j-1)) {
  c[i][j] = c[i-1][j-1] + 1;
  } else {
  c[i][j] = max(c[i - 1][j], c[i][j - 1]);
  }
 }
 }
 return c[len1][len2];
}

DP 求解最長(zhǎng)公共子串

前面提到了子串是一種特殊的子序列,因此同樣可以用DP來(lái)解決。定義數(shù)組的存儲(chǔ)含義對(duì)于后面推導(dǎo)轉(zhuǎn)移方程顯得尤為重要,糟糕的數(shù)組定義會(huì)導(dǎo)致異常繁雜的轉(zhuǎn)移方程??紤]到子串的連續(xù)性,將二維數(shù)組c[i][j]用來(lái)記錄具有這樣特點(diǎn)的子串——結(jié)尾同時(shí)也為為串x1x2⋯xix1x2⋯xi與y1y2⋯yjy1y2⋯yj的結(jié)尾——的長(zhǎng)度。

得到轉(zhuǎn)移方程:

最長(zhǎng)公共子串的長(zhǎng)度為 max(c[i,j]), i∈{1,⋯,m},j∈{1,⋯,n}max(c[i,j]), i∈{1,⋯,m},j∈{1,⋯,n} 。

代碼實(shí)現(xiàn)

public static int lcs(String str1, String str2) {
 int len1 = str1.length();
 int len2 = str2.length();
 int result = 0; //記錄最長(zhǎng)公共子串長(zhǎng)度
 int c[][] = new int[len1+1][len2+1];
 for (int i = 0; i <= len1; i++) {
 for( int j = 0; j <= len2; j++) {
  if(i == 0 || j == 0) {
  c[i][j] = 0;
  } else if (str1.charAt(i-1) == str2.charAt(j-1)) {
  c[i][j] = c[i-1][j-1] + 1;
  result = max(c[i][j], result);
  } else {
  c[i][j] = 0;
  }
 }
 }
 return result;
}

總結(jié)

以上就是這篇文章的全部?jī)?nèi)容改了,希望本文的內(nèi)容對(duì)大家的學(xué)習(xí)或者工作能帶來(lái)一定的幫助,如果有疑問(wèn)大家可以留言交流。

上一篇:C語(yǔ)言設(shè)計(jì)一個(gè)閃閃的圣誕樹(shù)

欄    目:C語(yǔ)言

下一篇:老生常談C++的單例模式與線程安全單例模式(懶漢/餓漢)

本文標(biāo)題:利用C++實(shí)現(xiàn)最長(zhǎng)公共子序列與最長(zhǎng)公共子串

本文地址:http://www.jygsgssxh.com/a1/Cyuyan/1937.html

網(wǎng)頁(yè)制作CMS教程網(wǎng)絡(luò)編程軟件編程腳本語(yǔ)言數(shù)據(jù)庫(kù)服務(wù)器

如果侵犯了您的權(quán)利,請(qǐng)與我們聯(lián)系,我們將在24小時(shí)內(nèi)進(jìn)行處理、任何非本站因素導(dǎo)致的法律后果,本站均不負(fù)任何責(zé)任。

聯(lián)系QQ:835971066 | 郵箱:835971066#qq.com(#換成@)

Copyright © 2002-2020 腳本教程網(wǎng) 版權(quán)所有