Un modo relativamente semplice sarebbe quello di ricostruire le sequenze dalla matrice LCS. Ecco un algoritmo O (n^2 * k + x * n) per farlo, dove x è la dimensione dell'output (ovvero il numero di sottosequenze comuni di lunghezza k). E 'in C++, ma dovrebbe essere piuttosto facile da tradurre in C:
const int N = 100;
int lcs[N][N];
set<tuple<string,int,int,int>> vis;
string s1 = "AAGACC";
string s2 = "AGATAACCAGGAGCTGC";
void reconstruct(const string& res, int i, int j, int k) {
tuple<string,int,int,int> st(res, i, j, k);
if (vis.count(st))
return;
vis.insert(st);
if (lcs[i][j] < k) return;
if (i == 0 && j == 0 && k == 0) {
cout << res << endl;
return;
}
if (i > 0)
reconstruct(res, i-1, j, k);
if (j > 0)
reconstruct(res, i, j-1, k);
if (i>0 && j>0 && s1[i-1] == s2[j-1])
reconstruct(string(1,s1[i-1]) + res, i-1, j-1, k-1);
}
int main() {
lcs[0][0] = 0;
for (int i = 0; i <= s1.size(); ++i)
lcs[i][0] = 0;
for (int j = 0; j <= s1.size(); ++j)
lcs[0][j] = 0;
for (int i = 0; i <= s1.size(); ++i) {
for (int j = 0; j <= s2.size(); ++j) {
if (i > 0)
lcs[i][j] = max(lcs[i][j], lcs[i-1][j]);
if (j > 0)
lcs[i][j] = max(lcs[i][j], lcs[i][j-1]);
if (i > 0 && j > 0 && s1[i-1] == s2[j-1])
lcs[i][j] = max(lcs[i][j], lcs[i-1][j-1] + 1);
}
}
reconstruct("", s1.size(), s2.size(), 5);
}
Ci dovrebbe essere anche un O (n * (k + x)) modo per risolvere questo, sulla base di un po' diverso approccio DP: Sia f (i, k) l'indice minimo j tale che lcs (i, j)> = k. Abbiamo la ricorrenza
f(i, 0) = 0 for all i
f(i, k) = min{f(i-1, k),
minimum j > f(i-1, k-1) such that s2[j] = s1[i]}
Possiamo anche ricostruire le sequenze di lunghezza k dalla matrice f.
OP, siete familiarità con la programmazione dinamica * *? Dovresti trovarlo in qualsiasi buon libro di algoritmi. –
Le sottosequenze comuni sono uguali alle stringhe ma diverse come le sequenze di posizioni di origine considerate uguali? Ad esempio, nel tuo esempio, ci sono 3 * 15 = 45 modi per produrre la sottosuccessione comune 'AA', quindi dovresti restituire 'AA' 45 volte, o solo una volta? –
@j_random_hacker solo una volta. –