Ho due variabili di carattere (nomi di oggetti) e voglio estrarre la più grande sottostringa comune.Trova sottostringhe comuni tra due variabili di carattere
a <- c('blahABCfoo', 'blahDEFfoo')
b <- c('XXABC-123', 'XXDEF-123')
voglio il seguente come risultato:
[1] "ABC" "DEF"
Questi vettori come input dovrebbero dare lo stesso risultato:
a <- c('textABCxx', 'textDEFxx')
b <- c('zzABCblah', 'zzDEFblah')
Questi esempi sono rappresentativi. Le stringhe contengono elementi identificativi e il resto del testo in ogni elemento del vettore è comune, ma sconosciuto.
C'è una soluzione, in uno dei seguenti posti (in ordine di preferenza):
Base R
pacchetti raccomandati
pacchetti disponibili sul CRAN
La risposta al presunto duplicato fa n ot soddisfare questi requisiti.
Controlla questa domanda: http://stackoverflow.com/questions/ 1429476/longest-common-substring-problem – dave
Anche questo: http://finzi.psych.upenn.edu/R/Rhelp02a/archive/68013.html –
http://svitsrv25.epfl.ch/R-doc/library /Biostrings/html/pmatchPattern.html e questo http://www.emoticode.net/r/longest-common-substring.html –