Abbina due elenchi in R, uno con stringhe parziali e un altro con stringa intera, restituisce l'intera stringa se corrisponde. Restituisce solo le corrispondenze univoche (una volta).Abbina due elenchi, uno con stringhe parziali e l'altro con stringa intera, restituisce l'intera stringa se corrisponde
Quindi, supponiamo di avere un file CSV e ogni riga ha una stringa lunga (la lunga lista). Quindi, abbreviare la stringa utilizzando substr, quindi elimina le stringhe duplicate utilizzando unique. Quindi voglio confrontare l'elenco di stringhe lunghe df12
con l'elenco breve univoco df14
e se esistono corrispondenze univoche nella ricerca di stringhe parziali (df14
rispetto a df12
), quindi restituire l'intera stringa da df12
.
Questo è df12
(lista di stringhe lungo)
[1] I like stackoverflow very much today
[2] I like stackoverflow much today
[3] I dont like stackoverflow very much today
[4] I dont like you!
[5] What?
df13<-substr(df12, start=0, stop=30)
Questo è df13
(stringhe accorciati - non uniche)
[1] I like stacko
[2] I like stacko
[3] I dont like s
[4] I dont like y
[5] What?
df14<-unique(df13)
Questo è df14
(stringhe abbreviati - stringhe univoche dopo l'applicazione metodo unico)
[1] I like stacko
[2] I dont like s
[3] I dont like y
[4] What?
Questo è il risultato che voglio alla fine
[1] I like stackoverflow very much today
[2] I dont like stackoverflow very much today
[3] I dont like you!
[4] What?
'df13 <-substr (df12, start = 0, stop = 30)' non produce l'output previsto per me. Dovrebbe essere 'df13 <-substr (df12, start = 0, stop = 13)'? – NGaffney