questo è il mio primo post e io sono nuovo di programmazione e R.Utilizzando R, Come faccio a contrassegnare i valori duplicati in sequenza in un'unica colonna di un dataframe
Sto cercando di creare una nuova colonna per contrassegnare o contrassegna i valori sequenzialmente duplicati in una colonna separata.
df < - c (2,2,2,2,3,4,3,4,3,4,2,3,7,7,7))
Utilizzando la funzione restituisce il duplicato seguente:
data.frame (value = df, bandiera = duplicato (df))
value flag
1 2 FALSE
2 2 TRUE
3 2 TRUE
4 2 TRUE
5 3 FALSE
6 4 FALSE
7 3 TRUE
8 4 TRUE
9 3 TRUE
10 4 TRUE
11 2 TRUE
12 3 TRUE
13 7 FALSE
14 7 TRUE
15 7 TRUE
Quello che mi piacerebbe è:
value flag
1 2 TRUE
2 2 TRUE
3 2 TRUE
4 2 TRUE
5 3 FALSE
6 4 FALSE
7 3 FALSE
8 4 FALSE
9 3 FALSE
10 4 FALSE
11 2 FALSE
12 3 FALSE
13 7 TRUE
14 7 TRUE
15 7 TRUE
Il mio set di dati ha ove r 2 milioni di osservazioni, quindi idealmente la soluzione sarebbe efficiente.
Grazie, John
Dato che sei relativamente nuovo qui puoi leggere il [** circa **] (http://stackoverflow.com/about) e il [** faq **] (http: // stackoverflow.com/faq) su come funziona SO. StackOverflow è reso molto più prezioso per tutti se quando ricevi una risposta che risolve il tuo problema, lo accetti facendo clic sul piccolo segno di spunta o upvote una risposta utile. Non sei assolutamente obbligato a farlo, ma è un ottimo modo per "restituire" al sito se una risposta ha effettivamente risolto il tuo problema e aiuta a mantenere il sito libero da domande senza risposta a cui è stata data risposta. Grazie! –