2015-12-11 10 views
10

mia tbl_df:filtro dplyr su Data

> p2p_dt_SKILL_A%>% 
    + select(Patch,Date,Prod_DL)%>% 
    + head() 
     Patch  Date Prod_DL 
    1 BVG1 2015-09-04 3.43 
    2 BVG11 2015-09-11 3.49 
    3 BVG12 2015-09-18 3.45 
... 
    4 BVG13 2015-12-06 3.57 
    5 BVG14 2015-12-13 3.43 
    6 BVG15 2015-12-20 3.47 

voglio selezionare tutto rows in base alla data, ad esempio, se Date è maggiore di 2015-09-04 e meno di 2015-09-18

Il risultato dovrebbe essere:

 Patch  Date   Prod_DL 
     BVG1  2015-09-04 3.43 
     BVG11  2015-09-11 3.49 

Ho provato quanto segue ma restituisce il vettore vuoto vuoto.

p2p_dt_SKILL_A%>% 
       select(Patch,Date,Prod_DL)%>% 
       filter(Date > "2015-09-04" & Date <"2015-09-18") 

restituisce solo:

> p2p_dt_SKILL_A%>% 
+     select(Patch,Date,Prod_DL)%>% 
+     filter(Date > 2015-09-12 & Date <2015-09-18) 
Source: local data table [0 x 3] 

Variables not shown: Patch (fctr), Date (date), Prod_DL (dbl) 

provato anche con le citazioni.

E usando lubridate

p2p_dt_SKILL_A%>% 
       select(Patch,Date,Prod_DL)%>% 
       #filter(Date > 2015-09-12 & Date <2015-09-18)%>% 
       filter(Patch %in% c("BVG1"),month(p2p_dt_SKILL_A$Date) == 9)%>% 
       arrange(Date) 

Ma questo mi dà i dati interi di settembre.

Esiste un modo più efficiente di utilizzare l'operatore between da dplyr su Date tipi di variabili ??

+1

Puoi aggiungere str (p2p_dt_SKILL_A) nella tua domanda. Voglio vedere se Date è un oggetto 'date' o qualcos'altro –

+0

@PLapointe è già lì nella parte di ritorno. 'Variabili non mostrate: Patch (fctr), Data (data), Prod_DL (dbl)' ... È un tipo di data – Shery

+0

Le date non sono quotate (") in quella parte del codice. Guarda la mia risposta qui sotto: –

risposta

11

se la data è formattata correttamente come date, il tuo primo tentativo funziona:

p2p_dt_SKILL_A <-read.table(text="Patch,Date,Prod_DL 
BVG1,9/4/2015,3.43 
BVG11,9/11/2015,3.49 
BVG12,9/18/2015,3.45 
BVG13,12/6/2015,3.57 
BVG14,12/13/2015,3.43 
BVG15,12/20/2015,3.47 
",sep=",",stringsAsFactors =FALSE, header=TRUE) 

p2p_dt_SKILL_A$Date <-as.Date(p2p_dt_SKILL_A$Date,"%m/%d/%Y") 

p2p_dt_SKILL_A%>% 
       select(Patch,Date,Prod_DL)%>% 
       filter(Date > "2015-09-04" & Date <"2015-09-18") 
    Patch  Date Prod_DL 
1 BVG11 2015-09-11 3.49 

UPDATE

funziona ancora se i dati è di tipo tbl_df.

p2p_dt_SKILL_A <-tbl_df(p2p_dt_SKILL_A) 

p2p_dt_SKILL_A%>% 
       select(Patch,Date,Prod_DL)%>% 
       filter(Date > "2015-09-04" & Date <"2015-09-18") 
Source: local data frame [1 x 3] 

    Patch  Date Prod_DL 
    (chr)  (date) (dbl) 
1 BVG11 2015-09-11 3.49 
+0

Sì ma non mostra il risultato ... I sto facendo esattamente la stessa cosa – Shery

+0

Le date sono indicate (") nel tuo codice? Nella tua domanda, hai sia quotato che non quotato. –

+0

Provato con entrambi ... Tuttavia, il mio 'dataframe' è di tipo' tbl_dl' non è sicuro se questo faccia la differenza? – Shery

2

Un'altra opzione più prolisso sarebbe quella di utilizzare la funzione between, una scorciatoia per x> = sinistra & x < = destra. Dobbiamo modificare i giorni per tenere conto del segnale = e utilizzare as.Date (spiegazione here).

p2p_dt_SKILL_A%>% 
       select(Patch,Date,Prod_DL)%>% 
       filter(between(Date, as.Date("2015-09-05"),as.Date("2015-09-17")))