2013-09-25 18 views
5

Ho creato questa trama enter image description hereAggiungere linee personalizzate in ggplot barplot

con questo codice:

ggplot(data_long, aes(Trial,value,fill=factor(Trial))) +  
    stat_summary(fun.y=mean,geom="bar") + facet_grid(Task~Gruppo) + labs(x="Trial 
    type",y="Accuracy %") + theme(legend.position="none") 

Ora, ho bisogno di aggiungere linee personalizzate che mostrano le differenze tra coppie di valori. Ecco un esempio di quello che voglio fare (vedere i primi due bar con p = 0.46):

enter image description here

Non ho idea sulla soluzione, e le cose sono anche più complicato per me da quando ho usato facet_grid. Qualcuno può aiutarmi?

risposta

6

Innanzitutto, poiché i dati di esempio non vengono forniti, ho creato i miei dati di esempio. Tali dati sono già riassunti (c'è un solo valore per ogni combinazione di livelli.

set.seed(1) 
df<-data.frame(expand.grid(c("Control","Effect"),c("Self","Other"),c("Type1","Type2")), 
    runif(8,0,1)) 
colnames(df)<-c("Treatment","Group","Type","value") 
df 
    Treatment Group Type  value 
1 Control Self Type1 0.2655087 
2 Effect Self Type1 0.3721239 
3 Control Other Type1 0.5728534 
4 Effect Other Type1 0.9082078 
5 Control Self Type2 0.2016819 
6 Effect Self Type2 0.8983897 
7 Control Other Type2 0.9446753 
8 Effect Other Type2 0.6607978 

Ora è necessario aggiungere due nuovi valori per le posizioni di linee. ymin valore è il valore originale più piccola costante. ymax valore è calcolato per ciascuna faccetta (utilizzando Treatment e Type come raggruppamento) ed è un valore massimo in facet più alcuni costante.

library(plyr) 
df<-ddply(df,.(Treatment,Type),transform,ymax=max(value)+0.2) 
df$ymin<-df$value+0.05 
df 
    Treatment Group Type  value  ymax  ymin 
1 Control Self Type1 0.2655087 0.7728534 0.3155087 
2 Control Self Type2 0.2016819 1.1446753 0.2516819 
3 Control Other Type1 0.5728534 0.7728534 0.6228534 
4 Control Other Type2 0.9446753 1.1446753 0.9946753 
5 Effect Self Type1 0.3721239 1.1082078 0.4221239 
6 Effect Self Type2 0.8983897 1.0983897 0.9483897 
7 Effect Other Type1 0.9082078 1.1082078 0.9582078 
8 Effect Other Type2 0.6607978 1.0983897 0.7107978 

secondo frame di dati viene effettuata per le etichette. Qui in ogni posizione sfaccettatura y è di nuovo originale ymax valore più alcune costanti e lab contiene etichette che è necessario visualizzare.

df.names<-ddply(df,.(Treatment,Type),summarise,ymax=ymax[1]+0.1) 
df.names$lab<-c("p=0.46","**","***","*") 
df.names 
    Treatment Type  ymax lab 
1 Control Type1 0.8728534 p=0.46 
2 Control Type2 1.2446753  ** 
3 Effect Type1 1.2082078 *** 
4 Effect Type2 1.1983897  * 

uso value Come ora df è già riassunte geom_bar(stat="identity") anziché stat_summary(). Le righe aggiuntive vengono aggiunte con due chiamate geom_segment(): prima viene tracciata una linea verticale e la seconda aggiunge la linea orizzontale. geom_text() aggiunge etichette sopra le righe.

ggplot(df, aes(Group,value,fill=Group)) +  
    geom_bar(stat="identity") + facet_grid(Type~Treatment) + 
    theme(legend.position="none")+ 
    geom_segment(aes(x=Group,xend=Group,y=ymin,yend=ymax))+ 
    geom_segment(aes(x="Self",xend="Other",y=ymax,yend=ymax))+ 
    geom_text(data=df.names,aes(x=1.5,y=ymax,label=lab),inherit.aes=FALSE) 

enter image description here

+0

Molto grazie per la vostra pazienza, Didzis. È molto chiaro e completo per me. –