2011-11-30 8 views
7

Cercando di imparare R. Una domanda da un vecchio testo di statistiche vuole sapere se c'è una differenza nei tempi di pausa in diversi cantieri. Il problema è che il testo ha deciso che ciascun sito impiega un diverso numero di lavoratori. Quindi, sono bloccato e in cerca di aiuto utilizzando ANOVA con dimensioni del campione diseguali.Come fare ANOVA a una via in R con campioni di dimensioni disuguali?

site1 <- c(34,25,27,31,26,34,21) 
site2 <- c(33,35,31,31,42,33) 
site3 <- c(17,30,30,26,32,28,26,29) 
site4 <- c(28,33,31,27,32,33,40) 

risposta

16

Provate questo

site1 <- c(34,25,27,31,26,34,21) 
site2 <- c(33,35,31,31,42,33) 
site3 <- c(17,30,30,26,32,28,26,29) 
site4 <- c(28,33,31,27,32,33,40) 

Data <- data.frame(
     Y=c(site1, site2, site3, site4), 
     Site =factor(rep(c("site1", "site2", "site3", "site4"), times=c(length(site1), length(site2), length(site3), length(site4)))) 
     ) 

dati

Y Site 
34 site1 
25 site1 
27 site1 
31 site1 
26 site1 
34 site1 
21 site1 
33 site2 
35 site2 
31 site2 
31 site2 
42 site2 
33 site2 
17 site3 
30 site3 
30 site3 
26 site3 
32 site3 
28 site3 
26 site3 
29 site3 
28 site4 
33 site4 
31 site4 
27 site4 
32 site4 
33 site4 
40 site4 

ANOVA

fm1 <- aov(Y~Site, data=Data) 
anova(fm1) 

Uscita

Analysis of Variance Table 

Response: Y 
      Df Sum Sq Mean Sq F value Pr(>F) 
Site  3 212.35 70.782 3.4971 0.03098 * 
Residuals 24 485.76 20.240     
--- 
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 
+10

Ben fatto. Anche se si potrebbe voler dire che le dimensioni del campione disuguale che hanno fatto scattare l'OP non sono importanti, in quanto il metodo è esattamente lo stesso se le dimensioni del campione sono uguali o meno. – Aaron