Ecco alcuni dati e una trama:geom_smooth su un sottoinsieme di dati
set.seed(18)
data = data.frame(y=c(rep(0:1,3),rnorm(18,mean=0.5,sd=0.1)),colour=rep(1:2,12),x=rep(1:4,each=6))
ggplot(data,aes(x=x,y=y,colour=factor(colour)))+geom_point()+ geom_smooth(method='lm',formula=y~x,se=F)
Come si può vedere la regressione lineare è fortemente influenzata dai valori in cui x = 1. È possibile ottenere regressioni lineari calcolate per x> = 2 ma visualizzare i valori per x = 1 (y è uguale a 0 o 1). Il grafico risultante sarebbe esattamente lo stesso ad eccezione delle regressioni lineari. Non avrebbero "sofferto" l'influenza dei valori su abscisse = 1
Aahh Amo le soluzioni semplici! Molte grazie. E grazie anche per il consiglio e il trucco di trasparenza. –
Cosa devo fare se questa soluzione produce questo errore "L'estetica deve essere di lunghezza 1 o uguale ai dati" sul mio set di dati? –