Sto utilizzando il pacchetto dplyr/broom per eseguire regressioni lineari per più sensori. La funzione glance() di broom non funzionerà quando uso lm() all'interno dell'istruzione do, ma lo farò se uso biglm(). Questo non sarebbe un problema, ma mi piacerebbe che r^2, F-Statistic e p-val che lo sguardo ritorni abbastanza bene per il tradizionale lm().Errore di ghiera/Dplyr con colpo d'occhio() quando si utilizza lm invece di biglm
Ho guardato altrove e non riesco a trovare un caso simile con questo errore:
Error in data.frame(r.squared = r.squared, adj.r.squared = adj.r.squared, :
object 'fstatistic' not found
possibili intuizioni:
?Anova
"The comparison between two or more models will only be valid if they are
fitted to the same dataset. This may be a problem if there are missing
values and R's default of na.action = na.omit is used."
Ecco il codice:
library(tidyr)
library(broom)
library(biglm) # if not install.packages("biglm")
library(dplyr)
regressionBig <- tidied_rm_outliers %>%
group_by(sensor_name, Lot.Tool, Lot.Module, Recipe, Step, Stage, MEAS_TYPE) %>%
do(fit = biglm(MEAS_AVG ~ value, data = .)) #note biglm is used
regressionBig
#extract the r^2 from the complex list type from the data frame we just stored
glances <- regressionBig %>% glance(fit)
glances %>%
ungroup() %>%
arrange(desc(r.squared))
#Biglm works but if i try the same thing with regular lm It errors on glance()
ErrorDf <- tidied_rm_outliers %>%
group_by(sensor_name, Lot.Tool, Lot.Module, Recipe, Step, Stage, MEAS_TYPE) %>%
do(fit = lm(MEAS_AVG ~ value, data = .)) #note lm is normal
ErrorDf %>% glance(fit)
#Error in data.frame(r.squared = r.squared, adj.r.squared = adj.r.squared, :
#object 'fstatistic' not found
odio caricare l'intero frame di dati perché so che di solito non è accettabile su S/O, ma non sono sicuro di poter creare un riproducibl esempio senza farlo. https://www.dropbox.com/s/pt6xe4jdxj743ka/testdf.Rda?dl=0
R informazioni sulla sessione su pastebin se lo si desidera here!
posso riprodurre questo quando almeno un coefficiente non è definito a causa della singolarità del modello e quindi non statistica F viene restituito nell'oggetto 'lm' - così' glance' letteralmente non riesce a trovare 'fstatistic'. – aosmith