La mia domanda è relativa a this one per quanto riguarda i dati categoriali (fattori in termini R) quando si utilizza il pacchetto Caret. Capisco dal post collegato che se si utilizza la "interfaccia formula", alcune caratteristiche possono essere fattori e la formazione funzionerà correttamente. La mia domanda è: come posso scalare i dati con la funzione preProcess()
? Se provo e farlo su un telaio di dati con alcune colonne come fattori, ottengo questo messaggio di errore:Come preelaborare le funzionalità quando alcune di esse sono fattori?
Error in preProcess.default(etitanic, method = c("center", "scale")) :
all columns of x must be numeric
Vedi qui alcuni esempi di codice:
library(earth)
data(etitanic)
a <- preProcess(etitanic, method=c("center", "scale"))
b <- predict(etitanic, a)
Grazie.
Penso che abbiamo bisogno solo di due variabili per pclass. ("pclass1st, pclass2nd" o "pclass2nd, pclass3rd" o "pclass3rd, pclass1st"). Come in caso di sesso variabile, abbiamo considerato solo sexmale e sexfemale scartati. Correggimi se non è sufficiente – Sandeep
@topepo, penso che la risposta qui sotto ignori l'elenco delle cose da fare. Suggerirei di aggiungere alcuni avvertimenti per le persone che non presterebbero attenzione. –