Ho uno data.frame
costituito da variabili numeriche e fattore come illustrato di seguito.Tutti i livelli di un fattore in una matrice modello in R
testFrame <- data.frame(First=sample(1:10, 20, replace=T),
Second=sample(1:20, 20, replace=T), Third=sample(1:10, 20, replace=T),
Fourth=rep(c("Alice","Bob","Charlie","David"), 5),
Fifth=rep(c("Edward","Frank","Georgia","Hank","Isaac"),4))
voglio costruire una matrix
che assegna variabili dummy al fattore e lascia le variabili numeriche da solo.
model.matrix(~ First + Second + Third + Fourth + Fifth, data=testFrame)
Come previsto durante l'esecuzione lm
questo lascia fuori un livello di ciascun fattore come livello di riferimento. Tuttavia, voglio creare un matrix
con una variabile dummy/indicatore per ogni livello di tutti i fattori. Sto costruendo questa matrice per glmnet
quindi non sono preoccupato per la multicollinearità.
C'è un modo per avere model.matrix
creare il manichino per ogni livello del fattore?
Che completamente lavorato e mi prendo quella risposta, ma se sto entrando in 20 fattori c'è un modo di fare che universalmente per tutte le variabili in una cornice o sono io destinato a digitare troppo? – Jared