Ho un dataframe con circa ~ 250 variabili. Sfortunatamente, tutte queste variabili sono state importate come classi di caratteri da un database SQL utilizzando sqldf
. Il problema: tutti loro non dovrebbero essere classi di personaggi. Ci sono variabili numeriche, numeri interi e date. Mi piacerebbe costruire un modello su tutte le variabili e per fare questo ho bisogno di assicurarmi che le variabili abbiano le classi giuste. Farlo uno per uno è probabilmente il migliore, ma comunque molto manuale.Qualsiasi modo per correggere automaticamente tutte le classi variabili in un dataframe
Come è possibile correggere automaticamente tutte le classi? Forse un modo per rilevare se ci sono caratteri alfabetici nella colonna o solo caratteri numerici?
Non credo sia possibile che un approccio automatico sia perfetto per correggere tutte le classi. Ma potrebbe correggere la maggior parte delle classi, quindi quelle che non sono buone, posso prendermene cura manualmente.
Aggiungo un tag sqldf nel caso in cui qualcuno conosca un modo per correggerlo durante l'importazione dei dati, ma presumo che non sia colpa di sqldf ma piuttosto del database.
ciao Richard, l'ho usato di recente su un altro data frame e ha dato questo errore 'Error in FUN (X [[i]], ...): il primo argomento deve essere di carattere mode' Mi chiedevo se sapevi perché questo stava accadendo – jgozal
sembra che type.convert() si aspetti un vettore di caratteri come primo argomento. Ho provato a convertire il mio df in as.character (df), ma poi convertito tutto in tipo di fattore – jgozal
@jgozal Se vuoi che i caratteri rimangano caratteri e non siano forzati a fattori, imposta 'as.is = TRUE' in' .convert' –