Sto lavorando a un progetto in cui ho un sacco di analisti che creano modelli statistici in R. Di solito mi forniscono gli oggetti del modello (file .data) e li automatizzo eseguendoli per vari set di dati.Serializzazione .RData file nel database
Il mio problema è:
Posso usare un database e salvare questi file .rdata lì? Qualche suggerimento per farlo? (Attualmente memorizzo i file .Rdata su disco e utilizzo un database per memorizzare le informazioni sulla posizione)
Ricevo molti script R da altri analisti che hanno eseguito alcuni pre-elaborazione dei dati prima di creare i modelli. Qualcuno ha esperienza nell'utilizzo di PMML per rendere ripetibile questo processo senza l'intervento manuale? PMML memorizza i passaggi di pre-elaborazione, i passaggi di modellazione come tag di markup e ripeterà lo stesso su un nuovo set di dati.
Grazie per i suggerimenti e le risposte.
-Harsh
Anche se i BLOB non sono supportati, è possibile serializzare/unserializzare da e verso ascii (come si fa anche nell'esempio) e quindi memorizzare la stringa ascii. –
Pensavo di averlo detto? ho detto qualcosa di sbagliato? –
Si noti che l'obj serializzato ascii è grande 16k byte (lunghezza (obj)), la versione binaria è grande 11k, ma se si salva ("tt", file = "tt.RData") si ottiene qualcosa solo 5k grandi. – Spacedman