2015-09-16 22 views
6

Sto provando a includere un dataset (un po ') grande in un pacchetto R. Continuo a ricevere l'avviso durante il check-in Rstudio dicendo che potevo risparmiare spazio con la compressione:Come comprimere i salvataggi nel pacchetto R build

* checking data for ASCII and uncompressed saves ... WARNING 

    Note: significantly better compression could be obtained 
     by using R CMD build --resave-data 
      old_size new_size compress 
    slp.rda 499Kb 310Kb bzip2 
    sst.rda 1.3Mb 977Kb  xz 

Ho provato ad aggiungere -- resave-data a "Configura buid Strumenti" di RStudio a nessun effetto.

enter image description here

risposta

5

La devtools funzione use_data prende un parametro per il tipo di compressione e rende l'aggiunta di dati di pkgs molto più facile in generale. Usandolo, o semplicemente save da solo, usa la compressione xz quando salvi i tuoi dati (per save è il parametro compression_level).

Se si desidera utilizzare --resave-data allora si può provare --resave-data=best poiché solo utilizzando --resave-data default gzip (voi guadagnando praticamente nulla in questo caso).

Vedere Building package tarballs per ulteriori informazioni.

+1

Grazie per la vostra risposta - Ho provato 'save' con la compressione. L'errore di compressione è ora scomparso, ma ora ricevo l'avviso: 'Attenzione: il pacchetto ha bisogno di dipendenza da R (> = 2.10)'. Qualche esperienza con quello? –

+3

Ciò è dovuto alla compressione extra. Aggiungi 'R (> = 2.10)' al tuo file 'DESCRIPTION'. – hrbrmstr

0

Un'altra alternativa, se si dispone di un set di dati di grandi dimensioni che non si desidera ricreare, è utilizzare tools::resaveRdaFiles da R. Puntarlo sul file del set di dati o sull'intera directory di dati e comprimerà il dati in un formato a tua scelta. Vedere il suo manual page per ulteriori informazioni.