Ho già provato a risolvere il mio problema adattando questo similar question. Tuttavia, ottengo il seguente errore per l'URL o il file con cui voglio farlo.Download ed estrazione di file di dati .gz utilizzando R
trying URL 'http://cbio.mskcc.org/microrna_data/human_predictions_S_C_aug2010.txt.gz'
Content type 'application/x-gzip' length 65933953 bytes (62.9 Mb)
opened URL
downloaded 62.9 Mb
Show Traceback
Rerun with Debug
Error in open.connection(file, "rt") : cannot open the connection In addition: Warning message:
In open.connection(file, "rt") :
cannot open zip file 'D:....'
qui è quello che ho provato:
url_S_C <- "http://cbio.mskcc.org/microrna_data/human_predictions_S_C_aug2010.txt.gz"
tmpFile <- tempfile()
fileName <- gsub(".gz","",basename(url_S_C))
download.file(url_S_C, tmpFile)
data <- read.table(unz(tmpFile, fileName))
unlink(tmpFile)
Forse someoe qui mi può aiutare perché questo particolare file non funziona per me? Si noti che questo file è di dimensioni ridotte (62,9 Mb), ma non sono riuscito a riprodurre l'errore con l'URL della domanda simile.
Grazie!
Quale sistema operativo stai utilizzando? – nrussell
3.2.0-4-amd64 # 1 SMP Debian 3.2.60-1 + deb7u3 x86_64 GNU/Linux Descrizione: Debian GNU/Linux 7.6 (wheezy) – MineSweeper
In R, usando 'gzfile (tmpFile)' invece di 'unz (tmpFile, fileName) 'ha funzionato per me. Dato che sei su Linux, presumo che tu abbia le utility a riga di comando 'wget' e' gunzip', quindi puoi anche scaricare e decomprimere il file '.gz' e poi leggerlo in R come qualsiasi altro file' .txt' . – nrussell