Sto cercando di lavorare su un file SPSS (.sav) utilizzando pandas
. In assenza del programma SPSS, ecco quello che un tipico file assomiglia a una volta convertito in .csv:Come conservare le etichette quando il file SPSS (.sav) viene importato nei panda tramite rpy?
Su indagine quali sono le prime due file significano (non so SPSS), sembra che la prima riga contiene lo Label
s, mentre la seconda riga contiene lo VarName
s.
Quando portare il file panda così:
import pandas.rpy.common as com
def savtocsv(filename):
w = com.robj.r('foreign::read.spss("%s", to.data.frame=TRUE)' % filename)
w = com.convert_robj(w)
return w
e poi fare una testa(), la prima fila (Label) è mancante:
Come possono essere mantenute le etichette?
- Rif: Is there a Python module to open SPSS files?
- Python: 2.7.10
- Pandas: 0.17.1
Grandi, che sembra fare quello che bisogno, grazie. Suppongo che potrò quindi qualcuno con i panda inserire questi in intestazioni di colonna, sostituendo i valori varName. Ma è possibile fare la conversione ** e ** includere le etichette in una volta sola (una chiamata a 'com.robj.r()'), per salvare la consegna a fare ulteriori manipolazioni nei panda? – Pyderman
È possibile leggere il file una volta e ottenere gli attributi sull'oggetto restituito, ma ciò richiederà una nuova chiamata r. Si prega di consultare l'aggiornamento. – ayhan
Funziona bene, grazie. – Pyderman