Ho un file XML con migliaia di linee come:XML per i panda dataframe
<Word x1="206" y1="120" x2="214" y2="144" font="Times-Roman" style="font-size:22pt">WORD</Word>
voglio convertirlo (tutti i suoi attributi) per pandas
dataframe
. Per farlo potevo scorrere il file usando una bella zuppa e inserire i valori riga per riga o creare liste da inserire come colonne. Tuttavia mi piacerebbe sapere se c'è un modo più plateale di realizzare ciò che ho descritto. Grazie in anticipo.
Codice esempio:
x1list=[]
x2list=[]
for word in soup.page.findAll('word'):
x1list.append(int(word['x1']))
x2list.append(int(word['x2']))
df=DataFrame({'x1':x1list,'x2':x2list})
Mostraci il tuo codice. – eumiro
@eumiro: aggiunto un esempio di codice ... – root