iterparse

8calore

1risposta

lxml errore etree.iterparse "TypeError: lettura degli oggetti del file deve restituire stringhe semplici"

Vorrei analizzare un documento HTML utilizzando lxml. Sto usando Python 3.2.3 e lxml 2.3.4 (http://www.lfd.uci.edu/~gohlke/pythonlibs/#lxml) Sto usando il etree.iterparse per analizzare il documento,

18calore

2risposta

ElementTree iterparse strategy

Devo gestire documenti xml che sono abbastanza grandi (fino a 1 GB) e li analizziamo con python. Sto usando la funzione iterparse() (analisi stile SAX). La mia preoccupazione è il seguente, immaginate