Vorrei analizzare un documento HTML utilizzando lxml. Sto usando Python 3.2.3 e lxml 2.3.4 (http://www.lfd.uci.edu/~gohlke/pythonlibs/#lxml) Sto usando il etree.iterparse per analizzare il documento,
Devo gestire documenti xml che sono abbastanza grandi (fino a 1 GB) e li analizziamo con python. Sto usando la funzione iterparse() (analisi stile SAX). La mia preoccupazione è il seguente, immaginate