Sto cercando di estrarre un contenuto di tabelle nel documento DOCX Word e il ragazzo sono nuovo in xml/xpath.Estrazione di tabelle da un documento di Word DOCX in python
from docx import *
document = opendocx('someFile.docx')
tableList = document.xpath('/w:tbl')
Questo innesca "XPathEvalError: non definito namespace prefix" errore. Sono sicuro che sarà il primo a aspettarsi durante lo sviluppo della sceneggiatura. Purtroppo, non ho trovato un tutorial per python-docx.
Potrebbe gentilmente fornire un esempio di estrazione della tabella?
Dove hai preso DOCX? Puoi fornire un URL? –
Dovresti cercare un tutorial xml python. La funzione opendocx restituisce un documento xml, secondo la fonte. Il resto delle funzioni nella libreria python-docx sono wrapper attorno alla libreria python lxml, su http://lxml.de/ o così mi sembra. –
@Spencer Rathbun: il seguente codice non genera errori, ma restituisce stranamente [] 'tableList = document.xpath ('// tbl')' 'print tableList' Questa è una funzione DOCX che non capire? – mgierdal