Sto usando lxml per analizzare i file html dati URL.Qual è l'accordo su https quando si usa lxml?
Ad esempio:
link = 'https://abc.com/def'
htmltree = lxml.html.parse(link)
Il mio codice funziona bene per la maggior parte dei casi, quelli con http://
. Tuttavia, ho trovato per ogni URL https://
, lxml ottiene semplicemente un IOError. Qualcuno conosce la ragione? E possibilmente, come correggere questo problema?
BTW, voglio attenermi a lxml che passare a BeautifulSoup dato che ho già un programma veloce.
'da urllib.request urlopen' di importazione per python3 –