Sono nuovo di scrapy framework e ho visto alcuni tutorial utilizzando LinkExtractors
e alcuni utilizzando SgmlLinkExtractor
. Ho provato a cercare le differenze/i pro-contro per entrambi, ma i risultati non sono stati soddisfacenti.Differenza tra LinkExtractor e SgmlLinkExtractor
Qualcuno può dirmi la differenza tra entrambi? Quando dovremmo usare gli estrattori sopra?
Grazie!
Per quanto riguarda le differenze, 'SgmlLinkExtractor' è basato su [' sgmllib.SGMLParser'] (https://docs.python.org/2/library/sgmllib.html) (il modulo 'sgml' è deprecato da Python 2.6 , e non è disponibile in Python3), mentre il predefinito 'LinkExtractor' è implementato su' lxml', che è un po 'più veloce e ben mantenuto. –