Sto cercando di strisciare questo sito: http://www.aido.com/eshop/cl_2-c_189-p_185/stationery/pens.htmlImpaginazione utilizzando Scrapy
posso ottenere tutti i prodotti di questa pagina, ma come faccio a rilasciare la richiesta di "View More" link in fondo alla pagina ?
Il mio codice fino ad ora è:
rules = (
Rule(SgmlLinkExtractor(restrict_xpaths='//li[@class="normalLeft"]/div/a',unique=True)),
Rule(SgmlLinkExtractor(restrict_xpaths='//div[@id="topParentChilds"]/div/div[@class="clm2"]/a',unique=True)),
Rule(SgmlLinkExtractor(restrict_xpaths='//p[@class="proHead"]/a',unique=True)),
Rule(SgmlLinkExtractor(allow=('http://[^/]+/[^/]+/[^/]+/[^/]+$',), deny=('/about-us/about-us/contact-us', './music.html', ) ,unique=True),callback='parse_item'),
)
Qualsiasi aiuto?
Questo è stato utile, ma un esempio di come "istanziare l'oggetto richiesta di scrapy" sarebbe stato ancora più utile. – SMPLGRP