Sto raschiando un sito Web utilizzando Scrapy che richiede la cottura e il java-script per essere abilitato. Non penso che dovrò effettivamente elaborare javascript. Tutto ciò di cui ho bisogno è fingere che javascript sia abilitato.Come inviare JavaScript e cookie abilitati in Scrapy?
Ecco che cosa ho provato: 1) attivare i cookie attraverso il seguente nelle impostazioni
COOKIES_ENABLED = True
COOKIES_DEBUG = True
2) usando Scaricare middleware per i cookie
DOWNLOADER_MIDDLEWARES = {
'scrapy.contrib.downloadermiddleware.useragent.UserAgentMiddleware': 400,
'scrapy.contrib.downloadermiddleware.cookies.CookiesMiddleware':700
}
3) Invio di 'X-abilitato per JavaScript ':' True '
DEFAULT_REQUEST_HEADERS={
'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8',
'Accept-Language': 'en',
'X-JAVASCRIPT-ENABLED': 'True'
}
ma nessuno di loro sta lavorando con me. Potete suggerire qualche idea o darmi qualche indicazione?
Grazie in anticipo per le risposte.
Akhter, Grazie per la risposta. Come ho detto, non avrò bisogno di elaborare JavaScript. Il server non mi darà la pagina effettiva se il seed javascript non è abilitato sulla fonte richiedente. Devo solo inviare un segnale al server che javascript e cookie siano abilitati. –