2016-05-17 28 views

risposta

64

Nella nuova versione (scrapy 1.1) lanciata il 2016-05-11, la ricerca per indicizzazione scarica prima robots.txt prima della scansione. Per cambiare questo cambiamento di comportamento nel vostro settings.py con ROBOTSTXT_OBEY

ROBOTSTXT_OBEY=False 

Ecco il release notes

0

Per prima cosa è necessario assicurarsi di modificare il proprio agente utente nella richiesta, altrimenti il ​​programma utente predefinito verrà bloccato di sicuro.