C'è un modo per eseguire tutti gli spider in un progetto Scrapy senza utilizzare il daemon Scrapy? C'era un modo per eseguire più spider con scrapy crawl
, ma quella sintassi è stata rimossa e il codice di Scrapy è cambiato parecchio.Locally esegue tutti gli spider in Scrapy
Ho cercato di creare il mio comando:
from scrapy.command import ScrapyCommand
from scrapy.utils.misc import load_object
from scrapy.conf import settings
class Command(ScrapyCommand):
requires_project = True
def syntax(self):
return '[options]'
def short_desc(self):
return 'Runs all of the spiders'
def run(self, args, opts):
spman_cls = load_object(settings['SPIDER_MANAGER_CLASS'])
spiders = spman_cls.from_settings(settings)
for spider_name in spiders.list():
spider = self.crawler.spiders.create(spider_name)
self.crawler.crawl(spider)
self.crawler.start()
Ma una volta che un ragno è iscritto su self.crawler.crawl()
, ricevo errori di asserzione per tutti gli altri ragni:
Traceback (most recent call last):
File "/usr/lib/python2.7/site-packages/scrapy/cmdline.py", line 138, in _run_command
cmd.run(args, opts)
File "/home/blender/Projects/scrapers/store_crawler/store_crawler/commands/crawlall.py", line 22, in run
self.crawler.crawl(spider)
File "/usr/lib/python2.7/site-packages/scrapy/crawler.py", line 47, in crawl
return self.engine.open_spider(spider, requests)
File "/usr/lib/python2.7/site-packages/twisted/internet/defer.py", line 1214, in unwindGenerator
return _inlineCallbacks(None, gen, Deferred())
--- <exception caught here> ---
File "/usr/lib/python2.7/site-packages/twisted/internet/defer.py", line 1071, in _inlineCallbacks
result = g.send(result)
File "/usr/lib/python2.7/site-packages/scrapy/core/engine.py", line 215, in open_spider
spider.name
exceptions.AssertionError: No free spider slots when opening 'spidername'
Esiste un modo per Fai questo? Preferirei non iniziare la sottoclasse dei componenti di base di Scrapy solo per eseguire tutti i miei spider in questo modo.
Quale versione di Scrapy stai usando? '$ scrapy version -v' –
Sai di [' scrapyd'] (http://doc.scrapy.org/en/latest/topics/scrapyd.html)? –
'0.16.4'. So di Scrapyd, ma sto testando questi spider localmente, quindi preferirei non usarlo. – Blender