python flask scrapy scrapy-spider

python - Pasando lista como argumentos en Scrapy



flask scrapy-spider (1)

Estoy intentando crear una aplicación usando Flask and Scrapy. Tengo que pasar la list de URL a araña. Intenté usar la siguiente sintaxis:

__init__: in Spider self.start_urls = ["http://www.google.com/patents/" + x for x in u] Flask Method u = ["US6249832", "US20120095946"] os.system("rm static/s.json; scrapy crawl patents -d u=%s -o static/s.json" % u)

Sé que se puede hacer algo similar al leer el archivo que tiene URL requeridas, pero ¿puedo pasar la lista de URL para rastrear?


__init__() método __init__() araña:

class MySpider(Spider): name = ''my_spider'' def __init__(self, *args, **kwargs): super(MySpider, self).__init__(*args, **kwargs) endpoints = kwargs.get(''start_urls'').split('','') self.start_urls = ["http://www.google.com/patents/" + x for x in endpoints]

Y pase la lista de puntos finales a través del argumento de línea de comando -a :

scrapy crawl patents -a start_urls="US6249832,US20120095946" -o static/s.json

Ver también:

Tenga en cuenta que también puede ejecutar Scrapy desde el script :