Esta es la solución más correcta que te podemos dar, pero mírala pausadamente y analiza si se puede adaptar a tu trabajo.
Ejemplo: rastreador web de python
import scrapy
class BlogSpider(scrapy.Spider):
name ='blogspider'
start_urls =['https://blog.scrapinghub.com']
def parse(self, response):
fortitlein response.css('.post-header>h2'):
yield 'title': title.css('a ::text').get()fornext_pagein response.css('a.next-posts-link'):
yield response.follow(next_page, self.parse)
No se te olvide mostrar este ensayo si te fue de ayuda.
¡Haz clic para puntuar esta entrada!
(Votos: 0 Promedio: 0)