2015-07-30 12 views
5

Sto provando a racimolare un elenco di eventi da un sito http://www.cityoflondon.gov.uk/events/, ma quando lo demolisco con import.io riesco ad estrarre solo la prima pagina.Come raschiare più pagine con Import.io

Come è possibile estrarre tutte le pagine contemporaneamente?

+0

Ho trovato questo corso su [Udemy] (https://www.udemy.com/how-to-extract-data-from-the-web) e mi ha davvero aiutato a capire Import.io , specialmente sulla lezione 3 dove spiega di più sul Crawler. – Huander

risposta

3

È possibile estrarre i dati con questo sito, con un crawler o utilizzando l'estensione di massa. Il sito web di cui sopra utilizza un modo molto semplice forma di impaginazione:

http://www.cityoflondon.gov.uk/events/Pages/default.aspx  
http://www.cityoflondon.gov.uk/events/Pages/default.aspx?start1=13  
http://www.cityoflondon.gov.uk/events/Pages/default.aspx?start1=49  
http://www.cityoflondon.gov.uk/events/Pages/default.aspx?start1=25  
http://www.cityoflondon.gov.uk/events/Pages/default.aspx?start1=37 

Ecco una serie di dati che ho creato per gli URL di cui sopra che dovrebbe contenere tutte le informazioni rilevanti.

319aebad-88ea-4053-a649-2087011ce041

Se avete ulteriori domande su un singolo sito web, si prega di contattare [email protected]

Grazie! Meg

+1

wow, grazie mille è perfetto. – Huander

+1

Felice di aiutare! Contatta l'assistenza se hai bisogno di qualcos'altro in futuro. –