Qual è il miglior strumento per crawler web Open Source, scritto in Java.Qual è il miglior strumento per crawler web Open Source scritto in Java?
12
A
risposta
9
Prova crawler4j. Hai solo bisogno di implementare una semplice interfaccia che controlli quali URL visitare e cosa fare con ciascuna pagina sottoposta a scansione.
+0
Ho problemi con la scansione di siti Web HTTPS che utilizzano questo crawler ("sito non è riuscito a rispondere "mentre si apre bene nel browser ecc.) – ed22
5
Prova crawler4j. È open source e facile da usare. Puoi consultare questa guida per configurare crawler4j - http://www.buggybread.com/2013/01/create-your-own-email-and-image.html –