nutch

5calore

3risposta

Miglior crawler grafico web per la velocità?

Per il mese scorso ho utilizzato Scrapy per un progetto di web crawling che ho iniziato. Questo progetto comporta l'abbattimento dell'intero contenuto del documento di tutte le pagine Web in un unico

11calore

2risposta

nessun segmento * file trovato

ho bisogno di accedere ad un indice di Lucene (creato da strisciando diverse pagine web utilizzando Nutch), ma sta dando l'errore indicato sopra: java.io.FileNotFoundException: no segments* file found

7calore

1risposta

Nutch versus Solr

Attualmente sto raccogliendo informazioni dove dovrei usare Nutch con Solr (dominio - ricerca web verticale). Potrebbe suggerirmi?