nutch

    5calore

    3risposta

    Per il mese scorso ho utilizzato Scrapy per un progetto di web crawling che ho iniziato. Questo progetto comporta l'abbattimento dell'intero contenuto del documento di tutte le pagine Web in un unico

    11calore

    2risposta

    ho bisogno di accedere ad un indice di Lucene (creato da strisciando diverse pagine web utilizzando Nutch), ma sta dando l'errore indicato sopra: java.io.FileNotFoundException: no segments* file found

    7calore

    1risposta

    Attualmente sto raccogliendo informazioni dove dovrei usare Nutch con Solr (dominio - ricerca web verticale). Potrebbe suggerirmi?