Vedo diverse combinazioni di versioni Nutch e Solr utilizzate dalle persone che pubblicano su questo argomento sul web. Quali sono le ultime versioni stabili (non beta) e compatibili di Nutch e Solr che posso scaricare e configurare senza creare fonti e semplicemente configurando?Ultime versioni compatibili di Nutch e Solr
risposta
È possibile utilizzare Nutch 2.1 o Nutch 1.6. Se vuoi usare HBase, devi usare Nutch 2.x. Perché il nutch 1.6 non supporta Hbase. Uso nutch 2.1, HBase 0.90.x o 0.94.5 e Solr 4.3.0.
Ci sono cambiamenti importanti tra le due versioni di Solr (Solr 3.xe Solr 4.x). È necessario scegliere uno di loro in base alle proprie esigenze. Es: supporto Solr4 cloud
migliore.
Quale sistema operativo stai utilizzando?
In Windows Nutch 1.2 è stata l'ultima versione in cui sono riuscito a lavorare.
In Linux Nutch 1.6 funziona molto bene con SOLR.
Questo era in combinazione con SOLR 3.5 (a causa di altre dipendenze) ma non c'è motivo per non funzionare con SOLR 3.6 o 4.3.
ho implementato Nutch 1.6 e Solr 3.6.2 in un sistema di produzione all'inizio di quest'anno per una grande società finanziaria. Funzionano molto bene insieme.
hai usato Tomcat o Jetty per Solr? – MarioCannistra
Ho usato entrambi e, in entrambi i casi, vengono inviati tramite Apache. – Claude
Ciao Claude. Hai mai provato Nutch 2.2.1 con HBase in un sistema di produzione? – sunskin
Ecco alcune versioni compatibili suggerito di Nutch e Solr base a ciò che i creatori del Nutch annunciano nel loro sito web here:
+-------+--------+
| Nutch | Solr |
+-------+--------+
| 2.3.1 | 4.10.3 |
| 2.3 | 4.8.1 |
+-------+--------+
sentitevi liberi di aggiungere più versioni. Lo strumento che ho usato per generare questo tavolo può essere trovato here.
Sto usando -
- Nutch 2.3.1
- Solr 5.2.1
- HBase 0.94.14
E questi combinazione sta lavorando bene!
Sto usando Ubuntu Server 12.04 LTS. Ho appena provato SOLR 4.3.0 e Nutch 1.6. Entrambi funzionano (Solr in esecuzione in Tomcat e Nutch ha eseguito correttamente il crawling di un sito piccolo). Quando ho provato a eseguire il comando solrindex di Nutch per integrarli e indicizzare il sito sottoposto a ricerca per indicizzazione con solr, ho ottenuto un java.io.IOException Job non riuscito! errore. Nessun ulteriore dettaglio nei log di solr o nutch. Mi chiedo se questo può essere dovuto ad incompatibilità tra le due versioni ... – MarioCannistra
La versione di Tomcat è 7 – MarioCannistra
Il file hadoop.log di solito ha più dettagli. Puoi pubblicare la traccia dello stack dell'errore? Se non ci sono altri dettagli, prova a cambiare conf/log4j.properties e modifica i livelli di debug da INFO a DEBUG – nimeshjm