Ho provato a seguire lo nutch tutorial ma ho avuto un po 'di problemi con il file schema.xml.Integrazione Apache Nutch e Solr
mi è stato detto al nutch fornito schema per il mio progetto, in sostanza, questo ...
cp ${NUTCH_RUNTIME_HOME}/conf/schema.xml ${APACHE_SOLR_HOME}/example/solr/conf/
Ho schierato il mio file solr in Tomcat e l'errore che ottengo quando vado al cruscotto Solr è
collection1: org.apache.solr.common.SolrException:org.apache.solr.common.SolrException:
Plugin init failure for [schema.xml] fieldType "text":
Plugin init failure for [schema.xml] analyzer/filter:
Error loading class 'solr.EnglishPorterFilterFactory'
che si riferisce a questo elemento nel mio file solrconfig.xml (posso commentare questo fuori ma non è sicuro quanto questo sia importante ancora)
<filter class="solr.EnglishPorterFilterFactory" protected="protwords.txt"/>
Ho modificato il mio solrconfig.xml per cercare e comprendeva una serie di file jar che vengono con solr, specificamente
<lib path="/etc/solr/collection1/libs/dist/solr-core-4.2.1.jar" />
<lib path="/etc/solr/collection1/libs/dist/solr-analysis-extras-4.2.1.jar" />
Ma io non credo che contengono la classe "solr.EnglishPorterFilterFactory" mancante
Qualcuno ha idea del perché questo potrebbe non funzionare o se mi sono perso qualcosa? Io non sono uno sviluppatore Java btw quindi non c'è dubbio che sarà qualcosa di semplice :)
UPDATE Dopo aver scoperto che lo schema ha avuto alcune vecchie classi si fa riferimento ho avuto un altro sguardo allo nutch/conf e TT sembra che esista un file $ {NUTCH_RUNTIME_HOME} /conf/schema-solr4.xml che sembra funzionare.
non al 100%, se questo è corretto ma hey ...
Utilizzare anche "$ {NUTCH_RUNTIME_HOME} /conf/schema-solr4.xml" anziché la vecchia configurazione – Carlton