2010-03-19 4 views
6

Stavo cercando di creare una "ricerca del sito" su un semplice sito http.Solr e indicizzazione del sito Web per creare una ricerca del sito

Ho un sito, chiamiamolo www.mycompany.com, che è puro html.

C'è un modo semplice per utilizzare solr per indicizzare l'intero sito per creare una ricerca di testo completo utilizzando solr come motore?

Googled per un po 'e non ho trovato nulla specifica del tipo: fare un Do B ... profitto!

Vorrei anche sapere se sono un po 'fuori con ciò che è Solr per: P

Grazie in anticipo.

risposta

6

Solr è solo per l'indicizzazione e la ricerca di testo, non ha un crawler poiché è fuori portata del progetto.

Tuttavia date un'occhiata a Nutch, che è un crawler e non troppo difficile da configurare inizialmente.

Nutch e Solr can be integrated se è necessaria una funzionalità specifica di Solr per cercare l'indice. altri

+0

Una cosa che non ho ottenuto è che stanno usando la ricerca del sito di google per la ricerca sul sito http://nutch.apache.org/. – Anthony

1
$ bin/solr create -c corename 
$ bin/post -c corename https://siteurl.com -recursive 2 -delay 1 

Questo farebbe un indice di base del sito, ma non sarebbe la migliore. Se vuoi semplice, allora eccolo. Si può fare.

Penso che funzioni solo su SOLR 5+.