2010-08-08 3 views
7

Ho recentemente aggiunto funzionalità di ricerca al mio sito di django per consentire ai datori di lavoro di cercare dipendenti utilizzando parole chiave. Quando l'utente inizialmente carica il proprio curriculum, lo trasformo in testo, elimina le parole di stop e quindi aggiungo il testo a un campo di testo per quell'utente. Ho usato Django-Haystack con il motore di ricerca di Whoosh.Ricerca sottostringa di Django Haystack

Tre cose-

1) A parte le caratteristiche extra che io probabilmente non uso, non v'è alcun vantaggio concreto per il passaggio a Solr o Xapian?

2) Nel trasformare il curriculum in testo, essenzialmente indicizzo il pdf da solo. So che sia Xapian che Solr supportano l'indicizzazione .pdf, tuttavia, dal suo aspetto, Haystack no. Qualche consiglio su come aggirare questo? O dovrei continuare a indicizzarlo da solo? In tal caso, dovrei fare qualcosa di più che fornire semplicemente un file di testo di parole chiave?

3) Whoosh restituisce un risultato solo se la parola chiave corrisponde esattamente a se stessa. Se un utente ha 'matematica' come sua parola chiave, e cerco 'matematica', voglio che l'utente appaia. Non saprei dire se Xapian o Solr lo supportino in modo definitivo. Pensieri?

Grazie per qualsiasi suggerimento. Per il momento continuerò a scavare in questo.

+1

Hai una risposta alla tua domanda? ti piacerebbe condividere con noi per favore – Armance

risposta

6

Purtroppo non so abbastanza per rispondere alle altre domande, comunque per il punto 3.) Whoosh in realtà supporta questo.

È necessario utilizzare la funzione di completamento automatico di SearchQuerySet.

dettagliata qui: http://docs.haystacksearch.org/dev/autocomplete.html

Attualmente sto usando Fruscio e corrispondente sul parziale me stesso partite.