Ho recentemente aggiunto funzionalità di ricerca al mio sito di django per consentire ai datori di lavoro di cercare dipendenti utilizzando parole chiave. Quando l'utente inizialmente carica il proprio curriculum, lo trasformo in testo, elimina le parole di stop e quindi aggiungo il testo a un campo di testo per quell'utente. Ho usato Django-Haystack con il motore di ricerca di Whoosh.Ricerca sottostringa di Django Haystack
Tre cose-
1) A parte le caratteristiche extra che io probabilmente non uso, non v'è alcun vantaggio concreto per il passaggio a Solr o Xapian?
2) Nel trasformare il curriculum in testo, essenzialmente indicizzo il pdf da solo. So che sia Xapian che Solr supportano l'indicizzazione .pdf, tuttavia, dal suo aspetto, Haystack no. Qualche consiglio su come aggirare questo? O dovrei continuare a indicizzarlo da solo? In tal caso, dovrei fare qualcosa di più che fornire semplicemente un file di testo di parole chiave?
3) Whoosh restituisce un risultato solo se la parola chiave corrisponde esattamente a se stessa. Se un utente ha 'matematica' come sua parola chiave, e cerco 'matematica', voglio che l'utente appaia. Non saprei dire se Xapian o Solr lo supportino in modo definitivo. Pensieri?
Grazie per qualsiasi suggerimento. Per il momento continuerò a scavare in questo.
Hai una risposta alla tua domanda? ti piacerebbe condividere con noi per favore – Armance