Un po 'più la specificità del problema esatto sarebbe bene. Ci sono molte tecniche diverse che puoi usare. Molti di questi sono guidati da altri pezzi di dati. Ovviamente è possibile utilizzare Lucene e creare i propri indici. Ci sono legami per molte lingue a lucene. Andando su c'è anche il progetto Solr che è Lucene con molti strumenti e funzionalità extra intorno. Potrebbe essere più simile a quello che stai cercando.
L'intento è difficile e la maggior parte dei motori di ricerca moderni si basano su intenti statistici per aiutare nell'ordinazione dei risultati. È sempre possibile avere questo pulsante utile articolo e memorizzare il testo della query che porta a documenti utili. È quindi possibile aggiungere un livello di informazioni all'indice per aumentare determinate parole o frasi e aiutarle a scegliere determinati documenti.
Alcune cose a cui pensare ... Quanti documenti? Qual è la lunghezza media? Sono aggiornati frequentemente? Cosa fanno gli utenti con i documenti? Che aspetto ha la diffusione di parole uniche nei documenti? (Più semplicemente è facile abbinare una query con uno o più documenti specifici basati su caratteristiche uniche comuni.)
Se è sul web, puoi sempre creare un motore di ricerca personalizzato google che cerca il tuo sito solo se tu potrebbe trovare ciò non ottimale per una serie di motivi.
È sempre possibile iniziare con un indice semplice e renderlo gradualmente più sofisticato parlando con gli utenti e acquisendo dati.
fonte
2008-12-19 22:11:41