Sto usando la classe Evidenziatore di Lucene per evidenziare frammenti di risultati di ricerca corrispondenti e funziona bene. Vorrei passare dalla ricerca con StandardAnalyzer a EnglishAnalyzer, che eseguirà la generazione di termini.Evidenziatore Lucene con analizzatore di diramazione
I risultati della ricerca sono buoni, ma ora l'evidenziatore non trova sempre una corrispondenza. Ecco un esempio di quello che sto guardando:
document field text 1: Everyone likes goats.
document field text 2: I have a goat that eats everything.
Utilizzando l'EnglishAnalyzer e la ricerca di "capra", entrambi i documenti sono abbinati, ma l'evidenziatore è solo in grado di trovare un frammento abbinato dal documento 2. C'è un modo per avere i dati di ritorno più evidenti per entrambi i documenti?
Capisco che i caratteri sono diversi per i token, ma gli stessi token sono ancora lì, quindi sembra ragionevole che sia sufficiente evidenziare qualsiasi token sia presente in quella posizione.
Se aiuta, si sta utilizzando Lucene 3.5.