Ho problemi con un indice Lucene, che ha parole indicizzate, che contengono caratteri "-".Problemi dell'indice Lucene con il carattere "-"
Funziona per alcune parole che contengono "-" ma non per tutti e non trovo il motivo, perché non funziona.
Il campo in cui sto cercando viene analizzato e contiene la versione della parola con e senza il carattere "-".
sto usando l'analizzatore: org.apache.lucene.analysis.standard.StandardAnalyzer
qui un esempio:
se cerco "gsx- *" ho ottenuto un risultato, il indicizzata campo contiene "SUZUKI GSX-R 1000 GSX-R1000 GSXR"
ma se cerco "v- *" non ho ottenuto alcun risultato. Il campo indicizzato del risultato atteso contiene: "SUZUKI DL 1000 V-Strom DL1000V-STROMVSTROM V STROM"
Se cerco "V-Strom" senza "*" funziona, ma se basta cercare " v-str "ad esempio non ottengo il risultato. (Ci dovrebbe essere un risultato perché è per una ricerca dal vivo per un negozio web)
Quindi, qual è la differenza tra i 2 risultati attesi? perché funziona con "gsx- " ma non con "v-"?
Interessante, lavoro con Solr e guido V-Strom 650 :) –
Hai effettivamente controllato il contenuto del campo indicizzato o ti aspetti che sia così? Se non usi il più grande strumento di indice Lucene di sempre - Luca: http://code.google.com/p/luke/ –
sì, visualizzo lo stesso campo che sto cercando in – Zteve