ho bisogno di accedere ad un indice di Lucene (creato da strisciando diverse pagine web utilizzando Nutch), ma sta dando l'errore indicato sopra:nessun segmento * file trovato
java.io.FileNotFoundException: no segments* file found in [email protected]/home/<path>: files:
at org.apache.lucene.index.SegmentInfos$FindSegmentsFile.run(SegmentInfos.java:516)
at org.apache.lucene.index.IndexReader.open(IndexReader.java:185)
at org.apache.lucene.index.IndexReader.open(IndexReader.java:148)
at DictionaryGenerator.generateDict(DictionaryGenerator.java:24)
at DictionaryGenerator.main(DictionaryGenerator.java:56)
I googled ma le motivazioni addotte non erano corrispondenti al requisiti. Il fatto che i file vengano visualizzati (il percorso) probabilmente significa che la directory non è vuota.
Grazie
Ho fatto tutti loro tranne le versioni Nutch e Lucene. Non ero a conoscenza che ci deve essere una compatibilità tra Lucene e Nutch. Se aiuta, la versione di lucene è 2.2. Posso accedere ai file. Infatti, sto eseguendo il programma java nella stessa directory dell'indice. Inoltre, ho controllato l'indice usando Luke ed è decisamente buono. Inoltre, il fatto è che sono appena diventato parte del progetto. L'indice è il risultato di una lunga ricerca di Nutch. Quindi, non ho alcun codice di indicizzazione. Era solo una scansione. Ma tenterò ancora di scoprire l'immagine esatta. – crazyaboutliv
Una cosa che ho osservato è che la nuova versione di Nutch (1.1) genera 5 cartelle dopo una ricerca per indicizzazione mentre i dati che ho hanno solo 4 cartelle (di cui segmenti è una). Può essere un problema? – crazyaboutliv
Come ha detto Yuval, assicurati che il programma Java che usi per leggere l'indice usi la stessa versione di Lucene utilizzata da Nutch per creare l'indice. –