2011-02-03 14 views
5

Voglio implementare una soluzione di ricerca per un sito Web scritto in Django. Dalle opzioni disponibili (ho ricercato Solr, Sphinx, Xapian, PostgreSQL/Tsearch3, MySQL) la Sfinge sembra la più bella. Tuttavia, non supporta la derivazione per il polacco, e questa è la lingua dei dati che voglio rendere ricercabili.Ricerca polacca per Sfinge?

Quali sono i modi migliori per gestire le lingue non supportate in Sfinge? Ho un'intuizione che potrei creare un corpus di derivazione dal dizionario di Ispell. Come posso farlo funzionare con Sphinx?

risposta

0

Cerca nel mailist http://snowball.tartarus.org/, potresti trovare alcune informazioni se qualcuno ha provato a creare uno stemmer polacco. Sono disponibili 2 stemmer gratuiti, ma sono realizzati in java (penso che almeno uno sia fatto per solr/lucene). Da Ispell, non sono sicuro che il corpus di stemming possa aiutarti, potresti creare file da utilizzare per wordform o eccezioni.