2009-02-27 8 views
6

Lo stemming è qualcosa che è necessario nei sistemi di tagging. Uso delizioso e non ho tempo per gestire e potare i miei tag. Sono un po 'più attento con il mio blog, ma non è perfetto. Scrivo software per sistemi embedded che sarebbe molto più funzionale (utile per l'utente) se includesse lo stemmingStemming - esempi di codice o progetti open source?

Per esempio:
Parse
Parser
di analisi

caso tutto significare la stessa cosa a qualsiasi sistema li sto mettendo in.

Idealmente c'è uno stemmer con licenza BSD da qualche parte, ma in caso contrario, dove cerco di imparare i comuni algoritmi e le tecniche per questo?

Oltre agli stemmer BSD, quali altri stemmi con licenza open source sono disponibili?

-Adam

+0

Qualcuno deve aggiungere http://snowball.tartarus.org/ come risposta (suggerimento, suggerimento) ... –

+0

Hehe, strippergram –

+0

Ma mi piacerebbe vederne altri, e in particolare maggiori informazioni sugli algoritmi utilizzati . –

risposta

1

Lucene ha uno Stemmer in, credo (e IIRC che consente di utilizzare il proprio uno se si desidera).

MODIFICA: appena controllato, Lucence si riferisce al sito Snowball che è una libreria di derivazione open source per quanto ne so.