Sto cercando una libreria in grado di eseguire un'analisi morfologica su parole tedesche, cioè converte qualsiasi parola nella sua forma radice e fornendo meta informazioni sulla parola analizzata.Esiste una biblioteca gratuita per l'analisi morfologica della lingua tedesca?
Ad esempio:
gegessen -> essen
wurde [...] gefasst -> fassen
Häuser -> Haus
Hunde -> Hund
La mia lista dei desideri:
- Si deve lavorare con entrambi i sostantivi e verbi.
- Sono consapevole che questo è un compito molto difficile data la complessità della lingua tedesca, quindi sono anche alla ricerca di librerie che forniscono solo approssimazioni o potrebbero essere solo accurate all'80%.
- Preferisco le librerie che non funzionano con i dizionari, ma di nuovo sono aperto al compromesso date le circostanze.
- Preferirei anche le librerie di Windows C/C++/Delphi, perché ciò li renderebbe più facili da integrare ma anche .NET, Java, ....
- Deve essere una libreria libera. (L) GPL, MPL, ...
EDIT: Sono consapevole del fatto che non v'è alcun modo per eseguire un'analisi morfologica senza alcun dizionario a tutti, a causa delle parole irregolari. Quando dico, io preferisco una biblioteca senza un dizionario mi riferisco a quelle piene dizionari soffiati che mappano ogni parola:
arbeite -> arbeiten
arbeitest -> arbeiten
arbeitet -> arbeiten
arbeitete -> arbeiten
arbeitetest -> arbeiten
arbeiteten -> arbeiten
arbeitetet -> arbeiten
gearbeitet -> arbeiten
arbeite -> arbeiten
...
Quei dizionari hanno diversi inconvenienti, tra cui la dimensione enorme e l'incapacità di elaborare parole sconosciute.
Naturalmente tutte le eccezioni possono essere gestite solo con un dizionario:
esse -> essen
isst -> essen
eßt -> essen
aß -> essen
aßt -> essen
aßen -> essen
...
(La mia mente sta girando in questo momento :))
sei in parte ragione, ho aggiornato la mia domanda. –