2016-03-16 23 views

risposta

0

Le soluzioni NER tendono ad essere specifiche del dominio, utilizzando elenchi di parole codificati come segnali (caratteristiche) e/o struttura di lettere interne delle entità denominate.

I nomi di Regno Unito/Stati Uniti sono simili tra loro e anche con altri nomi europei, in quanto molti nomi e cognomi americani popolari provengono da immigrati europei non inglesi. I nomi indiani sono significativamente differenti e gli elenchi di nomi/cognomi e di dati di addestramento comunemente utilizzati in genere non includono molti o specifici dati specifici dell'India.

Per risolvere il problema, è necessario formare un modello NER specializzato sulla base di dati adatti per il proprio dominio particolare.

+0

c'è qualche altra opzione per l'entità dei nomi indiani riconosciuti? Mi piacciono altri strumenti opensource ecc. @peteris –