Ho una raccolta di fatture e fatture, quindi non c'è un contesto nel testo (cioè non raccontano una storia). Voglio estrarre nomi di persone da quelle fatture. Ho provato OpenNLP ma la qualità del modello addestrato non è buona perché non ho contesto. quindi la prima domanda è: posso addestrare il modello contiene solo nomi di persone senza contesto? e se possibile, puoi darmi un buon articolo per come costruisco quel nuovo modello (la maggior parte dell'articolo che ho letto non ha spiegato i passi che avrei dovuto fare per costruire un nuovo modello).Estrai nome persona dal testo di struttura
Ho il nome del database con più di 100.000 persone nome (nome, cognome), quindi se i sistemi NER non funzionano nel mio caso (perché non c'è contesto), qual è il modo migliore per cercare quei candidati (intendo cercare ogni nome con tutti gli altri cognomi?)
grazie.