Ho provato diversi metodi di Sentiment Analysis per opinion mining in recensioni. Ciò che ha funzionato meglio per me è il metodo descritto nel libro Liu: http://www.cs.uic.edu/~liub/WebMiningBook.html In questo libro Liu e altri, confrontate molte strategie e discusso diversi articoli su Sentiment Analysis e Opinion Mining.
Anche se il mio obiettivo principale era quello di estrarre le caratteristiche nei pareri, ho implementato un classificatore sentimento per rilevare la classificazione positivo e negativo di questa funzionalità.
ho usato NLTK per la pre-elaborazione (tokenizzazione Word, POS tagging) e la creazione trigrammi. Poi ho anche usato i Classificatori Bayesiani all'interno di questo assunto per confrontarlo con altre strategie che Liu stava individuando.
Uno dei metodi si basa su tagging pos/neg ogni trigrram esprimere queste informazioni, e l'utilizzo di alcuni classificatore su questi dati. Altro metodo che ho provato e ha funzionato meglio (circa l'85% di precisione nel mio set di dati), è stato calcolando la somma dei punteggi di PMI (puntuale informazione reciproca) per ogni parola nella frase e le parole eccellente/poveri come semi di pos/classe neg.
Questo riceve il tag di risposta. È un articolo molto interessante – Trindaz