Ho provato il classificatore naive bayes e funziona molto male. SVM funziona un po 'meglio ma è ancora orribile. La maggior parte dei documenti che ho letto su SVM e su naive bayes con alcune varianti (n-gram, POS ecc.) Ma tutti danno risultati vicini al 50% (gli autori di articoli parlano dell'80% e alti ma non posso ottenere lo stesso risultato su dati reali).Buon algoritmo per l'analisi del sentimento
Esistono metodi più potenti, ad eccezione dell'analisi lexixal? SVM e Bayes suppongono che le parole siano indipendenti. Questo approccio chiamato "sacco di parole". Cosa succede se supponiamo che le parole siano associate?
Ad esempio: utilizzare un algoritmo apriory per rilevare che se le frasi contengono "cattivo e orribile", allora il 70% di probabilità che la frase è negativa. Inoltre possiamo usare la distanza tra le parole e così via.
È una buona idea o sto inventando la bicicletta?
Cosa ne pensi dell'algoritmo iniziale e dell'associazione tra le parole? – Neir0
@ Neir0: Non vedo immediatamente come vorresti applicarlo. Non ho mai visto tentativi di fare analisi del sentimento con esso. So che alcune persone lo usano per costruire approssimazioni al kernel quadratico (più o meno come si chiamano "associazioni di parole"), ma poi proverei prima un SVM di kernel alla vaniglia. –
Il modo semplice è di introdurre token con badge neg o pos. Ad esempio: "pos I love my mom". In uscita ricevo qualcosa del tipo "se abbiamo amore e mamma nelle nostre sentinelle, allora il 70% che abbiamo il badge pos". Ovviamente possiamo modificare questo approccio per ottenere risultati migliori. – Neir0