Sto lavorando all'analisi dei sentimenti e sto utilizzando il set di dati fornito in questo collegamento: http://www.cs.jhu.edu/~mdredze/datasets/sentiment/index2.html
e ho diviso il set di dati in rapporto 50:50. Il 50% viene utilizzato come campioni di prova e il 50% viene utilizzato come campioni di treno e le caratteristiche estratte dai campioni di treno ed eseguono la classificazione utilizzando il classificatore Weka, ma la precisione di previsione è circa del 70-75%.Buon set di dati per l'analisi dei sentimenti?
Qualcuno può suggerire altri set di dati che possono aiutarmi ad aumentare il risultato? Ho usato unigram, bigram e POStags come mie caratteristiche.
Puoi provare questo https://www.kaggle.com/data/36745#latest-205286 – Seremonia