2012-10-13 12 views
5

Ho bisogno di un elenco di parole positive e negative con i pesi assegnati alle parole in base a quanto sono forti e settimanali. Ho:analisi del sentimento - wordNet, lexicon sentiWordNet

1.) WordNet - Fornisce un punteggio + o - per ogni parola.

2.) SentiWordNet - Fornisce valori positivi e negativi nell'intervallo [0,1].

ho controllato questi su poche parole,

amore - WordNet sta dando 0.0 sia per nome e verbo, non so perché penso che dovrebbe essere positivo di almeno qualche fattore.

reprimere - wordNet fornisce -9,93
- SentiWordNet fornisce - 0,0 sia per pos sia neg. (Dovrebbe essere negativo)

riposo - WordNet - 2.488
- SentiWordNet - {pos - 0,125, Neg - 0,5} (dovrebbe essere positivo)

Ho bisogno di aiuto per decidere quale usare.

Grazie.

+0

Quello che offre risultati migliori. :-) – Reactormonk

+3

Dove hai ottenuto il punteggio negativo positivo da WordNet? – justhalf

risposta

2

Molto spesso il grado e/o la polarità possono dipendere dal dominio e/o dal contesto, quindi la sola parola non è veramente sufficiente per prendere una decisione.

Se si dispone di alcuni dati annotati, suggerisco di formare un classificatore su quello utilizzando i punteggi forniti dalle due risorse come funzionalità. Se non lo fai, un'opzione è quella di utilizzare uno dei corpora commentati sull'affare disponibili che corrisponde al dominio in questione. Senza alcun dato, l'intero compito diventa alquanto complicato, sebbene vi sia una notevole quantità di lavoro sugli approcci non supervisionati alla classificazione dei sentimenti, credo, per esempio, ad es. Unsupervised Sentiment Analysis

+0

Per quanto riguarda il contesto/dominio, penso che se una parola ha un sentimento diverso dovrebbe essere un diverso senso di Wordnet. Per esempio. amore # 5 (dominio tennis) rispetto agli altri significati su http://sentiwordnet.isti.cnr.it/search.php?q=love Hai un contro-esempio in cui una parola può avere un significato diverso in contesti diversi ma non può avere il proprio senso di Wordnet? –

1

Esiste un'interfaccia per dare opinioni diverse per SentiWordNet, se si pensa che sono sbagliate: http://sentiwordnet.isti.cnr.it/search.php?q=repose

ho scaricato ultima Wordnet 3.1, e controllato il file format documentation, e non si vede alcuna menzione del sentimento numeri che menzioni. Inoltre, non viene mostrato nello online search.

Quindi, per entrambi questi motivi, suggerirei di andare con SentiWordNet!

(vedo la tua domanda è di un anno, così forse ci posso dirvi cosa sei andato con, e perché?)

-1

Il grado della polarità dipende non solo le sole parole, ma anche sul contesto del sentece o della frase. Quindi se ci sono risultati diversi riguardo alla stessa parola, è a causa della differenza nel contesto.