2012-09-27 5 views
5

Sto tentando di trovare le parole associate a una parola specifica in una matrice di documento termine utilizzando il pacchetto tm.Problemi con findAssocs dal pacchetto tm

Sto usando findAssocs per fare questo. Argomenti per findAssocs sono:

  • x: Una matrice di documento termine.
  • term: un personaggio con un termine.
  • corlimit: un valore numerico per il limite del limite di correlazione inferiore.

sto costantemente diventando numeric(0) come il mio risultato

Esempio:

findAssocs(test.dtm, "investment", 0.90) 
>numeric(0) 

Qualcuno ha dimestichezza con findAssocs e sapere che cosa sto facendo male? O qualcuno sa più ampiamente che cosa potrebbe significare il risultato numeric(0)?

Grazie mille in anticipo per qualsiasi aiuto.

+0

Sono sicuro che se fornissi un esempio riproducibile, lo scopriresti da solo. –

+0

Non sono sicuro del motivo per cui questa domanda riceve una taglia, c'è già una risposta perfetta: la soglia è troppo alta, quindi nessuna parola è associata – scoa

risposta

2

Questo risultato indica che non vi sono parole associate in 0.90 di documenti con il termine "investimento". Prova una soglia inferiore come 0.05 e raggiungi una soglia che produce meno termini.

2

Mi sto prendendo lo stesso numeric(0), penso che sia perché c'è un solo documento nel mio Corpus, quindi lo document term matrix ha solo una colonna. Potresti voler provare TermDocumentMatrix() e vedere se hai un multi-column matrix. Detto questo, come trovo l'associazione all'interno di un documento ?.

+1

Questa non è in realtà una risposta. – Dason

+0

@Dason, sono d'accordo, ma è un indizio utile. Di fronte allo stesso messaggio di errore, ho verificato il claim, che 'findAssocs' non funziona quando c'è un solo documento nel tdm, ma funziona bene quando c'è più di un documento. – Ben

0

Appare questa funzionalità funziona solo quando si analizzano più documenti di testo. L'unica soluzione praticabile che ho trovato è la creazione di un duplicato del documento di testo e quindi l'esecuzione dell'analisi. Tuttavia, non è sicuro se questo cambia i risultati in alcun modo. Ogni ulteriore feedback sarebbe apprezzato.