C'è un modo in Python 2.7 utilizzando NLTK
per ottenere solo la parola e non la formattazione aggiuntiva che include "synset"
e le parentesi e il "n.01"
ecc.?Come posso stampare solo la parola stessa in un synset di WordNet usando Python NLTK?
Per esempio se faccio
wn.synsets('dog')
I miei risultati assomigliano:
[Synset('dog.n.01'), Synset('frump.n.01'), Synset('dog.n.03'), Synset('cad.n.01'), Synset('frank.n.02'), Synset('pawl.n.01'), Synset('andiron.n.01'), Synset('chase.v.01')]
Come posso invece ottenere una lista come questa?
dog
frump
cad
frank
pawl
andiron
chase
C'è un modo per farlo utilizzando NLTK
o devo usare regular expressions
? Posso usare regular expressions
all'interno di uno script python?
Come da regola 'include "synset" e le parentesi e la "n.01"' '' frank' e chase' non dovrebbe essere parte di l'uscita desiderata? – Braj
non correlato alla domanda ma 'frank' è un sinonimo/abbreviazione di' frankfurter' che è un sinonimo di 'hot dog' o' dog'. Allo stesso modo "cane" come verbo significa "inseguire". – aelfric5578
Vedo un lieve errore ironico incontrare sfumature sottilmente ironiche ... – JonathanHayward