2012-03-18 15 views
8

Sto cercando di imparare l'elaborazione del linguaggio naturale (in inglese) usando NLTK e Python. C'è un modo per ottenere la forma infinita del verbo durante o dopo il tagging POS.Come ottenere la forma infinita del verbo utilizzando NLTK (pos tagging)

Ad esempio:

  • è (VBZ) => essere
  • disponibile (VBN) => fornire
  • usando (VBG) => utilizzare
+0

o una risposta completa, ma vorrei investigare su WordNet (sì, NLTK aveva WordNet come download) – winwaed

risposta

15

Chiudi , è necessario aggiungere il "a" all'inizio:

>>> from nltk.stem.wordnet import WordNetLemmatizer 
>>> lemmatizer = WordNetLemmatizer() 
>>> lemmatizer.lemmatize('is', 'v') 
'be' 
>>> lemmatizer.lemmatize('provided', 'v') 
'provide' 
>>> lemmatizer.lemmatize('using', 'v') 
'use'