Ho chunked una frase utilizzando:Come navigare in un nltk.tree.Tree?
grammar = '''
NP:
{<DT>*(<NN.*>|<JJ.*>)*<NN.*>}
NVN:
{<NP><VB.*><NP>}
'''
chunker = nltk.chunk.RegexpParser(grammar)
tree = chunker.parse(tagged)
print tree
Il risultato è simile:
(S
(NVN
(NP The_Pigs/NNS)
are/VBP
(NP a/DT Bristol-based/JJ punk/NN rock/NN band/NN))
that/WDT
formed/VBN
in/IN
1977/CD
./.)
Ma ora mi sono bloccato cercando di capire come navigare questo. Voglio essere in grado di trovare la sottostruttura NVN e accedere alla frase di sinistra ("The_Pigs"), al verbo ("sono") e alla frase di nome a destra ("una band punk rock basata a Bristol") . Come lo faccio?
potrebbe si registra la completa grammatica con i nodi foglia, allora ti posso dare una chiara esempio? – alvas