Durante gli esperimenti con la parte NLTK della codifica vocale, ho notato molti tag VBP
nell'output delle mie chiamate su nltk.pos_tag
. Ho notato che questo tag non si trova nella parte del tag set del linguaggio di Brown Corpus. Fa comunque parte del set di tag UPenn.Qual è la parte nltk predefinita del tagset vocale?
Quale tag set utilizza nltk per impostazione predefinita? Non riesco a trovarlo nella documentazione ufficiale o negli apidoc.
Sembra che sia addestrato sulla Banca dei Pennelli. https://github.com/nltk/nltk/blob/master/nltk/tag/__init__.py#L80 –