2011-12-05 13 views
5

Esiste una libreria .Net per analizzare le pagine che ho recuperato tramite l'API mediawiki? Un parser mediawiki standard che potrebbe solo dare titoli e dati in dati puri andrebbe bene, ma preferirei uno che sia specificamente adatto a wiki, uno che potrebbe darmi che tipo di parola è e tutte le definizioni.Parse Wikizionario

Preferirei non scrivere il mio parser per questo. Eventuali suggerimenti?

+1

Quale formato di output stai utilizzando dall'API? Ci sono attualmente 9 tra cui scegliere ... –

+0

@Alex ci sono tonnellate di esempi, inizia qui: http://www.mediawiki.org/wiki/API:Parsing_wikitext –

+0

Non sono a conoscenza di alcuna libreria API o client questo fornirebbe i dati di Wikizionario in un formato strutturato (al contrario di HTML o raw wikitext). Quindi, ancora una volta, non ho nemmeno davvero guardato molto. –

risposta

2

Se si ottiene l'output in JSON, ci sono molte opzioni che è possibile utilizzare, entrambe incorporate in .NET e esterne al framework stesso.

Se si ottiene l'output in XML, di nuovo esistono potenti classi di manipolazione XML all'interno dello stesso framework .NET e al di fuori del framework.

Dovrai essere più specifico: fornire il formato e alcuni esempi di output.

+1

Io uso questo: http://en.wiktionary.org/w/api .php? action = query & prop = revisions & rvprop = content & titles = esce con il codice wiki, lo stesso codice che vorresti digitare in mediawiki per creare la pagina. – Bananable

1

Il progetto dbnary fornisce informazioni analizzate da Wiktionary in formato RDF.

Se si desidera che qualcosa venga elaborato ulteriormente, fornisco i file SQLite e TEI generati dai dati dbnary come parte del mio progetto WikDict allo download.wikdict.com.

Questo in realtà non risponde alla domanda per le librerie .net, ma sono sicuro che troverete facilmente le librerie per leggere XML (TEI), SQLite o RDF.