2011-08-23 6 views
5

Ho bisogno di analizzare il markup non diversamente da XML o JSON in alberi di elementi, in PHP. Sono certo che esistono librerie per fare questo genere di cose, ma non posso trovarle per la vita di me .Marcatura di analisi nell'albero degli elementi

Problema è questo non è XML o JSON; È un numero di markup oscuri per i quali non esistono parser specializzati. Quindi sto cercando un parser generico in grado di implementare qualsiasi markup sotto forma di un albero di elementi.

In alternativa, articoli su come scriverne uno. Ho già scritto un parser ricorsivo, ma non sono sicuro di come avvicinarmi a fare un generico riutilizzabile.

risposta

0

Si potrebbe provare questo: http://pear.php.net/package/PHP_ParserGenerator con questo: http://pear.php.net/package/PHP_LexerGenerator

C'è anche alcune versioni di Limone e JLex con il supporto per l'emissione di PHP qui: http://wezfurlong.org/blog/2006/nov/parser-and-lexer-generators-for-php/

E questo: https://drupal.org/project/grammar_parser

+0

Una palese mancanza di la documentazione non rende nessuno di questi desiderabile. Sembrano anche terribilmente complicati e potenti. Ricordati che non ho bisogno di analizzare _ linguaggio di programmazione_ qui, solo i dati strutturati. –