2012-10-05 8 views
7

Voglio sapere qual è la soluzione ufficiale per l'elaborazione di XML Unicode in Haskell. Ho notato che HXT utilizza una semplice rappresentazione String (un elenco di caratteri Unicode !!!) per il testo.Qual è l'atteggiamento di Haskell nei confronti di Unicode in XML?

http://hackage.haskell.org/packages/archive/hxt/9.3.1.0/doc/html/Text-XML-HXT-DOM-TypeDefs.html#t:XNode

Constructors 
XText String ordinary text (leaf) 
XBlob Blob   text represented more space efficient as bytestring (leaf) 

Come si fa a scegliere tra le due rappresentazioni durante l'analisi? Costringere l'utente a utilizzare elenchi di caratteri non sembra una funzione particolarmente interessante, soprattutto se i documenti XML contengono molti contenuti di testo.

Inoltre, ho trovato http://hackage.haskell.org/package/hxt-unicode su Google ma non sono sicuro di come è destinato ad essere utilizzato con l'analisi. Il supporto per Unicode era anche molto più esplicito: http://hackage.haskell.org/packages/archive/hxt/8.5.2/doc/html/Text-XML-HXT-DOM-Unicode.html ma questo modulo è stato rimosso nell'ultima versione (9.3.1.0 al momento della scrittura) senza una ragione chiara. Qual è stata la motivazione dietro a questo?

Qualcuno potrebbe dare qualche esempio di codice, anche, di come HXT è destinato ad essere utilizzato per favore? Le pagine wiki sono seriamente carenti a questo riguardo. Grazie.

+0

Quale ufficio avrebbe annunciato la "soluzione ufficiale per l'elaborazione di XML Unicode in Haskell"? A proposito di HXT, che non intendo raccomandare, ci sono file di esempio in tutta la fonte: https://github.com/UweSchmidt/hxt. – applicative

risposta

3

Il pacchetto xml-conduit utilizza il tipo di dati Text per la memorizzazione di dati testuali. È diventato la rappresentazione standard dei dati testuali negli ultimi anni. xml-conduit è un pacchetto ben gestito e l'ho utilizzato personalmente per una quantità enorme di codice open source e commerciale.