2010-05-03 5 views
9

Ho codice legacy (non l'ho scritto) che includeva sempre l'attributo di codifica, ma ricompilandolo in D2010, TXMLDocument non include più la codifica. Poiché i dati XML hanno caratteri accentati sia su tag sia su dati, TXMLDocument.LoadFromFile lancia semplicemente EDOMParseErros affermando che sul file è stato trovato un carattere non valido. codice rilevante:Come rendere TXMLDocument (con l'implementazione MSXML) sempre include l'attributo di codifica?

Doc := TXMLDocument.Create(nil); 
    try 
    Doc.Active := True; 
    Doc.Encoding := XMLEncoding; 
    RootNode := Doc.CreateElement('Test', ''); 
    Doc.DocumentElement := RootNode; 
    <snip> 
    //Result := Doc.XMl.Text; 
    Doc.SaveToXML(Result); // Both lines gives the same result 

su versioni precedenti di Delphi, viene generato il seguente riga:

<?xml version="1.0" encoding="ISO-8859-1"?> 

Su D2010, questo viene generato:

<?xml version="1.0"?> 

Se cambio manualmente la linea, tutto funziona come ha sempre funzionato negli ultimi anni.

UPDATE: xmlEncoding è una costante ed è definito come seguire

XMLEncoding = 'ISO-8859-1'; 

risposta

4
var 
    XMLStream: TStringStream; 
begin 
    Doc := TXMLDocument.Create(nil); 
    try 
    Doc.Active := True; 
    Doc.Encoding := XMLEncoding; 
    RootNode := Doc.CreateElement('Test', ''); 
    Doc.DocumentElement := RootNode; 
    <snip> 
    XMLStream := TStringStream.Create; 
    Doc.SaveToStream(XMLStream); 
    Result := XmlStream.DataString; 
    XMLStream.Free; 

Poiché la risposta di Ken e il link all'articolo MSXML, ho deciso di indagare la proprietà XML e il metodo SaveToXML. Entrambi utilizzano la proprietà XML dell'implementazione MSXMLDOM, che nell'articolo si dice che non portano la codifica quando vengono letti direttamente (nella sezione "Creazione di nuovi documenti XML con MSXML" subito dopo l'uso del metodo CreateProcessInstruction).

UPDATE:

ho scoperto che i caratteri accentati sono sempre troncati nel XML risultante. Quando il processore di quell'XML ha iniziato a generare strani errori, abbiamo visto che i caratteri venivano convertiti nella costante di carattere numerica (# 13 è la costante di carattere numerica per il ritorno a capo). Quindi, ho usato un TStringStream per ottenerlo a destra FINALMENTE.

6

Avrai voglia di vedere IXMLDocument.CreateProcessingStruction. Io uso OmniXML, ma è la sintassi è simile e dovrebbe iniziare:

var 
    FDoc: IXMLDocument; 
    PI: IXMLProcessingInstruction; 
begin 
    FDoc := OmniXML.CreateXMLDoc(); 
    PI := FDoc.CreateProcessingInstruction('xml', 'version="1.0" encoding="UTF-8"'); 
    FDoc.AppendChild(PI); 
end; 
+0

Questo è esattamente ciò che Microsoft consiglia anche per MSXML: http://msdn.microsoft.com/en-us/library/aa468560.aspx. Tuttavia, la cosa all'inizio del documento non è tecnicamente un'istruzione di elaborazione. È una * dichiarazione XML *; la stringa "xml" non è realmente consentita per il nome di un'istruzione di elaborazione, quindi sembra che il metodo 'CreateProcessingInstruction' stia facendo doppio dovere. –

+0

@Rob: Questo è probabilmente il motivo per cui mi ci è voluto un po 'un paio di anni fa per capirlo (non avevo il link MSDN che hai fornito in quel momento). Tuttavia, potrebbe effettivamente essere considerato un'istruzione di elaborazione, non potrebbe, se sta dicendo al parser come interpretare il contenuto? "Questo è XML, ed è in questo set di caratteri - che renderà più facile la comprensione." –