Utilizzo di Java, vorrei prendere un documento nel seguente formato:Rimuove gli spazi e ritorni a capo da XML in Java
<tag1>
<tag2>
<![CDATA[ Some data ]]>
</tag2>
</tag1>
e convertirlo in:
<tag1><tag2><![CDATA[ Some data ]]></tag2></tag1>
Ho provato quanto segue, ma non mi sta dando il risultato che mi aspetto:
DocumentBuilderFactory dbfac = DocumentBuilderFactory.newInstance();
dbfac.setIgnoringElementContentWhitespace(true);
DocumentBuilder docBuilder = dbfac.newDocumentBuilder();
Document doc = docBuilder.parse(new FileInputStream("/tmp/test.xml"));
Writer out = new StringWriter();
Transformer tf = TransformerFactory.newInstance().newTransformer();
tf.setOutputProperty(OutputKeys.INDENT, "no");
tf.transform(new DOMSource(doc), new StreamResult(out));
System.out.println(out.toString());
Si può considerare questo come un file di testo, aprirlo con un BufferedReader, leggere ogni riga e salvare il suo valore di trim all'interno di uno StringBuilder, dopo tutto questo, usare un BufferedWriter per salvare il file con il contenuto di StingBuilder. –
Se sei disposto ad usare qualcosa come Xerces-J puoi usare OutputFormat per non stampare i risultati: http://xerces.apache.org/xerces-j/apiDocs/org/apache/xml/serialize/OutputFormat .html –
btw, il motivo per cui "setIgnoringElementContentWhitespace' non è d'aiuto è perché si deve utilizzare la convalida XML Schema/DTD affinché il parser sappia quali spazi bianchi sono ignorabili. – jtahlborn