2010-11-19 3 views
5

Grazie in anticipo per qualsiasi aiuto e assistenza.Diff 2 Open XML Word Documents

Sto cercando di trovare qualche utilità/direzione sul modo migliore per confrontare i file docx di due parole (versione originale e modificata) per le differenze e quindi per evidenziare le modifiche nella versione modificata in C#.

Ancora molte grazie per l'assistenza che puoi fornire.

risposta

4

Lo OpenXML SDK 2.0 Toolkit viene fornito con uno strumento che esegue questa operazione. Si chiama OpenXMLDiff. Puoi anche leggere su che altro il kit di strumenti offre qui: An introduction to Open XML SDK 2.0.

Se non è ciò di cui hai bisogno, dovrai esaminare tutti i pacchetti dei documenti Open XML e determinare le differenze tra loro.

0

Un file docx è un file zip rinominato. Potresti rinominarlo in .zip ed estrarlo.

Tuttavia il docx non è un file zip di un singolo file .. è una gerarchia di cartelle con file xml al suo interno. Quindi potresti estrarlo e scrivere un'utilità comparativa come Beyond Compare per ottenere le differenze.

Non sono sicuro di come presentare le differenze? Vuoi mostrare visivamente la differenza nei documenti di Word? per esempio. questo paragrafo è mancante nel secondo file ecc.

+0

Ciao grazie per la tua risposta, ho il controllo dell'editor di documenti utilizzato per creare questi documenti quindi la mia intenzione era disabilitare l'opzione per evidenziare nell'editor in modo da poterlo usare come meccanismo per evidenziare le modifiche/aggiunte a il documento. – Emlyn

0

Il contenuto del documento è codificato in XML e suddiviso in base a qualsiasi opzione, modifica, enfasi ecc. viene aggiunto/modificato/eliminato tra i salvataggi. Qualcosa di semplice come l'aggiunta e la rimozione di una nuova riga può comportare una diversa struttura fisica XML. Non ci sarà alcuna differenza nel contenuto finale effettivo, ma l'XML potrebbe essere diverso.

Che cosa conta esattamente come una "differenza" che vuoi identificare? Questo determinerà quanto analizzare la struttura interna che devi fare e quali tecniche o strumenti puoi usare per identificare le differenze.

0

Esistono alcuni strumenti OpenXML diff elencati here.

0

aggiornerò un po 'questo argomento. Attualmente "Open XML SDK 2.5 Productivity Tool" fa la differenza. L'ho trovato molto utile in diversi file pptx \ docx \ xlsx. Open XML SDK 2.5

Se si sta utilizzando Visual Studio si dovrebbe anche considerare l'aggiunta di questo plugin: Open XML Package Editor for Visual Studio. È molto utile quando si ha una rapida occhiata nel file o si cambia qualcosa.