¿Cómo minimizo los delta de control de origen cuando cambio los files de Word?

¿Hay algo que pueda hacer o considerar al trabajar con files de Word en control de fuente / Subversion para minimizar el tamaño de los cambios en el repository?

Fondo

Para un proyecto tenemos un documento de Word con nuestras especificaciones funcionales con capturas de pantalla de un prototipo en control de fuente (Subversion). El file de Word en sí es de aproximadamente 2.5 MB.

Recientemente cambié los títulos de alnetworkingedor de diez secciones y actualicé la tabla de contenidos. Luego revisé esto en Subversion (svn), solo los cambios descritos.

Después del check-in, verifiqué el tamaño del file diff en el repository svn y me sorprendió ver que era ligeramente más grande que 1 MB. Esperaba que fuera 'pequeño', digamos más pequeño que 100 kB.


Editar: Actualmente el file está en formatting Word 2003 (doc), pero uso Word 2007, por lo que podría cambiar al formatting Word 2007 (docx) si eso disminuyera el tamaño de los deltas del repository.

Consulte también ¿Puedo fusionar dos documentos de Microsoft Word de manera confiable con Subversion?

Puede save documentos docx en un formatting XML "Flat OPC" utilizando Word (Guardar como … documento XML), pero es posible que necesite imprimir primero el XML, ya que todo está en una línea.

Es una de las razones para escribir documentation en algún tipo de formatting codificado (HTML, Tex, syntax wiki) y convertirla a otros formattings (Word, HTML para web, files de ayuda de Windows, páginas man, PDF)

Intenta deshabilitar los Ahorros rápidos en primer lugar.

Como alguien ya señaló, si los binarys se almacenan usando algún tipo de XDelta, no se garantiza que los "parches" serán más pequeños que el file en sí … A veces los parches serán casi tan grandes como el file en sí.

Intente cambiar un valor RGB en una image de Photoshop y ejecute XDelta … el parche será casi tan grande como el file en sí.

Pero, en mi humilde opinión, no deberías preocuparte por eso. La mayoría de los SCMs modernos (GIT, Plastic SCM, …) comprimirán tus files para que el almacenamiento no sea una gran preocupación … Aunque supongo que nunca compraremos la frase "no te preocupes por el espacio en el disco ya que es barato ahora ":-P