Seguimiento de files de Excel en el control de versiones

Nos estamos diversificando más allá del equipo de desarrollo e intentando que otros grupos dentro de mi compañía usen el control de versiones para documentos importantes que necesitan un seguimiento de cambios. Una necesidad frecuente es para las hojas de cálculo de Excel. Estas son hojas de cálculo grandes, modificadas con bastante frecuencia (semanal o mensual) pero con solo una pequeña parte de las celdas cambiadas cada vez.

Simplemente colocando los files en subversión (la herramienta particular que estamos usando) proporciona un historial de cambios y mantiene las versiones anteriores. Y el cliente de TortoiseSVN lo hace fácil para usuarios no técnicos. Las versiones recientes de TortoiseSVN incluso contienen una secuencia de commands que se puede utilizar para realizar agradables diferencias visuales entre los documentos de Excel.

Mi preocupación restante es el espacio en disco. Estos son documentos grandes. Las diferencias entre las versiones son pequeñas, pero me preocupa que el control de la versión note que el file es binary y que vuelva a almacenar cada versión por separado. ¿Alguien sabe de una solución para esto? Por ejemplo, ¿un formatting en el que podríamos ahorrar en el que los diffs serían pequeños para que solo se guarden las diferencias, o un sistema de control de versiones que sea específicamente consciente de los files de Excel? Todavía no he realizado testings de performance, pero nuestro server de control de versiones ya está muy cargado y, si hay una solución mejor, me gustaría saber de qué se trata.

Actualmente SVN no puede almacenar eficientemente esos types de files. Ha habido cierta discusión al respecto

http://subversion.tigris.org/ds/viewMessage.do?dsForumId=462&dsMessageId=651443

Esta pregunta SO muestra un gráfico cuando se almacena un documento de oficina OpenXML. Los resultados fueron bastante lineales

¿Subversion almacenará de manera eficiente documentos de Office OpenXML?

Aunque su pregunta no era específicamente sobre ese formatting, aún puede aplicarse. Puede que necesite ejecutar una testing en SVN y ver qué tipo de almacenamiento toma. SVN es bastante bueno en el almacenamiento de files binarys, por lo que puede no ser demasiado terrible. La pregunta anterior de SO también menciona save el file como un documento de text plano XML 2003, que también puede investigar.

Una consideración es utilizar Team Foundation Server para el control de código fuente (si es una opción), que simplemente almacenará los cambios delta, aunque puede ser un poco pesado para lo que está buscando.

Desde mi punto de vista, el text binary y el text no tienen un impacto en el tamaño de almacenamiento en SVN: http://help.collab.net/index.jsp?topic=/faq/svnbinary.html