Git or no Git: versiones grandes de files binarys, pero no se necesita fusión

Aquí hay muchas conversaciones previas en StackOverflow sobre el control de versiones y SCM para files binarys en una base de código. Pero no he encontrado ninguna información sobre este proyecto en particular y el caso de uso que estoy investigando:

Tengo un file binary de un solo padre, muy grande en múltiples gigas de tamaño. De ese file, tengo cientos de "niños" que son del mismo tamaño, pero cada niño es ligeramente único en comparación con el padre con diferencias muy pequeñas.

Nunca tendré que fusionar los hijos con los padres, así que necesito algunos consejos serios y una idea de cómo save solo las diferencias entre 1 padre y n hijos:

  1. Guarde solo las diferencias binarias para cada niño.
  2. Cuando se necesita ese elemento (para downloadlo, implementarlo, etc.), vuelva a comstackrlo usando el file padre + diferencias.
  3. NO SE NECESITA FUSIÓN: solo me interesa save las diferencias para networkingucir el tamaño del file para cada niño.

He trabajado mucho con GIT y he visto algunos posts excelentes aquí en StackOverflow sobre la increíble capacidad de Git para procesar files binarys para versiones, como este aquí.

Pero mis necesidades son más simples: quiero un backbone impresionante de C o C ++ para save las diferencias de files binarys y volver a comstackr los files originales usando esas diferencias MÁS un file principal. Eso es. ¿Hay alguna solución rápida como GIT pero sin las características adicionales?

Muchas gracias. Estoy tratando de evitar redevise la rueda aquí.

Parece que desea deduplicación de datos en lugar de control de versiones. Si este es el caso, testing ddar . Puede usarlo para almacenar files binarys relacionados y se ocupará de mantener el almacenamiento eficiente.