Quiero un entorno controlado por fuente para una cantidad bastante grande de datos de database, en text, antes de que se cargue en el DBMS. Hemos estado usando GITHUB y es genial. Pero esperan que un repository tenga less de 1 gigabyte y tenemos cientos.
Podría estar en CVS o SVN, pero el seguimiento de versiones es importante. La información es muy estática y solo se accede a tarifas bajas, por ejemplo, una vez a la semana para partes de ella, una vez al mes para más.
Cualquier lugar / service sugerido que haga esto? No tiene que ser gratis, felizmente pagaremos una cantidad razonable.
Confirmo que este tipo de cantidad de datos es incompatible con un sistema de control de versiones (creado para registrar el historial, es decir, la evolución de la mayoría de los files de text y pequeños files binarys)
Ciertamente no es compatible con un VCS distribuido , donde cualquier clon clonaría todo el repository.
Necesita ver los services en la nube para este tipo de almacenamiento.
La OP protesta (voto a la baja), declarando que:
Serían ASCII normales, excepto que GitHub tiene límites de tamaño de file tan pequeños que los ejecuté mediante compression ZIP.
Raramente cambian, y cuando el contenido cambia, es solo una pequeña cantidad de líneas dentro del file.
Es exactamente de lo que se trata el control de versión. ¿Qué 0.005% del ASCII cambió? ¿Quién lo cambió? ¿Cuando?
Yo mantengo que:
Debes mantenerte separado :
El único sistema, basado en Git, que proporciona eso es git-annex , usando su propio almacenamiento en la nube con (si está implementado) el asistente de git-annex : consulte su hoja de ruta .