Encontré este package en GitHub ( doctotext ). Me gustaría instalarlo en mi server dedicado de Centos (x86_64), pero no sé cómo. ¿Podría alguien ofrecer instrucciones sobre cómo podría hacerlo? No hay instrucciones proporcionadas, desafortunadamente
Hay un Makefile , así que intente:
git clone
el repository en cualquier lugar que desee (generalmente dentro de su count de origen)
cd git clone https://github.com/karlproject/doctotext cd doctotext
tipo make
y make install
Luego verá si puede comstackrlo e instalarlo mediante compilation.
Si está abierto a considerar alternativas, que se mantienen activamente, recomiendo
PDFMiner http://www.unixuser.org/~euske/python/pdfminer/index.html
Incluye pdf2txt.py que puede ser una buena solución para usted.
Si está buscando otras opciones o formattings adicionales explore
https://pypi.org/search/?q=documents
Estoy seguro de que encontrarás algo.