Extraer imágenes de PDF desde Linux


El truco que os voy a enseñar hoy tiene que ver con las imágenes incrustadas en los archivos PDF.
Ya que es posible extraer todas las imágenes contenidas de una forma facilísima.
$ pdfimages  -j  archivo.pdf  img

El nombre del archivo a tratar en este caso es archivo.pdf (cambiarlo por el que necesitéis).
La opción imagenes se refiere a la plantilla para formar el nombre de archivo de las imagenes, por ejemplo mis imágenes se llamaran img-001, img-002, img-003...
La opción -j permite que si las imágenes están en formato JPEG se guarden en formato JPEG

También tenemos algún modificador más que podemos usar para elegir qué páginas queremos tratar.
Por ejemplo, para extraer las imágenes desde la página 8 hasta la 15:
$ pdfimages  -j  archivo.pdf  img  -f 8 -l 15

No hay comentarios:

Publicar un comentario