Devo eseguire il rendering o recuperare tutte le immagini da un file PDF specifico. Come posso ottenerlo usando Ghostscript o ImageMagick?Come estrarre immagini da PDF usando Ghostscript o ImageMagick?
risposta
Non si può certamente farlo in Ghostscript, senza dover codificare un dispositivo Ghostscript.
Dubito che tu possa farlo anche con ImageMagick.
Hai guardato PDFtk?
Se siete su Windows poi un rapido Google salta fuori:
http://www.somepdf.com/some-pdf-image-extract.html
E su Linux:
https://askubuntu.com/questions/150100/extracting-images-from-a-pdf
Non puoi farlo con Ghostscript, ma lo si può fare con gli strumenti da riga di comando di Poppler o XPDF denominati pdfimages
:
pdfimages -j some.pdf subdir/image-prefix
Tutte le immagini saranno ora situati in subdir/
nome image-prefix-0001.jpg
, image-prefix-0002.jpg
...
Il parametro -j
renderà il comando cercano di estrarre direttamente JPEG. Non riuscendo a creare file JPEG, si creerà PNMS o PPM, che è sempre possibile convertire usando ImageMagick:
convert subdir/image-prefix-0033.ppm subdir/image-prefix-0033.jpeg
Voglio fare qualcosa di simile ma voglio rimuovere completamente tutte le immagini dal pdf, io il pdf dovrebbe contenere solo testo/carattere ma nessuna immagine, può essere fatto? aiuto di pls. – codin
@codin: i commenti non sono per discutere un argomento completamente nuovo. Per favore, fai una nuova domanda, taggala come '[ghostscript]' + '[pdf]' e cercherò di rispondere nel miglior modo possibile. Indicare inoltre qual è lo scopo della richiesta. Salvataggio su file? Rimuovere le informazioni contenute nelle immagini? O? –
esempio l'estrazione di 1 pagina:
gs -q -dBATCH -dNOPAUSE -sDEVICE=pnggray -d300 -dFirstPage=1 -dLastPage=1 -sOutputFile=1.tiff in.pdf
Questo non estrae le immagini originali. Rende un'immagine in base all'aspetto della pagina. Ad esempio, se il testo è sovrapposto all'immagine, lo otterrai anche nell'immagine renderizzata. – mlissner
il motivo voglio usare GS o immagine-Magic è che stanno usando uno script che posso eseguire con java, ti consiglio qualsiasi strumento PDF che usi comandi o script da riga di comando per raggiungere questo obiettivo? – user1283633
Spiacente, no ...... – KenS
pdftk può estrarre gli allegati, ma non sembra estrarre immagini. – bonh