Bilder einfach aus PDFs "extrahieren"

ssn

Well-Known Member
gibts irgend ne möglichkeit wie ich einfach bilder aus pdfs als vektorgrafiken oder so rausbring um sie dann in htmls zu verwenden?
 
Als Vektorgraphiken wüsste ich nichts - man kann allerdings mit KPDF Regionen in einem PDF auswählen und als PNG- oder JPEG-Datei speichern. Solange keine Schrift über dem Bild ist sollte das zumindest gehen. Da KPDF auf xpdf basiert kann xpdf es unter Umständen auch.
 
ssn schrieb:
gibts irgend ne möglichkeit wie ich einfach bilder aus pdfs als vektorgrafiken oder so rausbring um sie dann in htmls zu verwenden?

Das soll gehen, selbst noch nicht getestet. Hab dir mal einen Artikel der bei Pro-Linux erschienen ist rausgesucht. Willst Du noch mehr mit PDF machen gibt es das nette Tool PDFTK.
 
wow, das hab ich gesucht. vielen dank!
€ ARGL; zu früh gefreut. das extrahiert nicht die grafiken die ich benötige. keine ahnung warum, eventuell sind die die ich will ned als bilder eingebunden, keine ahnung worans liegt...
 
Zuletzt bearbeitet:
Hm, hast Du Dir die Bschreibung richtig durchgelesen? bei mit funktioniert es wunderbar:

Grafiken aus PDFs extrahieren

pdfimages von xpdf erlaubt es, alle oder einige Bitmap-Grafiken aus einem PDF zu extrahieren, ohne dass die Grafik vorher umgerechnet werden muss. Das geht zum einen schneller und zum anderen verlieren die Grafiken so keine Qualität:

pdfimages -j pdf_mit_bildern.pdf bilderserie

Das extrahiert alle Bitmap-Grafiken aus pdf_mit_bildern.pdf und speichert diese unter den Namen "bilderserie<nummer>.<ext>". <ext> ist dabei pbm bei Schwarzweiß-Grafiken, ppm bei anderen Grafiken und (dank "-j") jpg bei JPEG-komprimierten Grafiken im PDF.

Soll heißen, wenn die Graphiken nicht JPEGs sind, sondern aus einem anderen Format eingebunden wurden bzw. Vektorgraphiken sind, muß es schiefgehen. Vielleicht ohne die Option -j ?
 
Zuletzt bearbeitet:
ja ich habe mir die beschreibung durchgelesen, wie du allerdings auf das mit den jpgs kommst ist mir völlig rätselhaft.
das -j sagt nur dass per jpeg eingebundene bilder wieder als jpegs gespeichert werden, ohne gehts genausowenig.
 
Bitmap-Graphiken extrahieren ist ja schoen und nett, aber zur Not geht das auch mit xwd(1). Viel interessanter ist es ja, die Vektorgraphiken rauszuholen. Da in einem PDF ja alles als Objekt deklariert ist, sollte das eigentlich durchaus machbar sein. Evtl. muss man aber erstmal die PDF-Spec durchlesen und sich dann auf die Suche begeben.

Uebler Hack waere einfach die Seite mit der Graphik drauf einzeln rauszuziehen und dann die Bounding Box anpassen. Evtl. dazwischen noch pdf2ps und wieder zurueck. Sollte durchaus machbar sein, aber ob das Endresultat ueberzeugt? Ich wuerde da mit LaTeX und pdfpages rangehen.
 
Eine andere Methode wäre die entsprechende Seite mit Gimp in einer hohen auflösung rendern zu lassen und dann den gewünschten Bereich auszuschneiden und als neues Bild erstellen.
 
Das ist aber nicht Sinn und Zweck, schliesslich will man die Vektordaten.

101 Weg aus einer Vektorgraphik ein poebeliges Bitmap zu erstellen:
45. Man drucke das Dokument aus und scanne das Ergebniss wieder ein.

:rolleyes:
 
Zurück
Oben