Bilder einfach aus PDFs "extrahieren"

ssn · 13 November 2005

gibts irgend ne möglichkeit wie ich einfach bilder aus pdfs als vektorgrafiken oder so rausbring um sie dann in htmls zu verwenden?

kydros · 13 November 2005

Als Vektorgraphiken wüsste ich nichts - man kann allerdings mit KPDF Regionen in einem PDF auswählen und als PNG- oder JPEG-Datei speichern. Solange keine Schrift über dem Bild ist sollte das zumindest gehen. Da KPDF auf xpdf basiert kann xpdf es unter Umständen auch.

Perdurabo · 13 November 2005

ssn schrieb:
gibts irgend ne möglichkeit wie ich einfach bilder aus pdfs als vektorgrafiken oder so rausbring um sie dann in htmls zu verwenden?

Das soll gehen, selbst noch nicht getestet. Hab dir mal einen Artikel der bei Pro-Linux erschienen ist rausgesucht. Willst Du noch mehr mit PDF machen gibt es das nette Tool PDFTK.

ssn · 13 November 2005

wow, das hab ich gesucht. vielen dank!
€ ARGL; zu früh gefreut. das extrahiert nicht die grafiken die ich benötige. keine ahnung warum, eventuell sind die die ich will ned als bilder eingebunden, keine ahnung worans liegt...

i18n · 14 November 2005

Hm, hast Du Dir die Bschreibung richtig durchgelesen? bei mit funktioniert es wunderbar:

Grafiken aus PDFs extrahieren

pdfimages von xpdf erlaubt es, alle oder einige Bitmap-Grafiken aus einem PDF zu extrahieren, ohne dass die Grafik vorher umgerechnet werden muss. Das geht zum einen schneller und zum anderen verlieren die Grafiken so keine Qualität:

pdfimages -j pdf_mit_bildern.pdf bilderserie

Das extrahiert alle Bitmap-Grafiken aus pdf_mit_bildern.pdf und speichert diese unter den Namen "bilderserie<nummer>.<ext>". <ext> ist dabei pbm bei Schwarzweiß-Grafiken, ppm bei anderen Grafiken und (dank "-j") jpg bei JPEG-komprimierten Grafiken im PDF.

Soll heißen, wenn die Graphiken nicht JPEGs sind, sondern aus einem anderen Format eingebunden wurden bzw. Vektorgraphiken sind, muß es schiefgehen. Vielleicht ohne die Option -j ?

ssn · 14 November 2005

ja ich habe mir die beschreibung durchgelesen, wie du allerdings auf das mit den jpgs kommst ist mir völlig rätselhaft.
das -j sagt nur dass per jpeg eingebundene bilder wieder als jpegs gespeichert werden, ohne gehts genausowenig.

MrFixit · 14 November 2005

Bitmap-Graphiken extrahieren ist ja schoen und nett, aber zur Not geht das auch mit xwd(1). Viel interessanter ist es ja, die Vektorgraphiken rauszuholen. Da in einem PDF ja alles als Objekt deklariert ist, sollte das eigentlich durchaus machbar sein. Evtl. muss man aber erstmal die PDF-Spec durchlesen und sich dann auf die Suche begeben.

Uebler Hack waere einfach die Seite mit der Graphik drauf einzeln rauszuziehen und dann die Bounding Box anpassen. Evtl. dazwischen noch pdf2ps und wieder zurueck. Sollte durchaus machbar sein, aber ob das Endresultat ueberzeugt? Ich wuerde da mit LaTeX und pdfpages rangehen.

chaos · 14 November 2005

Eine andere Methode wäre die entsprechende Seite mit Gimp in einer hohen auflösung rendern zu lassen und dann den gewünschten Bereich auszuschneiden und als neues Bild erstellen.

MrFixit · 14 November 2005

Das ist aber nicht Sinn und Zweck, schliesslich will man die Vektordaten.

101 Weg aus einer Vektorgraphik ein poebeliges Bitmap zu erstellen:
45. Man drucke das Dokument aus und scanne das Ergebniss wieder ein.

:rolleyes:

Bilder einfach aus PDFs "extrahieren"

ssn

Well-Known Member

kydros

Active Member

Perdurabo

Well-Known Member

ssn

Well-Known Member

i18n

Well-Known Member

ssn

Well-Known Member

MrFixit

aka uqs

chaos

*nix'ler

MrFixit

aka uqs

Wir schützen deine Privatsphäre