Connect with us

Wie man

So extrahieren und speichern Sie Bilder aus einer PDF-Datei unter Linux

So extrahieren und speichern Sie Bilder aus einer PDF-Datei unter Linux

Mit dem Befehlszeilentool „pdftotext“ können Sie PDF-Dateien unter Linux problemlos in bearbeitbaren Text konvertieren. Wenn die ursprüngliche PDF-Datei jedoch Bilder enthält, werden diese nicht extrahiert. Um Bilder aus einer PDF-Datei zu extrahieren, können Sie ein anderes Befehlszeilentool namens «pdfimages» verwenden.

HINWEIS: Wenn wir in diesem Artikel etwas eingeben möchten und der Text Anführungszeichen enthält, geben Sie die Anführungszeichen NICHT ein, es sei denn, wir geben etwas anderes an.

Das Tool «pdfimages» ist Teil des Pakets poppler-utils. Sie können überprüfen, ob es auf Ihrem System installiert ist, und es gegebenenfalls mithilfe der in diesem Artikel beschriebenen Schritte installieren.

Um Bilder aus einer PDF-Datei mit PDF-Bildern zu extrahieren, drücken Sie „Strg + Alt + T“, um ein Terminalfenster zu öffnen. Geben Sie an der Eingabeaufforderung den folgenden Befehl ein.

pdfimages /home/lori/Documents/SampleWithImages.pdf / home / lori / Documents / ExtractedImages / image

HINWEIS: Ersetzen Sie für alle in diesem Artikel gezeigten Befehle den ersten Pfad im Befehl und den PDF-Dateinamen durch den Pfad und den Dateinamen für Ihre ursprüngliche PDF-Datei. Der zweite Pfad sollte der Pfad zum Stammordner sein, in dem Sie die extrahierten Bilder speichern möchten. Das Wort „Bild“ am Ende des zweiten Pfads steht für alles, was Sie Ihrem Dateinamen voranstellen möchten. Die Dateinamen der Bilder werden automatisch nummeriert (000, 001, 002, 003 usw.). Wenn Sie am Anfang jedes Bildes Text hinzufügen möchten, geben Sie diesen Text am Ende des zweiten Pfads ein. In unserem Beispiel beginnt jeder Bilddateiname mit «Bild», z. B. Bild-001.ppm, Bild-002.ppm usw. Zwischen dem von Ihnen angegebenen Text und der Nummer wird ein Bindestrich eingefügt.

01_Eingabe_Befehl_zu_Extrakt_Bilder

Das Standardbildformat ist PPM (tragbare Pixmap) für nicht monochrome Bilder oder PBM (tragbare Bitmap) für monochrome Bilder. Diese Formate können problemlos zwischen Plattformen ausgetauscht werden.

HINWEIS: Möglicherweise erhalten Sie zwei Bilddateien für jedes Bild in Ihrer PDF-Datei. Das zweite Bild für jedes Bild ist leer, sodass Sie anhand der Miniaturansicht der Datei im Dateimanager erkennen können, welche Bilder die Bilder aus der Datei enthalten.

02_ppm_images

Fügen Sie dem Befehl die Option «-j» hinzu, um JPG-Bilddateien zu erstellen (siehe Abbildung unten).

pdfimages -j /home/lori/Documents/SampleWithImages.pdf / home / lori / Documents / ExtractedImages / image

HINWEIS: Sie können die Standardausgabe auch mit der Option „-png“ in PNG oder mit der Option „-tiff“ in TIFF ändern.

03_command_for_jpg_files

Die Hauptbilddatei für jedes Bild wird als JPG-Datei gespeichert. Das zweite leere Bild ist immer noch eine PPM- oder PDF-Datei.

04_jpg_images

Wenn Sie nur Bilder auf und nach einer bestimmten Seite konvertieren möchten, verwenden Sie die Option „-f“ mit einer Nummer, um die erste zu konvertierende Seite anzugeben, wie im folgenden Beispielbefehl gezeigt.

pdfimages -f 2 -j /home/lori/Documents/SampleWithImages.pdf / home / lori / Documents / ExtractedImages / image

HINWEIS: Wir haben die Option «-j» mit der Option «-f» kombiniert, um JPG-Bilder zu erhalten, und haben dies auch mit der unten genannten Option «-l» getan.

05_first_page_to_convert

Um alle Bilder vor und auf einer bestimmten Seite zu konvertieren, verwenden Sie die Option «-l» (ein Kleinbuchstabe «L», nicht die Nummer «1») mit einer Nummer, um die letzte zu konvertierende Seite anzugeben, wie unten gezeigt.

pdfimages -l 1 -j /home/lori/Documents/SampleWithImages.pdf / home / lori / Documents / ExtractedImages / image

HINWEIS: Sie können die Optionen «-f» und «-l» zusammen verwenden, um Bilder in einem bestimmten Seitenbereich in der Mitte Ihres Dokuments zu konvertieren.

06_last_page_to_convert

Wenn die PDF-Datei ein Besitzerkennwort enthält, verwenden Sie die Option «-opw» und das Kennwort in einfachen Anführungszeichen, wie unten gezeigt. Wenn das Kennwort in der PDF-Datei ein Benutzerkennwort ist, verwenden Sie stattdessen die Option «-upw» mit dem Kennwort.

HINWEIS: Stellen Sie sicher, dass Ihr Kennwort im Befehl einfache Anführungszeichen enthält.

pdfimages -opw ‘password’ -j /home/lori/Documents/SampleWithImages.pdf / home / lori / Documents / ExtractedImages / image

07_owner_password_pdf_file

Für weitere Informationen zur Verwendung des Befehls pdfimages geben Sie an der Eingabeaufforderung in einem Terminalfenster «pdfimages» ein und drücken Sie die Eingabetaste. Die Befehlsverwendung wird mit einer Liste der Optionen angezeigt, die für die Verwendung im Befehl verfügbar sind.

Continue Reading
Click to comment

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Tendencia