Connect with us

Wie man

So konvertieren Sie eine PDF-Datei mithilfe der Befehlszeile unter Linux in bearbeitbaren Text

So konvertieren Sie eine PDF-Datei mithilfe der Befehlszeile unter Linux in bearbeitbaren Text

Es gibt verschiedene Gründe, warum Sie eine PDF-Datei in bearbeitbaren Text konvertieren möchten. Möglicherweise müssen Sie ein altes Dokument überarbeiten, und Sie haben nur die PDF-Version davon. Das Konvertieren von PDF-Dateien in Windows ist einfach, aber was ist, wenn Sie Linux verwenden?

Keine Sorgen. Wir zeigen Ihnen, wie Sie PDF-Dateien mit einem Befehlszeilentool namens pdftotext, das Teil des Pakets „poppler-utils“ ist, einfach in bearbeitbaren Text konvertieren können. Dieses Tool ist möglicherweise bereits installiert. Um zu überprüfen, ob pdftotext auf Ihrem System installiert ist, drücken Sie „Strg + Alt + T“, um ein Terminalfenster zu öffnen. Geben Sie an der Eingabeaufforderung den folgenden Befehl ein und drücken Sie die Eingabetaste.

dpkg –s poppler-utils

HINWEIS: Wenn wir in diesem Artikel etwas eingeben möchten und der Text Anführungszeichen enthält, geben Sie die Anführungszeichen NICHT ein, es sei denn, wir geben etwas anderes an.

01_checking_for_poppler_utils

Wenn pdftotext nicht installiert ist, geben Sie an der Eingabeaufforderung den folgenden Befehl ein und drücken Sie die Eingabetaste.

sudo apt-get install poppler-utils

Geben Sie Ihr Passwort ein, wenn Sie dazu aufgefordert werden, und drücken Sie die Eingabetaste.

02_installing_poppler_utils

Das Paket poppler-utils enthält verschiedene Tools zum Konvertieren von PDF in verschiedene Formate, zum Bearbeiten von PDF-Dateien und zum Extrahieren von Informationen aus Dateien.

03_utilities_in_poppler_utils

Das Folgende ist der grundlegende Befehl zum Konvertieren einer PDF-Datei in eine bearbeitbare Textdatei. Drücken Sie „Strg + Alt + T“, um ein Terminalfenster zu öffnen, geben Sie den Befehl an der Eingabeaufforderung ein und drücken Sie die Eingabetaste.

pdftotext /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt

Ändern Sie den Pfad zu jeder Datei so, dass er dem Speicherort und dem Namen Ihrer ursprünglichen PDF-Datei entspricht und wo Sie die resultierende Textdatei speichern möchten. Ändern Sie außerdem die Dateinamen so, dass sie den Namen Ihrer Dateien entsprechen.

04_running_pdftotext

Die Textdatei wird erstellt und kann wie jede andere Textdatei unter Linux geöffnet werden.

05_text_file_created

Der konvertierte Text enthält möglicherweise Zeilenumbrüche an Stellen, die Sie nicht möchten. Zeilenumbrüche werden nach jeder Textzeile in die PDF-Datei eingefügt.

06_converted_text_file_in_editor

Sie können das Layout Ihres Dokuments (Kopf- und Fußzeilen, Seitenwechsel usw.) aus der ursprünglichen PDF-Datei in der konvertierten Textdatei mithilfe des Flags «-layout» beibehalten.

pdftotext -layout /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt

06a_converting_using_layout

Wenn Sie nur einen Seitenbereich in eine PDF-Datei konvertieren möchten, verwenden Sie die Flags «-f» und «-l» (ein «L» in Kleinbuchstaben), um die erste und die letzte Seite des zu konvertierenden Bereichs anzugeben.

pdftotext -f 5 -l 9 /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt

07_converting_page_range

Verwenden Sie zum Konvertieren einer PDF-Datei, die geschützt und mit einem Besitzerkennwort verschlüsselt ist, das Flag «-opw» (das erste Zeichen im Flag ist ein Kleinbuchstabe «O», keine Null).

pdftotext -opw ‘Passwort’ /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt

Ändern Sie das Kennwort in das Kennwort, das zum Schutz der zu konvertierenden Original-PDF-Datei verwendet wird. Stellen Sie sicher, dass um «Passwort» einfache und keine doppelten Anführungszeichen stehen.

08_converting_pdf_with_password

Wenn die PDF-Datei geschützt und mit einem Benutzerkennwort verschlüsselt ist, verwenden Sie das Flag «-upw» anstelle des Flags «-opw». Der Rest des Befehls ist der gleiche.

09_converting_pdf_with_user_password

Sie können auch den Typ des Zeilenendezeichens angeben, das auf den konvertierten Text angewendet wird. Dies ist besonders nützlich, wenn Sie auf die Datei unter einem anderen Betriebssystem wie Windows oder Mac zugreifen möchten. Verwenden Sie dazu das Flag „-eol“ (das mittlere Zeichen im Flag ist ein Kleinbuchstabe „O“, keine Null), gefolgt von einem Leerzeichen und dem Typ des Zeilenendezeichens, das Sie verwenden möchten („ Unix “,„ Dos “oder„ Mac “).

10_converting_pdf_with_eol_format

HINWEIS: Wenn Sie keinen Dateinamen für die Textdatei angeben, verwendet pdftotext automatisch die Basis des PDF-Dateinamens und fügt die Erweiterung «.txt» hinzu. Beispielsweise wird «file.pdf» in «file.txt» konvertiert. Wenn die Textdatei als „-“ angegeben ist, wird der konvertierte Text an stdout gesendet. Dies bedeutet, dass der Text im Terminalfenster angezeigt und nicht in einer Datei gespeichert wird.

Klicken Sie zum Schließen des Terminalfensters auf die Schaltfläche „X“ in der oberen linken Ecke.

Für weitere Informationen zum Befehl pdftotext geben Sie an der Eingabeaufforderung in einem Terminalfenster «man page pdftotext» ein.

Continue Reading
Click to comment

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Tendencia