Es gibt verschiedene Gründe, warum Sie eine PDF-Datei in bearbeitbaren Text konvertieren möchten. Möglicherweise müssen Sie ein altes Dokument überarbeiten, und Sie haben nur die PDF-Version davon. Das Konvertieren von PDF-Dateien in Windows ist einfach, aber was ist, wenn Sie Linux verwenden?
Keine Sorgen. Wir zeigen Ihnen, wie Sie PDF-Dateien mit einem Befehlszeilentool namens pdftotext, das Teil des Pakets „poppler-utils“ ist, einfach in bearbeitbaren Text konvertieren können. Dieses Tool ist möglicherweise bereits installiert. Um zu überprüfen, ob pdftotext auf Ihrem System installiert ist, drücken Sie „Strg + Alt + T“, um ein Terminalfenster zu öffnen. Geben Sie an der Eingabeaufforderung den folgenden Befehl ein und drücken Sie die Eingabetaste.
dpkg –s poppler-utils
HINWEIS: Wenn wir in diesem Artikel etwas eingeben möchten und der Text Anführungszeichen enthält, geben Sie die Anführungszeichen NICHT ein, es sei denn, wir geben etwas anderes an.
Wenn pdftotext nicht installiert ist, geben Sie an der Eingabeaufforderung den folgenden Befehl ein und drücken Sie die Eingabetaste.
sudo apt-get install poppler-utils
Geben Sie Ihr Passwort ein, wenn Sie dazu aufgefordert werden, und drücken Sie die Eingabetaste.
Das Paket poppler-utils enthält verschiedene Tools zum Konvertieren von PDF in verschiedene Formate, zum Bearbeiten von PDF-Dateien und zum Extrahieren von Informationen aus Dateien.
Das Folgende ist der grundlegende Befehl zum Konvertieren einer PDF-Datei in eine bearbeitbare Textdatei. Drücken Sie „Strg + Alt + T“, um ein Terminalfenster zu öffnen, geben Sie den Befehl an der Eingabeaufforderung ein und drücken Sie die Eingabetaste.
pdftotext /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt
Ändern Sie den Pfad zu jeder Datei so, dass er dem Speicherort und dem Namen Ihrer ursprünglichen PDF-Datei entspricht und wo Sie die resultierende Textdatei speichern möchten. Ändern Sie außerdem die Dateinamen so, dass sie den Namen Ihrer Dateien entsprechen.
Die Textdatei wird erstellt und kann wie jede andere Textdatei unter Linux geöffnet werden.
Der konvertierte Text enthält möglicherweise Zeilenumbrüche an Stellen, die Sie nicht möchten. Zeilenumbrüche werden nach jeder Textzeile in die PDF-Datei eingefügt.
Sie können das Layout Ihres Dokuments (Kopf- und Fußzeilen, Seitenwechsel usw.) aus der ursprünglichen PDF-Datei in der konvertierten Textdatei mithilfe des Flags «-layout» beibehalten.
pdftotext -layout /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt
Wenn Sie nur einen Seitenbereich in eine PDF-Datei konvertieren möchten, verwenden Sie die Flags «-f» und «-l» (ein «L» in Kleinbuchstaben), um die erste und die letzte Seite des zu konvertierenden Bereichs anzugeben.
pdftotext -f 5 -l 9 /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt
Verwenden Sie zum Konvertieren einer PDF-Datei, die geschützt und mit einem Besitzerkennwort verschlüsselt ist, das Flag «-opw» (das erste Zeichen im Flag ist ein Kleinbuchstabe «O», keine Null).
pdftotext -opw ‘Passwort’ /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt
Ändern Sie das Kennwort in das Kennwort, das zum Schutz der zu konvertierenden Original-PDF-Datei verwendet wird. Stellen Sie sicher, dass um «Passwort» einfache und keine doppelten Anführungszeichen stehen.
Wenn die PDF-Datei geschützt und mit einem Benutzerkennwort verschlüsselt ist, verwenden Sie das Flag «-upw» anstelle des Flags «-opw». Der Rest des Befehls ist der gleiche.
Sie können auch den Typ des Zeilenendezeichens angeben, das auf den konvertierten Text angewendet wird. Dies ist besonders nützlich, wenn Sie auf die Datei unter einem anderen Betriebssystem wie Windows oder Mac zugreifen möchten. Verwenden Sie dazu das Flag „-eol“ (das mittlere Zeichen im Flag ist ein Kleinbuchstabe „O“, keine Null), gefolgt von einem Leerzeichen und dem Typ des Zeilenendezeichens, das Sie verwenden möchten („ Unix “,„ Dos “oder„ Mac “).
HINWEIS: Wenn Sie keinen Dateinamen für die Textdatei angeben, verwendet pdftotext automatisch die Basis des PDF-Dateinamens und fügt die Erweiterung «.txt» hinzu. Beispielsweise wird «file.pdf» in «file.txt» konvertiert. Wenn die Textdatei als „-“ angegeben ist, wird der konvertierte Text an stdout gesendet. Dies bedeutet, dass der Text im Terminalfenster angezeigt und nicht in einer Datei gespeichert wird.
Klicken Sie zum Schließen des Terminalfensters auf die Schaltfläche „X“ in der oberen linken Ecke.
Für weitere Informationen zum Befehl pdftotext geben Sie an der Eingabeaufforderung in einem Terminalfenster «man page pdftotext» ein.