Connect with us

Wie man

So konvertieren Sie eine PDF-Datei mithilfe der Befehlszeile unter Linux in bearbeitbaren Text

So konvertieren Sie eine PDF-Datei mithilfe der Befehlszeile unter Linux in bearbeitbaren Text

Es gibt verschiedene Gründe, warum Sie eine PDF-Datei in bearbeitbaren Text konvertieren möchten. Möglicherweise müssen Sie ein altes Dokument überarbeiten, und Sie haben nur die PDF-Version davon. Das Konvertieren von PDF-Dateien in Windows ist einfach, aber was ist, wenn Sie Linux verwenden?

Keine Sorge. Wir zeigen Ihnen, wie Sie PDF-Dateien mit einem Befehlszeilentool namens pdftotext, das Teil des Pakets „poppler-utils“ ist, einfach in bearbeitbaren Text konvertieren können. Dieses Tool ist möglicherweise bereits installiert. Um zu überprüfen, ob pdftotext auf Ihrem System installiert ist, drücken Sie „Strg + Alt + T“, um ein Terminalfenster zu öffnen. Geben Sie an der Eingabeaufforderung den folgenden Befehl ein und drücken Sie die Eingabetaste.

dpkg –s poppler-utils

HINWEIS: Wenn wir in diesem Artikel etwas eingeben möchten und der Text Anführungszeichen enthält, geben Sie die Anführungszeichen NICHT ein, es sei denn, wir geben etwas anderes an.

Wenn pdftotext nicht installiert ist, geben Sie an der Eingabeaufforderung den folgenden Befehl ein und drücken Sie die Eingabetaste.

sudo apt-get install poppler-utils

Geben Sie Ihr Passwort ein, wenn Sie dazu aufgefordert werden, und drücken Sie die Eingabetaste.

Das Paket poppler-utils enthält verschiedene Tools zum Konvertieren von PDF in verschiedene Formate, zum Bearbeiten von PDF-Dateien und zum Extrahieren von Informationen aus Dateien.

Das Folgende ist der grundlegende Befehl zum Konvertieren einer PDF-Datei in eine bearbeitbare Textdatei. Drücken Sie „Strg + Alt + T“, um ein Terminalfenster zu öffnen, geben Sie den Befehl an der Eingabeaufforderung ein und drücken Sie die Eingabetaste.

pdftotext /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt

Ändern Sie den Pfad zu jeder Datei so, dass er dem Speicherort und dem Namen Ihrer ursprünglichen PDF-Datei entspricht und wo Sie die resultierende Textdatei speichern möchten. Ändern Sie außerdem die Dateinamen so, dass sie den Namen Ihrer Dateien entsprechen.

Die Textdatei wird erstellt und kann wie jede andere Textdatei unter Linux geöffnet werden.

Der konvertierte Text enthält möglicherweise Zeilenumbrüche an Stellen, die Sie nicht möchten. Zeilenumbrüche werden nach jeder Textzeile in die PDF-Datei eingefügt.

Sie können das Layout Ihres Dokuments (Kopf- und Fußzeilen, Seitenwechsel usw.) aus der ursprünglichen PDF-Datei in der konvertierten Textdatei mithilfe des Flags „-layout“ beibehalten.

pdftotext -layout /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt

Wenn Sie nur einen Seitenbereich in eine PDF-Datei konvertieren möchten, verwenden Sie die Flags „-f“ und „-l“ (ein „L“ in Kleinbuchstaben), um die erste und letzte Seite in dem Bereich anzugeben, den Sie konvertieren möchten.

pdftotext -f 5 -l 9 /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt

Verwenden Sie zum Konvertieren einer PDF-Datei, die geschützt und mit einem Besitzerkennwort verschlüsselt ist, das Flag „-opw“ (das erste Zeichen im Flag ist ein Kleinbuchstabe „O“, keine Null).

pdftotext -opw ‚Passwort‘ /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt

Ändern Sie das Kennwort in das Kennwort, das zum Schutz der zu konvertierenden Original-PDF-Datei verwendet wird. Stellen Sie sicher, dass um „Passwort“ einfache und keine doppelten Anführungszeichen stehen.

Wenn die PDF-Datei geschützt und mit einem Benutzerkennwort verschlüsselt ist, verwenden Sie das Flag „-upw“ anstelle des Flags „-opw“. Der Rest des Befehls ist der gleiche.

Sie können auch den Typ des Zeilenendezeichens angeben, das auf den konvertierten Text angewendet wird. Dies ist besonders nützlich, wenn Sie auf die Datei unter einem anderen Betriebssystem wie Windows oder Mac zugreifen möchten. Verwenden Sie dazu das Flag „-eol“ (das mittlere Zeichen im Flag ist ein Kleinbuchstabe „O“, keine Null), gefolgt von einem Leerzeichen und dem Typ des Zeilenendezeichens, das Sie verwenden möchten („ Unix “,„ Dos “oder„ Mac “).

HINWEIS: Wenn Sie keinen Dateinamen für die Textdatei angeben, verwendet pdftotext automatisch die Basis des PDF-Dateinamens und fügt die Erweiterung „.txt“ hinzu. Beispielsweise wird „file.pdf“ in „file.txt“ konvertiert. Wenn die Textdatei als „-“ angegeben ist, wird der konvertierte Text an stdout gesendet. Dies bedeutet, dass der Text im Terminalfenster angezeigt und nicht in einer Datei gespeichert wird.

Klicken Sie zum Schließen des Terminalfensters auf die Schaltfläche „X“ in der oberen linken Ecke.

Für weitere Informationen zum Befehl pdftotext geben Sie an der Eingabeaufforderung in einem Terminalfenster „man page pdftotext“ ein.

Continue Reading
Click to comment

Leave a Reply

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

Tendencia