PDF

So extrahieren Sie markierten Text aus PDF als Nur-Text-Datei?

So extrahieren Sie markierten Text aus PDF als Nur-Text-Datei?

Das Hervorheben von Text in einem PDF-Dokument ist praktisch, um die wichtigen Bereiche zu markieren, auf die Sie später schnell zugreifen können. Sie können Microsoft Edge verwenden, um PDFs hervorzuheben oder jede andere Software, die mit einer PDF-Hervorhebungsfunktion ausgestattet ist. Manchmal haben Sie vielleicht auch das Bedürfnis verspürt, nur den hervorgehobenen Text zu haben, damit Sie die Zusammenfassung des PDFs mit dem gesamten wesentlichen Text erhalten können. Wenn Sie nach Möglichkeiten suchen, nur markierten Text aus einem PDF als TXT-Datei zu speichern, kann dieser Beitrag hilfreich sein.

Hervorgehobenen Text aus PDF extrahieren

Es gibt einige kostenlose Software und einen Dienst, um markierten Text aus einer PDF-Datei zu extrahieren und als Textdatei zu speichern:

Lassen Sie uns diese PDF Highlight Extractor-Software nacheinander überprüfen.

1] PDF-Highlight-Extraktor

PDF Highlight Extractor ist eine der einfachsten Optionen, um den markierten Text aus einer PDF-Datei zu extrahieren. Diese Open Source PDF-Texthervorhebungsextraktor hat zwei Funktionen, die die Aufmerksamkeit auf sich ziehen. Sie können markierten Text in der Vorschau anzeigen von PDF auf der Softwareoberfläche.

Die zweite Funktion ist, dass Sie es können Legen Sie die Start- oder Endseite oder den Seitenbereich fest, um den Text zu extrahieren. Anstatt also das gesamte PDF zu scannen, können Sie Seitenzahlen definieren, um den hervorgehobenen Text zu erhalten.

Eine weitere gute Funktion ist, dass Sie die Möglichkeit haben, Text als Klartext speichern oder Excel-Datei.

Fügen Sie auf der Benutzeroberfläche Ihre PDF-Datei mit der angegebenen Option hinzu und drücken Sie dann die Extrakt Taste. Deaktivieren Sie Alle Seiten Option, wenn Sie den Seitenbereich festlegen oder unverändert lassen möchten. Sobald der Text abgerufen wurde, können Sie ihn in der Vorschau anzeigen. Drücken Sie abschließend die Text oder Excel Taste, um den markierten Text zu speichern.

Sie können diese Software hier herunterladen. Java wird auch benötigt, um diese Software zu verwenden. Installieren Sie also Java (falls noch nicht geschehen) und führen Sie diese Software aus, um sie zu verwenden.

2] Foxit-Reader

Foxit Reader ist einer der besten kostenlosen PDF-Reader. Sie können mehrere PDF-Dateien in separaten Registerkarten öffnen, PDF markieren, eine Notiz hinzufügen, Kommentare exportieren, Unterschriften hinzufügen, und mehr. Unter der riesigen Liste von Funktionen ist auch das Extrahieren von markiertem Text aus PDF enthalten. Das Beste an dieser Funktion ist es auch speichert Seitenzahlen zusammen mit dem extrahierten Text.

Um markierten Text aus PDF abzurufen, öffnen Sie die PDF-Datei auf der Benutzeroberfläche und greifen Sie auf das Kommentar Tab. Klicken Sie in dieser Registerkarte auf Export Option verfügbar in Kommentare verwalten Sektion. Sie werden sehen, Hervorgehobener Text Möglichkeit. Verwenden Sie diese Option und dann können Sie den gesamten markierten Text als Textdatei speichern.

Hier ist der Download-Link für diese Software. Wählen Sie während der Installation benutzerdefinierte Installation nur die erforderlichen Komponenten dieser Software einzuschließen.

3] Summennoten.Netz

Summennoten.net ist ein kostenloser Dienst, mit dem Sie PDFs mit Anmerkungen versehen und den markierten Text extrahieren können. Der gesamte markierte Text ist in der linken Seitenleiste separat sichtbar. Mit dieser Seitenleiste können Sie auch Entfernen Sie markierten Text, den Sie nicht benötigen und dann den Rest des markierten Textes herunterladen.

Vor dem Herunterladen des markierten Textes können Sie auch Seitenzahlen und ausschließen das hervorgehobener Text einer bestimmten Farbe.

Sie haben auch die Möglichkeit, Markierten Text aus PDF als Excel speichern oder Wort Datei. Also die Funktionen sind gut. Sie können sich mit einem kostenlosen Plan anmelden und dann 50 Highlights extrahieren oder Anmerkungen pro Download, was in den meisten Fällen ausreicht.

Hier ist der Link zu seiner Homepage. Um markierten Text aus einer PDF-Datei zu extrahieren, fügen Sie eine PDF-Datei vom PC hinzu oder Google Drive. Wenn das PDF hochgeladen wird, sind auf der linken Seite Anmerkungen und hervorgehobener Text sichtbar. Verwenden Sie die Anmerkungen herunterladen Option und dann können Sie den markierten Text in speichern TXT, XLSX, oder DOC Datei formatieren.

4] DyAnnotationExtractor

Die DyAnnotationExtractor-Software kann Ihnen dabei helfen, markierten Text zu extrahieren und Bemerkungen aus einem PDF-Dokument. Es ist ein Befehlszeile Software, aber die Verwendung ist sehr einfach. Mit nur einem einzigen Befehl wird der in der PDF-Eingabedatei markierte Text abgerufen.

Sie können diese Software über diesen Link erhalten. Laden Sie die ZIP-Datei herunter und entpacken Sie sie dann. Um die Ausführung des Befehls zu erleichtern, sollten Sie auch PDF in denselben Ordner legen, in den Sie diese Software extrahiert haben. Danach öffnen Eingabeaufforderung Fenster in diesem Ordner. Das kannst du tun, indem du tippst cmd in das Adressfeld dieses Ordners und drücken Sie dann Eingeben Schlüssel.

Wenn das CMD-Fenster geöffnet wird, fügen Sie die BAT-Datei dieser Software, den Eingabebefehl einschließlich des Pfads der Eingabe-PDF, den Ausgabebefehl und den Namen der Ausgabedatei zusammen mit '.txt'-Erweiterung. Der vollständige Befehl lautet-

DyAnnotationExtractor.bat -Eingabepfad der Eingabe-PDF -Ausgabe Ausgabedateiname.TXT

Führen Sie den Befehl aus. Warten Sie ein paar Sekunden und die reine Textdatei ist bereit, die den gesamten markierten Text und die Kommentare enthält, die aus diesem PDF abgerufen wurden. Die Ausgabedatei wird im gleichen Eingabeordner gespeichert.

Dies sind also einige Optionen, mit denen Sie markierten Text aus PDF extrahieren und die Ausgabe dann als Textdatei speichern können. Hoffe diese helfen.

Shadow of the Tomb Raider für Linux Tutorial
Shadow of the Tomb Raider ist die zwölfte Erweiterung der Tomb Raider-Reihe – ein Action-Adventure-Franchise von Eidos Montrealdos. Das Spiel wurde vo...
So steigern Sie die FPS unter Linux?
FPS steht für Bilder pro Sekunde. Die Aufgabe von FPS besteht darin, die Bildrate bei Videowiedergaben oder Spielleistungen zu messen. In einfachen Wo...
Top Oculus App Lab-Spiele
Wenn Sie Besitzer eines Oculus-Headsets sind, müssen Sie über Sideloading informiert sein. Sideloading ist der Prozess der Installation von Inhalten, ...