So extrahieren Sie Text aus einem PDF in macOS Sierra

Inhaltsverzeichnis

Eines der aktuell am häufigsten verwendeten Formate für die Informationsübertragung ist das von Adobe entwickelte PDF (Portable Document Format - Portable Document Format), das uns zahlreiche Vorteile bietet wie:

  • Höhere Dokumentensicherheit
  • Reduzierung der Originalgröße
  • Kompatibilität mit mehreren Geräten
  • Bewahrt unter anderem die Integrität gespeicherter Daten.

Der Punkt ist, dass wir zu bestimmten Zeiten und aus mehreren Gründen ausschließlich den Inhalt des Textes aus der PDF-Datei extrahieren müssen, ohne andere Elemente wie Bilder oder Signaturen einzuschließen.

Solvetic analysiert, wie dieser Vorgang in macOS Sierra einfach durchgeführt werden kann, ohne auf zusätzliche Tools zurückzugreifen.

Schritt 1
Öffnen des Dokuments: Der erste Schritt besteht darin, das lokal in macOS Sierra gespeicherte PDF-Dokument zu öffnen, was automatisch mit dem Vorschau-Dienstprogramm erfolgt:

Es ist wichtig zu verdeutlichen, dass die PDF-Datei mit diesem Tool geöffnet wird, wenn wir verschiedene Tools wie Adobe Reader verwenden.

Schritt 2
Textauswahl: Jetzt kopieren wir die Informationen aus der PDF-Datei, was wir normalerweise mit der Maus tun, aber wenn wir mehrere PDF-Dateien haben, ist dies eine zeitaufwändige Aufgabe.

Wir können eine der folgenden Methoden verwenden, um diesen Prozess viel effizienter zu gestalten:

  • Gehen Sie zum Menü Bearbeiten und wählen Sie dort die Option Alle auswählen
  • Verwenden Sie die Tastenkombination ⌘ + A
.

Sobald wir diese Option auswählen, sehen wir den ausgewählten Text:

Schritt 3
Inhalt kopieren und einfügen: Nachdem der Text in der PDF-Datei ausgewählt wurde, kopieren wir ihn mit einer der folgenden Optionen.

PDF-Text kopieren

  • Gehen Sie in das Menü Bearbeiten und wählen Sie dort Kopieren
  • Verwenden Sie die Tastenkombination ⌘ + C

Sobald wir diese Informationen in der Zwischenablage haben, öffnen wir die TextEdit-Anwendung mit einer der folgenden Optionen

  • Geben Sie den Worttext in Spotlight ein und wählen Sie dort TextEdit
  • Gehen Sie zum Pfad go / Applications und wählen Sie dort TextEdit

Das folgende Fenster wird angezeigt. Dort wählen wir den Button Neues Dokument.

Schritt 4
Im neuen Fenster gehen wir in das Menü Format und wählen dort die Option In Klartext konvertieren oder wir verwenden die Tastenkombination ⇧ + ⌘ + T. Das Ergebnis ist folgendes:

Mit dieser einfachen Methode können wir den Text leicht aus den erforderlichen PDF-Dateien extrahieren.

wave wave wave wave wave