Zurück zum Inhalt

Was Sie über Textbearbeitung und Textextraktion wissen sollten

Da PDF Nomad Seiteninhalte nicht ändern kann, die sich bereits im Datenstrom der Seite befinden, kann es keinen existierenden Text aus der aktuellen PDF-Dokumentstruktur entfernen. Aber sie können Text visuell von Seiten entfernen, indem Sie ihn ausmaskieren oder überdecken und optional mit neuem Text überschreiben. PDF Nomad bietet zudem raffinierte Möglichkeiten, kleine Textkorrekturen rasch und effizient durchzuführen. Mehr dazu finden Sie im Kapitel über Textbearbeitung.

Aufgrund des Prinzips, nach dem Textinformationen in PDF-Dokumenten gespeichert werden könne, ist es PDF-Editoren nicht immer möglich, beim Analysieren solcher Dateien die Textinformationen aus dem zugrundeliegenden Seiten-Datenstrom sauber herauszufiltern, selbst dann, wenn die Seiten augenscheinlich Text enthalten. Wenn dies der Fall sein sollte und Sie z.B. versuchen, Text zu selektieren und zu kopieren, kann es sein, dass Sie beim Einfügen des markierten und kopierten Texts in ein Textbearbeitungsprogramm nur Müll erhalten. Das ist in aller Regel kein Fehler im PDF-Editor (wie PDF Nomad), sondern eine Konsequenz dessen, wie das PDF codiert wurde. In solchen Fällen empfehlen wir, dass Sie den Text des Dokuments über die eingebaute OCR-Schrifterkennung erfassen. Seit Version 2.0 kann PDF Nomad jedes beliebige PDF-Dokument per OCR scannen. Mehr dazu finden Sie im Kapitel über OCR-Schrifterkennung.