Es kann gelegentlich vorkommen, dass in PDF-Dateien der Text zwar korrekt lesbar ist, aber der Inhalt nicht über die Suchfunktion durchsucht werden kann. Dies kann vorkommen, wenn der Text als Bild gespeichert ist oder der Text falsch kodiert wurde.

Hier bietet die kostenlose Version von PDF X-Change Viewer eine Lösung. Zum Test habe ich im Programm notepad einfach ein Text Das ist ein Test geschrieben. Dies als Bild in eine Word-Datei kopiert und anschließend als PDF gespeichert.

In dieser Form ist die Suche nach Text nicht möglich.

Zur Lösung die PDF mittels PDF X-Change Viewer öffnen, dann im Menü Dokument Text erkennen … auswählen.

PDF-XChangeViewer_OCR_TestPDF

Im anschließend erscheinenden Dialog unter Ausgabe, PDF-Ausgabe Originalinhalt in ein Bild konvertieren & Textebene hinzufügen auswählen. Zusätzlich unter Erkennung, Hauptsprache die Sprache auswählen.

PDF-XChangeViewer_Option_Texterkennung

Anschließend kann der erkannte Text durchsucht werden.

PDF-XChangeViewer_Test

Kleiner Hinweis: Mittels PDF X-Change Viewer können PDFs auch als Bild (TIFF) gespeichert werden. Dieses Format können auch andere OCR-Texterkennungsprogramme einlesen und verarbeiten.

Advertisements