OCR Software: Die beste Freeware zur Texterkennung

Marco Kratzenberg

OCR Software musste früher teuer bezahlt und kompliziert angelernt werden. Heute gibt es sehr gute OCR Freewareprogramme. Wir haben die besten Tools für Euch getestet.

OCR Software: Die beste Freeware zur Texterkennung

Gleich mehrere gute OCR Freewaretools stehen zur Auswahl und wir haben uns angeguckt, was sie leisten und wo ihre Stärken und Schwächen liegen. Die vorgestellten Programme müssen natürlich mit dem deutschen Zeichensatz zurechtkommen, sonst hat das Ganze keinen Sinn. Zwei lohneswerte Kandidaten möchten wir Euch vorstellen. Der Erste ist eine reine OCR-Software. Das zweite Programm kann PDFs konvertieren aber nebenbei auch noch Texte in Bildern erkennen – und das in verschiedenen Sprachen (inklusive Chinesisch!)

FreeOCR

Der Name der kostenlosen OCR Software, FreeOCR, sagt Euch ja schon deutlich, was Ihr zu erwarten habt. Das mit etwa 40 MB relativ kleine Programm ist einfach gehalten, erfüllt aber seine Aufgabe. Es verwendet die kostenlose Software Tesseract, das von Google als OpenSource freigegeben wurde. Im Grunde handelt es sich also um eine Bedienoberfläche, die mit dem Code von Tesseract verbunden wurde.

Diese Verbindung ist wirklich brauchbar! Die Texterkennung ist dieselbe, die dem Projekt Google Bücher zugrunde liegt. Die Oberfläche selbst kann PDF-Dateien und Bilder mit Text laden oder wahlweise Vorlagen einscannen und bearbeiten. In der Regel sind die ersten Ergebnisse der Texterkennung schon recht gut. Ein “Post processing” sorgt dafür, dass fehlerhafte Erkennungen repariert und in Zukunft vermieden werden.

Ein paar einfache Funktionen erleichtern die Arbeit. So könnt Ihr beispielsweise eine Vorlage zurechtschneiden, um die Textanalyse der OCR Software auf bestimmte Bereiche zu beschränken. Die Ergebnisse liegen als reiner Text vor und werden auf Knopfdruck auch in ein Word- oder RTF-Dokument übertragen. Allerdings geht es bei diesem Programm um die reine Texterkennung. Es ist nicht vorgesehen, ein Layout einer grafischen Vorlage 1:1 in einen editierbaren Text zu übertragen. Es wird also weder der Textfluss berücksichtigt, noch enthält das Ergebnis irgendwelche Grafiken.

Bevor Ihr mit der Arbeit beginnt, solltet Ihr rechts oben die OCR-Sprache auf Deutsch umstellen. Die Programmoberfläche ist englischsprachig, was aber keine Probleme macht, weil die meisten Funktionen auf verständlichen Icons liegen. Das Programm bringt elf europäische Sprachen mit ihren spezifischen Zeichensätzen mit. Weitere Sprachen könnt Ihr downloaden und nachinstallieren. Darunter u.a. auch arabische Sprachen oder Hebräisch, Koreanisch oder slawische Sprachen.

Renee PDF Aide

Renee PDF Aide ist keine reine OCR Software. Die OCR Texterkennung ist da eher ein Nebeneffekt, der aber sehr gut funktioniert. Eigentlich ist das Tool dazu gedacht, PDF-Dateien umzuwandeln. Ihr könnt PDFs beliebiger Größe laden und dann als editierbare Word-, Excel-, PowerPoint- oder auch Textdatei speichern.

Das deutschsprachige Programm verfügt auch über einen OCR-Button und der lässt Euch Bilder laden und dann mit der Texterkennung nach Textelementen scannen. Das Ergebnis wird als Textdatei auf der Festplatte gespeichert.

Bei Renee PDF Aide handelt es sich um eine Vollversion eines kommerziellen Programms, das für Privatanwender kostenlos ist. Allerdings müsst Ihr einen Registrierungscode anfordern, der Euch per E-Mail zugeschickt wird.

Weitere Themen: Renee PDF Aide, R. Richardson

Neue Artikel von GIGA SOFTWARE