OCR Freeware kann verdammt gut sein

Marco Kratzenberg

Wer nach OCR Freeware sucht, wird irgendwann auf jeden Fall über den Namen FreeOCR stolpern. Und dabei verwirrt feststellen, dass mindestens drei Programme sich so nennen. Ich will hier das Programm von R. Richardson vorstellen, das ein deutsches Sprachpaket gleich mitbringt und gleich vom Start weg erstaunlich gute Ergebnisse zeigt.

Dieses OCR Freeware-Programm kommt auf den ersten Blick  eher simpel daher und präsentiert uns beim Start lediglich ein paar Icons sowie zwei Fenster mit Text. Allerdings enthält das linke Fenster den Text als Grafik und wie gut die Texterkennung funktioniert, kann man hier gleich mal feststellen. Nun kann man vielleicht davon ausgehen, dass das Programm den Beispieltext bereits gut kennt und deshalb sollte man gleich mal selbst ein eigenes Beispiel öffnen.

Wir haben hier die Möglichkeit, entweder eine Grafikdatei oder ein PDF zu laden. Wahlweise kann man natürlich erst mal einen text einscannen. Beides wird dann links dargestellt. Danach wird erst einmal das rechte Fenster mit einem Klick auf das rote X geleert und dann kann es losgehen. Das Menü bietet uns an, entweder nur die aktuelle oder aber alle Seiten des Dokumentes in einem Rutsch zu scannen. Was dabei herauskommt sehen wir im rechten Fenster und dessen Inhalt können wir nun speichern, bearbeiten oder z.B. gleich in eine Word-Datei überführen, um das Ergebnis nachzubearbeiten. Übrigens verfügt diese OCR Freeware auch über ein „Postprocessing“. Der Anwender kann bestimmte Zeichenabschnitte automatisch in andere „übersetzen“ lassen, wenn es dort besonders häufig zu Fehlern kommt. Und so wird dann etwa aus einem VV ein W.

FreeOCR wendet die Texterkennung übrigens nicht nur auf bereits vorhandene Texte an, sondern kann auch selbst Texte einscannen - eine richtig installierte Twain-Schnittstelle vorausgesetzt. Aber die gehört ja zu jeder Scannerinstallation. Wenn man sich die Ergebnisse ansieht, wird schnell klar, womit wir unser Ziel am besten erreichen. Komplex gesetzte Texte, mit textumflossenen Grafiken und verspielten Fonts werden immer ein Problem bleiben. Es sei denn, man liest aus immer wieder derselben Quelle ein. Etwa den gesamten Jahrgang eines Magazins. Dann wird das Ergebnis von Mal zu Mal besser.

Wenn wir hingegen einfache Druckseiten einlesen, um beispielsweise lediglich eine technische Dokumentation nochmal in digitaler Form vorliegen zu haben, dann werden wir hinsichtlich der verwendeten Fonts und unsauberen Darstellung viel mehr Glück haben. Hier führt das Programm schnell zu sehr guten Darstellungen. Das hilft auch bei Visitenkarten und ähnlichen Kurztexten.

Tipp

FreeOCR ist ein tolles Programm, das sich seine Hauptbestandteile während der Installation aus dem Internet nachlädt. Die eigentlich Installation startet erst, wenn man die zusätzliche Installation zweier Werbeprogramme abgesegnet oder abgelehnt hat. Man sollte also ggfs. diese Angebote mit einem Klick auf „Decline“ ablehnen. Erst dann startet das eigentliche Programmsetup.

Zu den Kommentaren

Kommentare zu diesem Artikel

Weitere Themen

Neue Artikel von GIGA SOFTWARE

  • FaceApp: Ein Lächeln für jeden Muffel

    FaceApp: Ein Lächeln für jeden Muffel

    FaceApp ist eine Fotomanipulations-App, die jede Person auf einem Foto auf „magische“ Weise ein Lächeln verpasst, sie altern lässt oder gar das Geschlecht umwandelt. In kürzester Zeit war die App in aller Munde und hat die App-Charts gestürmt.
    Thomas Kolkmann
  • Android WhatsApp to iPhone Transfer

    Android WhatsApp to iPhone Transfer

    Der Android WhatsApp to iPhone Transfer Download verschafft euch ein Tool, mit dem ihr Nachrichten des Messengers WhatsApp von einem Android-Gerät auf ein iPhone übertragen könnt.
    Marvin Basse 1
  • Google Play Store

    Google Play Store

    Der Google Play Store ist die zentrale Anlaufstelle zum Download von Apps und Spielen unter Android. Daneben bietet der Play Store aber auch Filme, Serien, Bücher, Zeitschriften, Musik und Hörbücher in digitaler Form an. Wir erklären, wie der Play Store entstanden ist und wie man ihn benutzt.
    Martin Malischek 6
* Werbung