OCR Freeware kann verdammt gut sein

Marco Kratzenberg

Wer nach OCR Freeware sucht, wird irgendwann auf jeden Fall über den Namen FreeOCR stolpern. Und dabei verwirrt feststellen, dass mindestens drei Programme sich so nennen. Ich will hier das Programm von R. Richardson vorstellen, das ein deutsches Sprachpaket gleich mitbringt und gleich vom Start weg erstaunlich gute Ergebnisse zeigt.

Dieses OCR Freeware-Programm kommt auf den ersten Blick  eher simpel daher und präsentiert uns beim Start lediglich ein paar Icons sowie zwei Fenster mit Text. Allerdings enthält das linke Fenster den Text als Grafik und wie gut die Texterkennung funktioniert, kann man hier gleich mal feststellen. Nun kann man vielleicht davon ausgehen, dass das Programm den Beispieltext bereits gut kennt und deshalb sollte man gleich mal selbst ein eigenes Beispiel öffnen.

Wir haben hier die Möglichkeit, entweder eine Grafikdatei oder ein PDF zu laden. Wahlweise kann man natürlich erst mal einen text einscannen. Beides wird dann links dargestellt. Danach wird erst einmal das rechte Fenster mit einem Klick auf das rote X geleert und dann kann es losgehen. Das Menü bietet uns an, entweder nur die aktuelle oder aber alle Seiten des Dokumentes in einem Rutsch zu scannen. Was dabei herauskommt sehen wir im rechten Fenster und dessen Inhalt können wir nun speichern, bearbeiten oder z.B. gleich in eine Word-Datei überführen, um das Ergebnis nachzubearbeiten. Übrigens verfügt diese OCR Freeware auch über ein „Postprocessing“. Der Anwender kann bestimmte Zeichenabschnitte automatisch in andere „übersetzen“ lassen, wenn es dort besonders häufig zu Fehlern kommt. Und so wird dann etwa aus einem VV ein W.

FreeOCR wendet die Texterkennung übrigens nicht nur auf bereits vorhandene Texte an, sondern kann auch selbst Texte einscannen – eine richtig installierte Twain-Schnittstelle vorausgesetzt. Aber die gehört ja zu jeder Scannerinstallation. Wenn man sich die Ergebnisse ansieht, wird schnell klar, womit wir unser Ziel am besten erreichen. Komplex gesetzte Texte, mit textumflossenen Grafiken und verspielten Fonts werden immer ein Problem bleiben. Es sei denn, man liest aus immer wieder derselben Quelle ein. Etwa den gesamten Jahrgang eines Magazins. Dann wird das Ergebnis von Mal zu Mal besser.

Wenn wir hingegen einfache Druckseiten einlesen, um beispielsweise lediglich eine technische Dokumentation nochmal in digitaler Form vorliegen zu haben, dann werden wir hinsichtlich der verwendeten Fonts und unsauberen Darstellung viel mehr Glück haben. Hier führt das Programm schnell zu sehr guten Darstellungen. Das hilft auch bei Visitenkarten und ähnlichen Kurztexten.

Tipp

FreeOCR ist ein tolles Programm, das sich seine Hauptbestandteile während der Installation aus dem Internet nachlädt. Die eigentlich Installation startet erst, wenn man die zusätzliche Installation zweier Werbeprogramme abgesegnet oder abgelehnt hat. Man sollte also ggfs. diese Angebote mit einem Klick auf „Decline“ ablehnen. Erst dann startet das eigentliche Programmsetup.

Zu den Kommentaren

Kommentare zu diesem Artikel

Weitere Themen

Neue Artikel von GIGA SOFTWARE

  • foobar2000

    foobar2000

    Mit dem foobar2000 Download bekommt ihr einen kostenlosen, kompakten Musikplayer, der sehr viele Audioformate unterstützt, nur wenige Ressourcenansprüche stellt und durch Plugins umfassend in seiner Funktionalität erweiterbar ist.
    Marvin Basse
  • PureSync

    PureSync

    Der PureSync Download gleicht den Inhalt eines Quell- und eines Zielverzeichnisses miteinander ab, so dass beide über den selben Datenbestand verfügen. Das erledigt die Software entweder manuell oder nach einem von euch festgelegten Zeitplan.
    Marvin Basse
  • MediaWiki

    MediaWiki

    Mit dem MediaWiki Download erhaltet ihr eine kostenlose Software, mit welcher sich ein individuelles Web-Lexikon im Stile von Wikipedia erstellen lässt.
    Martin Maciej
* gesponsorter Link