Fotografieren statt abtippen

Teil 2: FineReader gegen OmniPage

Von der verbesserten OCR-Engine in beiden Produkten profitieren Anwender, die Inhalte aus niedrig aufgelösten Faxen oder Screenshots weiterverarbeiten wollen. Kleingedrucktes in Verträgen identifiziert FineReader beispielsweise zu über 90 Prozent korrekt. OmniPage erreicht diese Erkennungsgenauigkeit erst bei höherer Scan-Auflösung. Während FineReader bei 300 dpi lesbaren Text ausgibt, produziert der Konkurrent erst bei 600 dpi verwertbare Inhalte.

Nahezu gleich gut lesen FineReader und OmniPage eine aufgeklappte Buchdoppelseite ein. Beide Programme trennen die Seiten korrekt, begradigen aber nur die linke. Trotzdem werden die Texte auch auf der rechten Seiten nahezu hundertprozentig erkannt. Bei der Umsetzung in Word verwenden die Tools allerdings Textkästen, die sich auf der schiefen rechten Seite teilweise überlappen. Benutzer korrigieren dies in der Textverarbeitung mit wenigen Mausklicks oder aktivieren in den OCR-Programmen die automatische Seitentrennung. Dann werden beide Buchseiten geradegerichtet.

Fotografieren statt abtippen

© Archiv

Aufgeklappt: Die Buchdoppelseite teilt FineReader vor der Texterkennung.

Nie wieder Tabelleninhalte abtippen

In Textkästen setzen beide Produkte sogar Tabellen ohne Gitternetz um. Der Anwender muss die Tabelle dann selbst bauen. Sind Linien auf den Vorlagen vorhanden, identifizieren FineReader und OmniPage die Inhalte und die Aufteilung korrekt - auch wenn Zellen verbunden sind. FineReader produziert - anders als die Vorversion und der Rivale - Fehler bei sinnlosen Zeichenfolgen in einer Code-Tabelle.

Fotografieren statt abtippen

© Archiv

Unknackbar: Am Auslesen des Verifikations-Code auf Anmeldeseiten scheitert auch FineReader.

Dagegen übernimmt die Abbyy-Software aus mehrsprachigen Vorlagen erstmals Akzente und Umlaute. Im Gegensatz zu OmniPage profitiert FineReader von der automatischen Erkennung der Dokumentsprache, die im Test auch bei verschiedensprachigen Absätzen auf einer Seite funktioniert. Das Nuance-Tool übersieht die französischen Akzente, arbeitet ansonsten aber korrekt.

Falscher Alarm

Beide OCR-Programme erledigen Standardaufgaben wie das Einlesen von Geschäftsbriefen oder Rechungen tadellos. Nicht hundertprozentig identifizierte Zeichen sind in der Dokument-Vorschau markiert, leider größtenteils zu Unrecht. In circa 70 Prozent der Fälle stimmt das erkannte Zeichen mit dem auf der Vorlage überein. FineReader und OmniPage schlagen auch auf perfekt gescannten Vorlagen fälschlicherweise Alarm, insbesondere bei optisch ähnlichen Zeichen wie dem kleinem l, dem großem I, dem großem O und der 0 (Ziffer Null). Lesefehler passieren dank Vorverarbeitung aber nur selten. Dennoch: Die als unsicher erkannten Textteile prüft der Anwender, was im Fall von korrekten Zeichen die Korrektur unnötig verlängert.

Fotografieren statt abtippen

© Archiv

Korrektur: Beim Mausklick auf fehlerhaft erkannte Buchstaben zeigt OmniPage die Originalvorlage im Pop-up-Fenster an.

Assistenten vereinfachen Bedienung

Damit OCR sich auch von Einsteigern prompt bedienen lässt, ergänzen Abbyy und Nuance ihre Software um Assistenten sowie eine anpassbare Oberfläche. Das klassische dreigeteilte Programmfenster mit Dokumentenstapel, Vorverarbeitungs-Screen und Editor ersetzen Schritt-für-Schritt-Abfragen. FineReader verkürzt das Einlesen von Text auf einem Bild durch einen Menü-Knopf auf dem Startbildschirm: Nach dem Mausklick auf die Schaltfläche Foto in Microsoft Word umwandeln, wählt der Nutzer das Bild aus und erhält den erkannten Text in der Textverarbeitung. Wer OmniPage nicht starten will, greift über das Kontextmenü im Windows-Explorer auf die OCR-Engine zu, um Bilder in Texte zu konvertieren.

Fotografieren statt abtippen

© Archiv

Rundlauf: Anwender steigen an einem beliebigen Punkt in die Texterkennung ein.

Neue Office-Dateiformate und PDF

Beide Produkte sind bei den verfügbaren Exportfiltern nahe an den Erfordernissen der Endanwender: So unterstützen FineReader und OmniPage das Dateiformat des neuen Office 2007. Benutzer sichern ihre Daten so im XML-Format, was weniger Speicherplatz, Fehlertoleranz und Lesbarkeit in Programmen von Fremdherstellern bedeutet. Den ISO-Standard OpenDocument, der ebenfalls all diese Vorteile bietet, kann kein Testkandidaten exportieren. Für die Langzeitarchivierung schreiben FineReader und OmniPage jetzt den ISO-Standard PDF/A.

Bildergalerie

Fotografieren statt abtippen
Galerie
Software:Büro-Software

Verschlimmbessert: Schlechter als der Vorgänger liest OmniPage Tabellen von Fotos mit perspektivischer Verzerrung ein.

Mehr zum Thema

Word - Text um Bild
Office-Tipp

In Word 2010 und 2013 gibt es Bilderrahmen mit einer pfiffigen Funktion für das Freistellen von Bildinhalten. Wir zeigen, wie es geht.
Wir zeigen den normgerechten Aufbau bei Briefen mit Microsoft Word.
Anleitung

Ein DIN-gerechter Aufbau erleichtert dem Lesenden die Übersicht. Word bietet dafür mit seinen Vorlagen und Funktionen alle Voraussetzungen.
Excel - Nettoarbeitstage
Office-Tipp

Wir erklären, wie Sie in Excel etwa für eine Arbeits- oder Urlaubsplanung die Wochenenden herausrechnen und die Nettoarbeitstage berechnen.
Kalender synchronisiert auf iPad
Zeit-Management

Kalender auf dem Smartphone, PC und im Web synchronisieren - mit unseren 9 Tipps schaffen Sie genau das. Verpassen Sie keinen Termin mehr!
Outlook - Logo
Office-Tipp

Wir zeigen, wie Sie in Outlook die Kalenderwoche anzeigen lassen können. Unser Office-Tipps sorgt für Durchblick bei der Terminplanung.