Tests

Produkttest: ABBYY FineReader 11 Professional Edition



2
Bereiche

E-Books selbst gemacht
Endlich hat mein alter Scanner wieder einen Verwendungszweck – als E-Book-Lieferant, zumindest hat er großen Anteil daran. In der Vergangenheit habe ich mehrere längere Texte verfasst, von denen ich zumindest einige gerne als E-Book hätte. Leider liegen sie nur noch in gedruckter und gebundener Fassung vor, so dass sie nun Stück für Stück digitalisiert und mit dem ABBY FineReader (Version 11 in Kürze bei Cyberport gelistet) in eine zeitgemäße Form gebracht werden (sollen).
Vorbemerkungen
Das erste Hindernis ist aber der angeschlossene Scanner (CanoScan 3200F). Leider aktualisiert Canon die Treiber für diese älteren Geräte nicht mehr, mit dem Ergebnis, das sie unter Windows 7 (64 bit) nicht genutzt werden können. Toller Service: Die Hardware funktioniert noch tadellos, aber die Software nicht. Dank VMware Fusion wurde FineReader unter Windows XP installiert und dort zum Scannen verwendet. Warum? Weil der FineReader selbst am Besten weiß, mit welchen Scanner-Einstellungen (300 dpi, Graustufen) er die optimalen Ergebnisse bei der Texterkennung erzielt. Daher wurde zumindest der Scanvorgang unter Windows XP durchgeführt, da der CanoScan unter diesem anstandslos funktioniert. Geht es nicht nur um Text, sollte natürlich auf Farbe umgestellt werden. Für einen Testscan wurde das Buch etwas schräg eingelegt – dies wurde automatisch vom FineReader korrigiert, ebenso die Doppelseite in zwei Einzelne getrennt. Auch „über Kopf“ fotografierte Seiten wurden korrekt gedreht.

Task-Menü
Scan-Assistent
Sprachauswahl
Hauptfenster
Hauptfenster
ABBYY FineReader 11 – Teil 1″

Scannvorgang
Der FineReader startet zuvor mit einen flexiblen Task-Menü. Ist zum Beispiel OpenOffice installiert, so wird dies als Scan-Ziel angeboten, ansonsten nicht. Wurde dieses Menü deaktiviert um bei jedem Start ohne Umwege zum Hauptfenster zu gelangen, kann es später über „Neuer Task“ aufgerufen werden. Ist der Scan-Assistent einmal gestartet, kann ein Buch von Anfang bis Ende eingescannt werden. Je nach den zuvor festgelegten Einstellungen werden dabei im Hintergrund Doppelseiten automatisch getrennt, analysiert (Text, Bild, Tabelle) und die Texterkennung durchgeführt. Im Scan-Assistenten lässt sich der Scan-Bereich festlegen, so dass zum Beispiel die für E-Books überflüssigen Kopf-/Fußzeilen und die Seitennummern von Anfang an ausgeschlossen werden können und die Nachbearbeitungszeit reduziert wird.

Sofern die verwendete Sprache nicht automatisch erkannt wurde, kann diese pro Seite / oder pro Bereich manuell festgelegt werden. Schriftstile werden, auch bei guten Vorlagen leider nicht immer erkannt. Oder es werden im rechten Programmteil einige dargestellt, die im Original nicht vorhanden sind. Letzteres schiebe ich aber auf die im über 10 Jahre alten Buch verwendeten Schriftarten.

Je nach Ausgabeformat wird auch die Anzeige im rechten Programmteil angepasst. So werden zum Beispiel beim Zielformat Word (doc) die Formatierungen übernommen, während bei EPUB nur der pure Text und die Grafiken übernommen werden, erkannte Kopf- und Fußzeilen werden dagegen ignoriert. Auch können dort bereits Erkennungsfehler korrigiert werden. Einfacher geht dies aber mit dem Überprüfungs-Assistenten, da zu jeden angewählten Buchstaben im unteren Teil im oberen der entsprechende Teil des Scans eingeblendet wird. Noch besser wäre es sicher dies direkt im Programmfester zu erledigen und den Scan auf der linken Seite entsprechend der Cursorpsoition auf der rechten Seite darzustellen.

Export ins „Buch-Format“
Ist man mit dem Ergebnis zufrieden und sind alle Fehler beseitigt, kann das Dokument exportiert werden. Dafür stehen folgende Formate zur Verfügung: Word, Excel, PowerPoint, OpenOffice, PDF, HTML, reiner Text, CSV, EPUB, FictionBook und DjVu. Zusätzlich kann das Dokument an ein Kindle gesendet werden. Für jedes Format stehen mehrere Exporteinstellungen zur Verfügung – für Office zum Beispiel können unter anderem das Layout und die Seitennummern übernommen werden oder bei EPUB zum Beispiel der Titel des Buches und der Autor festgelegt werden.

Nachbearbeitung
Und fertig ist, in meinem Fall, das E-Book. Da bei diesem Export-Format aber keine Formatvorlagen erzeugt werden, kann iBooks auf dem iPad daraus automatisch kein Inhaltsverzeichnis erzeugen. Somit ist noch etwas Nacharbeit angesagt. Wie es auf Android-Tabletts aussieht, kann ich mangels entsprechendem Gerät leider nicht beurteilen. Ebenso werden Bilder und Tabellen immer Links ausgerichtet. Für die notwendige Nacharbeit um das derzeit mit wenig Aufwand erreichbare beste Ergebnis zu erzielen, bin ich bei Pages ’09 aus dem iWork-Paket (Mac) gelandet. Sind damit die Stile für Kapitel, Unterkapitel usw. festgelegt und das Dokument nach EPUB exportiert, wird automatisch ein Inhaltsverzeichnis erstellt. Einige Formatierungen werden aber auch damit nicht nach EPUB übernommen, was wiederum zum Beispiel bei mit OpenOffice/writer2epub erzeugten EPUBs kein Problem ist.

Wer etwas mehr Zeit hat, sollte einen Blick auf Sigil werfen, erfordert mehr Aufwand, aber es wird auch ein besseres Ergebnis für das E-Book erzielt.

Oder wie wäre es mit einem Hörbuch? Seit (Mac) OS X 10.7 wird in einigen Programmen die Möglichkeit geboten sich markierten Text vorlesen zu lassen oder als Audiodatei an iTunes zu übertragen. Na ja, die Qualität ist eher als brauchbar statt gut zu bezeichnen, da jegliche Betonung fehlt, bei Absätzen keine Pause gemacht wird und manche Wörter/Buchstaben trotz gewählter deutscher Sprache in Englisch ausgesprochen werden. Aber um das ein oder andere einfach auf dem Weg zur Arbeit zu hören, kann es schon verwendet werden.

Erkannte Tabelle
Export-Formate
Export-Einstellungen
E-Book auf dem iPad
E-Book auf dem iPad
ABBYY FineReader 11 – Teil 2″

Neue Funktionen
Für Besitzer der Vorversion ist sicher interessant, was es in Version 11 von ABBYY FineReader an Neuem gibt. Da wären zum Beispiel eine schnellere Verarbeitung, E-Book-Erstellung (ePUB, Kindle), Unterstützung von OpenOffice, zusätzliche unterstützte Sprachen (fast 200, inklusive Sprachvarianten, wenn ich mich nicht verzählt habe). Ebenso sollen Programmiersprachen, zum Beispiel C++ erkannt werden.

Fazit
Positiv: Gute Erkennungsrate, die Ergebnisse waren besser als ich erwartet hatte – viele der als Fehler markierten Stellen enthielten dennoch den korrekten Text. Egal ob schief eingescannt, die Vorlage schlecht gedruckt war (gestauchter Text) oder verschiedene Schriftarten verwendet wurden. Selbst mit freier Hand aufgenommen Fotos von Textseiten kam das Programm klar. Wunder sollte man allerdings keine erwarten, etwas Nacharbeit ist immer nötig.

Negativ: Man muss sich entscheiden, was erkannt werden soll, Text, Bild oder Tabelle – ideal wäre es, wenn der erkannte Text als eigene Ebene unsichtbar im Vordergrund liegen und im Hintergrund das Originalbild erhalten bleiben würde – bei komplizierten Layouts und sich überlappenden Bereichen. So würde man auf der einen Seite das Dokument durchsuchen können und auf der anderen nicht auf Teile des Layouts verzichten müssen.

Was mich besonders bei der Korrektur im Überprüfungs-Fenster gestört hat, ist das der Eingabecursor nicht automatisch am angezeigten Fehler steht. So muss man, um den eventuell fehlerhaften Text zu ändern immer erst mit der Maus an diese Stelle klicken. Grafikelemente werden nicht immer und wenn nicht immer vollständig erkannt (siehe Bild 10). Dies kann man dem Programm sicher nicht vorwerfen, irgendwo hat die automatische Erkennung ihre Grenzen, aber für Leute die viel Grafik in ihren Texten haben, sicher gut zu wissen.

Für mich als Besitzer der Vorversion ist das angebotene Update auf Version 11 von ABBYY FineReader mit 89 Euro aber zu teuer. Der E-Book-Export ist gut, aber da das Dokument so oder so nachbearbeitet werden muss, kann ich auf diese Funktion im FineReader verzichten. Und die schnellere Verarbeitung ist sicher zu begrüßen, rechtfertigt für mich aber dennoch nicht Update-Preis. Da der selbe Preis aber auch für Besitzer noch älterer FineReader-Version (Update ab Version 7 möglich) gilt, ist der Kauf für diese sicher eine Überlegung wert. Mit den von mir gemachten Erfahrungen kann ich allen Interessieren mit vielen zu erfassenden Dokumenten, nach vorherigem Test den Kauf der aktuellen Version empfehlen.

Mac-Version
Für Mac OS X gibt es den ABBY FineReader Express (Testversion) – etwas preiswerter, aber auch im Funktionsumfang beschnitten. Das Express bemerkt man schon am Start, denn das Quick Tasks-Fenster lässt sich nicht überspringen. Wurde die Quelle und das Ziel gewählt, gelangt man zum eigentlichen Programmfenster. In diesem können wie aus der großen Windows-Version gewöhnt die Erkennungsbereiche (Text, Bild, Tabelle) bearbeitet, korrigiert oder angelegt werden. Export ist nur als Text, Excel, HTML oder PDF möglich.

FineReader Mac - Quick Tasks
FineReader Mac - Quick Tasks
ABBY FineReader Express”

Der aktuelle Bearbeitungsstand lässt sich leider nicht als FineReader-Dokument speichern, im Fall des Falles muss man also alle Bilder nochmals einlesen. Während es unter Windows eine parallele Ansicht von Scan und erkanntem Text gibt, muss man in der Mac-Fassung darauf verzichten, eine Bearbeitung der Ergebnisse ist nur mit externen Programmen möglich. Die Testversion unterliegt denselben Einschränkungen wie die Windows-Version – das Programm kann 15 Tage lang genutzt und nur die erste Seite exportiert werden. Hat man Zugriff auf Windows, würde ich aktuell den Kauf der Windows-Version der Mac-Version vorziehen.

RSS-Feed

Werde Autor!

Dieser Beitrag wurde von veröffentlicht.
hat bereits 128 Artikel geschrieben.
Sei auch dabei: Werde jetzt Autor und teile dein Wissen!

2 Kommentare

  1. avatar
    Freytag schrieb am
    Bewertung:

    Erfahrungsgemäß klappt es am Besten, wenn man ganz sauber formatiert hat – und das tun leider die Wenigsten. Jedenfalls ist das meine Erfahrung. Bei Korrekturarabeiten von Seminararbeiten u.ä. finde ich eigentlich fast immer quick and dirty Formatierungslösungen. Formatvorlagen scheint keiner zu kennen, dabei geht es so einfach. Wer einen guten Startpunkt dafür sucht, dem kann ich nur wärmstens diese Vorlage empfehlen – einfach und nicht überladen, daher auch “OCR fähig”!

  2. avatar
    freytag schrieb am
    Bewertung:

    Sorry – hier der Link, hatte ich wohl nicht richtig eingefügt: http://www.hausarbeiten.de/faecher/vorschau/115877.html

Kommentieren

Hinterlasse eine Antwort

Login über

avatar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert *

*


*

Deine Bewertung für den Artikel:

Ähnliche Beiträge

Adobe Premiere & Photoshop Elements 13 im Test

Tests

27.11.2014

 | Daniel Barantke

Adobe hat mit Premiere Elements 13 & Photoshop Elements 13 eine neue Version ihrer Einsteiger-freundlichen Software für die Bearbeitung von Fotos und Videos veröffentlicht. Worin die Neuerungen bestehen und was ihr alles mit der Video-... mehr +

Nokia Lumia 830 im Test

Tests

25.11.2014

 | Daniel Barantke

Heute möchte ich euch das Nokia Lumia 830 vorstellen – eines der wohl letzten Lumia-Smartphones, das die Bezeichnung Nokia im Namen trägt. Grund dafür ist die Übernahme der Nokia-Smartphone-Sparte durch Microsoft, aufgrund derer die... mehr +