SearARep

Programm zum
Suchen und Ersetzen in Dateien
mit eigener Scriptsprache

Wps RegEx

Kostenloses Programm zum lokalen Testen und Verwalten von Regulären Ausdrücken

Schriftzug Werner Perplies

Home

SearARep

Wps RegEx

Corel Ventura Informationen und Skripte

Anwenderforum zur CA Visual Objects Programmierung

OCR

OCR, Standardprogramm

OCR, Automatische Textaufbereitung (Kurzfassung)

OCR, Automatische Textaufbereitung (ausführlich)

automatische Textaufbereitung

Datenkonvertierung

Crossmedia Publishing

Database-Publishing

zur Person

Werner Perplies
Gramanstr. 56
84518 Garching a. d. Alz
Telefon: 0049-8634-3291020
Telefax: 0049-12120-212988

E-Mail:
werner.perplies@weepee.de

Umsatzsteuer-
Identifikationsnummer
gemäß § 27 a Umsatzsteuergesetz:
DE 173599862

Haftungshinweis:
Trotz sorgfältiger inhaltlicher Kontrolle übernehme ich keine Haftung für die Inhalte externer Links.

Für den Inhalt der verlinkten Seiten sind ausschließlich deren Betreiber verantwortlich.

Alle Warenbezeichnungen dienen lediglich der Beschreibung meiner Dienstleistung.

Sie werden ohne Gewährleistung der freien Verwendbarkeit benutzt und sind möglicherweise eingetragene Warenzeichen.

© 2002-2008 Werner Perplies, Garching


Stand:
Dienstag, den 26. Januar 2010
18:16 Uhr

[Sitemap]

OCR-Optical Character Recognation
Optisches Texteinlesen

OCR? - Das geht völlig problemlos!

Das machen wir mit dem zum Scanner mitgelieferten OCR-Programm schnell und preiswert selber.

OCR? - Bloß nicht!

Ich erkenne jeden eingelesenen Text auf den ersten Blick

Das ist doch alles viel zu fehleranfällig.

Diese zwei, doch sehr gegensätzlichen Aussagen, enthalten beide einen wahren Kern.

Ist dabei ein Dienstleistungsangebot zum optischen Texteinlesen nicht ein Eulen-nach-Athen-tragen-Angebot?

Ich möchte Ihnen an dieser Stelle allgemeine Hinweise zum optischen Texteinlesen, den damit verbundenen Problemen, Lösungsansätzen und meinen ganz persönlichen Weg erläutern.

Die dann folgenden Ausführungen zur automatische Textaufbereitung, Datenkonvertierung und Database-Publishing sollen Ihnen zeigen, dass die Arbeit mit dem Texteinlesen nicht getan ist.

OCR - völlig problemlos?

Richtig ist sicherlich, dass die heute gelieferten OCR-Programme ausgereift sind und qualitativ einen hohen Standard haben.

Tests in Fachzeitschriften zeigen, dass die Fehlerrate sehr gering ist.

Es werden einige Seiten Text eingelesen und oft finden sich nur ein oder zwei Fehler.

Zwei Fehler, auf, sagen wir mal, zehn Textseiten mit ca. 1.500 Zeichen bedeuten aber immerhin eine Fehlerquote von 0,133 %, ein Fehler alle fünf Seiten und bei einem Roman von fünfhundert Seiten 100 Fehler.

Und dies wäre schon eine optimistische Annahme, und diese Aussage gilt für eine gute Vorlage, d. h.:

Folgt daraus

OCR? - bloß nicht!

Ganz sicher nicht!

Wenn die Vorlage auch nur halbwegs akzeptabel ist, kann durch intelligente Nacharbeit ein fehlerhaft eingelesener Text so effektiv aufbereitet werden, dass sich dieser Weg jederzeit mit der preiswertesten Neuerfassung messen lassen kann.

OCR kann also nur der erste Schritt sein. Danach muss eine möglichst sorgfältige Bearbeitung erfolgen.

Es muss darum gehen, Fehler beim Einlesen möglichst zu vermeiden und anschließend die doch noch vorhandenen Fehler effektiv und kostengünstig zu beseitigen.

Dies kann weitgehend manuell durch die im OCR-Programm angebotenen Werkzeuge geschehen, oder auf dem fast automatischen Weg mit Hilfe meines Programmes zur Textkorrektur und Textaufbereitung.

Wann ist der Einsatz von OCR sinnvoll?

Diese Frage ist eigentlich sehr einfach zu beantworten:

OCR lohnt sich immer dann, wenn diese Lösung bei vergleichbarer Qualität preiswerter oder vielleicht auch nur schneller ist.

Weiter sollten Sie einen eventuellen Zusatznutzen in den Vergleich mit einbeziehen.

Als Vergleichsbasis bietet sich also zuerst einmal der Preis für eine Neuerfassung an. Da es sich hier um ein Dienstleistungsangebot handelt, sollten Sie dies bei der Preisbildung berücksichtigen.

Hieraus ergibt sich, dass eine gewisse Mindestmenge zur Verarbeitung vorliegen sollte. Dabei sollte sich der Begriff Menge nicht nur auf die Anzahl der Zeichen beziehen.

OCR und automatische Textaufbereitung erweisen sich oft dann als besonders konkurrenzfähig, wenn

OCR sollte immer dann in Erwägung gezogen werden, wenn

Die OCR-Verarbeitung eines Textes erfolgt in mehreren Verarbeitungsschritten.

Lesen Sie bitte hierzu:

Die Anwendung eines Standardprogrammes zur OCR-Verarbeitung.

Die kombinierte Verarbeitung von Standardprogramm und automatischer Textaufbereitung.


Anzeigen
InDesign Bücher (Auswahl):

Adobe InDesign CS4 Upgrade deutsch Adobe InDesign CS4 Upgrade deutsch

Adobe InDesign CS4 deutsch Adobe InDesign CS4 deutsch

Hans Peter Schneeberger (Autor), Robert Feix (Autor) Adobe InDesign CS4: Das umfassende Handbuch (Gebundene Ausgabe) Hans Peter Schneeberger (Autor), Robert Feix (Autor) Adobe InDesign CS4: Das umfassende Handbuch (Gebundene Ausgabe)

Galileo Press: Adobe InDesign CS4. Layouts entwerfen und gestalten. Das Video-Training auf DVD Galileo Press: Adobe InDesign CS4. Layouts entwerfen und gestalten. Das Video-Training auf DVD

Karsten Geisler (Autor) Einstieg in Adobe InDesign CS4: Werkzeuge und Funktionen verständlich erklärt (Broschiert) Karsten Geisler (Autor) Einstieg in Adobe InDesign CS4: Werkzeuge und Funktionen verständlich erklärt (Broschiert)

Andrea Forst: (Autor) Adobe InDesign CS4: Die Workshops für Einsteiger (Gebundene Ausgabe) Andrea Forst: (Autor) Adobe InDesign CS4: Die Workshops für Einsteiger (Gebundene Ausgabe)

Isolde Kommer (Autor), Tilly Mersin (Autor): InDesign CS4 - Professionelles Publishing: für Print und Web (Gebundene Ausgabe) Isolde Kommer (Autor), Tilly Mersin (Autor): InDesign CS4 - Professionelles Publishing: für Print und Web (Gebundene Ausgabe)

Winfried Seimert (Autor): Adobe InDesign CS4. Das Einsteigerseminar (Broschiert) Winfried Seimert (Autor): Adobe InDesign CS4. Das Einsteigerseminar (Broschiert)

Katharina Frerichs (Autor), Marc Oliver Thoma (Autor), Astrid Warkus (Autor): Das grosse Buch Indesign CS4: im Praxiseinsatz (Gebundene Ausgabe) Katharina Frerichs (Autor), Marc Oliver Thoma (Autor), Astrid Warkus (Autor): Das grosse Buch Indesign CS4: im Praxiseinsatz (Gebundene Ausgabe)

Christoph Grüder: InDesign CS4 - Praxis für Profis: Neue Wege, Methoden und Workflows Christoph Grüder: InDesign CS4 - Praxis für Profis: Neue Wege, Methoden und Workflows

Gerald Singelmann: Adobe InDesign CS3 - Das Nachschlagewerk für Fortgeschrittene: FAQ: Antworten auf Ihre häufigsten Probleme (Gebundene Ausgabe) Gerald Singelmann: Adobe InDesign CS3 - Das Nachschlagewerk für Fortgeschrittene: FAQ: Antworten auf Ihre häufigsten Probleme (Gebundene Ausgabe)