SearARep

Programm zum
Suchen und Ersetzen in Dateien
mit eigener Scriptsprache

Wps RegEx

Kostenloses Programm zum lokalen Testen und Verwalten von Regulären Ausdrücken

Schriftzug Werner Perplies

Home

SearARep

Wps RegEx

Corel Ventura Informationen und Skripte

Anwenderforum zur CA Visual Objects Programmierung

OCR

automatische Textaufbereitung

Datenkonvertierung

Crossmedia Publishing

Database-Publishing

zur Person

Werner Perplies
Gramanstr. 56
84518 Garching a. d. Alz
Telefon: 0049-8634-329102
Telefax: 0049-12120-212988

E-Mail:
werner.perplies@weepee.de

Umsatzsteuer-
Identifikationsnummer
gemäß § 27 a Umsatzsteuergesetz:
DE 173599862

Haftungshinweis:
Trotz sorgfältiger inhaltlicher Kontrolle übernehme ich keine Haftung für die Inhalte externer Links.

Für den Inhalt der verlinkten Seiten sind ausschließlich deren Betreiber verantwortlich.

Alle Warenbezeichnungen dienen lediglich der Beschreibung meiner Dienstleistung.

Sie werden ohne Gewährleistung der freien Verwendbarkeit benutzt und sind möglicherweise eingetragene Warenzeichen.

© 2002-2008 Werner Perplies, Garching


Stand:
Sonntag, den 24. August 2008
17:41 Uhr

Automatische Textaufbereitung

Häufig sind Texte aufgrund ihrer Herkunft ohne jede Textaufbereitung.

Die Texte stammen oft aus Programmen, die lediglich einen reinen Textexport erlauben, mit OCR-Programmen eingelesen, oder ohne jegliche Strukturierung und Gestaltung erfasst wurden.

Textaufbereitung bedeutet hier, dass Texte strukturiert und je nach Art der Weiterverarbeitung gestaltet werden sollen.

Dieser Vorgang kann oft zu einem erheblichen Teil automatisiert werden.

Hierzu gehören:

  1. Seitenerkennung
  2. Absatzerkennung
  3. Erkennung von verschiedenen Überschriftebenen
  4. Erkennung von Gliederungsebenen
  5. Erkennung von Tabellenelementen
  6. Erkennung von weiteren Elementen
    • wie Namen
    • wie Zahlenformaten
    • sonstigen klassifizierten Wörtern, die aus Wörterbüchern stammen.

  7. Die standardisierte Verwendung von Sonderzeichen und Abständen:
    • Bindestrichen, Gedankenstrichen, Anführungszeichen, Apostrophen und Klammern.
    • Die einheitliche Schreibweise von Abkürzungen.

Die Basis der automatischen Textaufbereitung können dabei sowohl gestalterische Elemente wie auch inhaltliche (kontextabhängige) Elemente sein.

Zielsetzung dieser Textaufbereitung kann die Weiterverarbeitung dieser Daten

  1. zu Druckwerken (Aufbereitung für die Druckvorstufe)
  2. zu digitalen Publikationen
  3. zur Weiterverarbeitung in Datenbanken

sein.

Lesen Sie hierzu bitte auch

Crossmedia Publishing

Database-Publishing