SearARep

Programm zum
Suchen und Ersetzen in Dateien
mit eigener Scriptsprache

Wps RegEx

Kostenloses Programm zum lokalen Testen und Verwalten von Regulären Ausdrücken

Schriftzug Werner Perplies

Home

Adobe InDesign

SearARep

Wps RegEx

Corel Ventura Informationen und Skripte

Anwenderforum zur CA Visual Objects Programmierung

OCR

automatische Textaufbereitung

Datenkonvertierung

Crossmedia Publishing

Database-Publishing

zur Person

Werner Perplies
Gramanstr. 56
84518 Garching a. d. Alz
Telefon: 0049-8634-3291020
Telefax: 0049-8634-32910209

E-Mail:
werner.perplies@weepee.de

Umsatzsteuer-
Identifikationsnummer
gemäß § 27 a Umsatzsteuergesetz:
DE 173599862

Haftungshinweis:
Trotz sorgfältiger inhaltlicher Kontrolle übernehme ich keine Haftung für die Inhalte externer Links.

Für den Inhalt der verlinkten Seiten sind ausschließlich deren Betreiber verantwortlich.

Alle Warenbezeichnungen dienen lediglich der Beschreibung meiner Dienstleistung.

Sie werden ohne Gewährleistung der freien Verwendbarkeit benutzt und sind möglicherweise eingetragene Warenzeichen.

© 2002-2010 Werner Perplies, Garching


Stand:
Montag, den 3. November 2011
16:47 Uhr

[Sitemap]

Automatische Textaufbereitung

Häufig sind Texte aufgrund ihrer Herkunft ohne jede Textaufbereitung.

Die Texte stammen oft aus Programmen, die lediglich einen reinen Textexport erlauben, mit OCR-Programmen eingelesen, oder ohne jegliche Strukturierung und Gestaltung erfasst wurden.

Textaufbereitung bedeutet hier, dass Texte strukturiert und je nach Art der Weiterverarbeitung gestaltet werden sollen.

Dieser Vorgang kann oft zu einem erheblichen Teil automatisiert werden.

Hierzu gehören:

  1. Seitenerkennung
  2. Absatzerkennung
  3. Erkennung von verschiedenen Überschriftebenen
  4. Erkennung von Gliederungsebenen
  5. Erkennung von Tabellenelementen
  6. Erkennung von weiteren Elementen
    • wie Namen
    • wie Zahlenformaten
    • sonstigen klassifizierten Wörtern, die aus Wörterbüchern stammen.

  7. Die standardisierte Verwendung von Sonderzeichen und Abständen:
    • Bindestrichen, Gedankenstrichen, Anführungszeichen, Apostrophen und Klammern.
    • Die einheitliche Schreibweise von Abkürzungen.

Die Basis der automatischen Textaufbereitung können dabei sowohl gestalterische Elemente wie auch inhaltliche (kontextabhängige) Elemente sein.

Zielsetzung dieser Textaufbereitung kann die Weiterverarbeitung dieser Daten

  1. zu Druckwerken (Aufbereitung für die Druckvorstufe)
  2. zu digitalen Publikationen
  3. zur Weiterverarbeitung in Datenbanken

sein.

Lesen Sie hierzu bitte auch

Crossmedia Publishing

Database-Publishing


Anzeigen
Auswahl Bücher:

Kindle eReader, Wi-Fi, 15 cm (6 Zoll) E Ink Display, deutsches Menü

Stefan Koch: JavaScript: Einführung, Programmierung und Referenz

Ralph Steyer: Das JavaScript-Handbuch: Einführung, Praxis und Referenz

Andreas Kühnel: Das umfassende Handbuch (Galileo Computing)

Jürgen Bayer: Das C# 2010 Codebook

Dirk Louis (Autor), Shinja Strasser (Autor), Thorsten Kansy (Autor):
Microsoft Visual C# 2010 - Das Entwicklerbuch: Grundlagen, Techniken, Profi-Know-how

Matthias Geirhos: Professionell entwickeln mit Visual C# 2010: Das Praxisbuch (Galileo Computing)

Thomas Theis: Einstieg in Visual C# 2010: Inkl. Visual Studio Express Editions (Galileo Computing)

Jeffrey E. F. Friedl (Autor), Andreas Karrer (Übersetzer): Reguläre Ausdrücke