Aktivieren, um komplexe Zeichen wie Ligaturen oder spezielle Satzzeichen auf den Basiszeichensatz zu vereinfachen. Ein Komplexes Zeichen ist beispielsweise die "fi"-Ligatur, welche inhaltlich identisch zu "fi" ist. Ohne diesen Filter wird der Vergleich jedoch unterschiedliche Zeichen erkennen.
Beschreibung der Einstellmöglichkeiten für den Filter.
Name | Beschreibung |
---|---|
TRANSFORM_OPERATIONS | Zum Aktivieren den Wert REPALCE_IDENTICAL in die kommaseparierte Liste eintragen. Standardmäßig aktiv |
FILTERS | Zum Aktivieren den Wert TEXTTRANSFORM in die kommaseparierte Liste eintragen. Standardmäßig aktiv |
Aktivieren, um typische Fehlerkennungen durch OCR-Software zu kompensieren. Ein Beispiel für eine Ungenauigkeit bei Texterkennung ist die Verwechslung des Buchstaben "m" mit der Silbe "rn", welche je nach Druckqualität und Schriftart nahezu identisch aussehen. Der Filter korrigiert dies, indem gleich aussehende Zeichen oder Silben auch als gleich erkannt werden.
Beschreibung der Einstellmöglichkeiten für den Filter.
Name | Beschreibung |
---|---|
TRANSFORM_OPERATIONS | Zum Aktivieren den Wert REPLACE_CONFUSABLES in die kommaseparierte Liste eintragen. Standardmäßig nicht aktiv |
FILTERS | Zum Aktivieren den Wert TEXTTRANSFORM in die kommaseparierte Liste eintragen. Standardmäßig aktiv |