In PDF Dateien kann es vorkommen, dass keine Zuordnungstabelle von sichtbaren Zeichen auf maschinenlesbare vorhanden ist. Teilweise wird dies auch bewusst genutzt, damit Dokumente nicht von Suchmaschinen indiziert werden können. Das Problem ist daran zu erkennen, dass i-net PDFC im Vergleich scheinbar korrupte Texte vergleicht obwohl die Dokumente korrekt dargestellt werden. Zudem führt das Kopieren aus solchen Dokumenten - auch mit anderen PDF Anwendungen - zu korrupten Texten.
Als Lösung verwendet dieses Plugin Texterkennung, um die Zuordnungstabelle selbst zu ermitteln. Die Genauigkeit der Erkennung hängt dabei von der Menge an Text ab - je mehr Text, desto exakter die Zuordnung.
Name | Beschreibung |
---|---|
FILTERS | Zum Aktivieren den Wert CMAPPATCH in die kommaseparierte Liste eintragen. Standardmäßig deaktiviert |