Vergleichsprofile

Filter und Optimierungen

Originale PDF-Textreihenfolge vergleichen

Diese Filteroption definiert, wie i-net PDFC mit PDF-Dokumenten umgehen wird. i-net PDFC versucht standardmäßig das Layout von Seiten und Dokumenten zu ermitteln. Mit dem Aktivieren dieser Option wird die Erkennung umgangen und stattdessen die originale Druckreihenfolge des Dokuments verwendet. Es wird empfohlen, diese Option nur zu verwenden, wenn das PDF von einer Textverarbeitungssoftware erstellt wurde.

Details und Beispiele finden Sie in der Hilfe zum PDF Parser.

CMAP Deaktivieren

Mit dieser Option wird der PDF-Parser die Zuordnung von Zeichennummern zu lesbarem Text aufheben. Dies löst oft Probleme mit absichtlich verschleierten PDF-Dateien, die von vornherein keine solche Zuordnung haben. Der Nachteil ist, dass die Lesbarkeit der Unterschiede dadurch schwieriger werden kann und nicht funktioniert, wenn die CMAPs der beiden Dokumente unterschiedlich ist. Es handelt sich also nicht um eine allgemeine Lösung, aber sie funktioniert oft für PDFs, die von derselben Anwendung erzeugt wurden.