Der Vergleich von i-net PDFC zielt darauf ab, eine möglichst geringe Anzahl an Unterschieden zu finden. Dies kann dazu führen, dass bei großen Änderungen auch Wörter als gleich erkannt werden, die nur zufällig auf beiden Seiten vorkommen ohne jedoch zum gleichen Kontext zu gehören. Ein typisches Beispiel sind häufige Wörter, wie "und" oder "das" oder auch Satzzeichen.
Um die Anzahl ungünstiger Treffer bei großen Ersetzungen zu reduzieren, kann im Filterbereich des Profils die Option "Große Textunterschiede zusammenfassen" ausgewählt werden. Der Vergleich fasst dann große Ersetzungen zusammen, auch wenn dadurch eine geringe Anzahl identischer Elemente enthalten ist.
Das folgende Beispiel zeigt das Ergebnis bei einer Textersetzung mit dem Profil "Nur Text"
Dokument 1 | Dokument 2 |
---|---|
Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. | Nam liber tempor cum soluta nobis eleifend option. |
Das Wort "tempor" wird als gleich erkannt, obwohl es sich in einem unterschiedlichen Kontext befindet, da der ganze Absatz ersetzt wurde. Durch die Option "Große Textunterschiede zusammenfassen" kann dieser "Treffer" korrigiert werden:
Dokument 1 | Dokument 2 |
---|---|
Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. | Nam liber tempor cum soluta nobis eleifend option. |
Das Zusammenfassen von Unterschieden ist ein heuristisches Verfahren. Fehlerhafte Zusammenfassungen sind also möglich, jedoch sehr unwahrscheinlich. In jedem Fall wird dadurch aber kein Inhalt als "gleich" markiert, der es jedoch nicht ist. Es besteht nur eine geringe Chance, dass eigentlich gleiche Elemente als unterschiedlich markiert werden.