Der Tabellenerkennungsfilter kann verschiedene Techniken verwenden, um Tabellen in einem Dokument zu finden. Dieser Filter muss den Inhalt der Tabelle im Kontext der jeweiligen Zeilen, Spalten und Zellen vergleichen, wodurch falsch positive Unterschiede reduziert werden. Die Tabellenerkennung sollte für Dokumente verwendet werden, denen die Dokumentstruktur-Markierung fehlt.
Die verfügbaren Erkennungsmethoden unterscheiden sich hinsichtlich der Arten von Tabellen, die erkannt werden können, sowie hinsichtlich ihrer Leistung und Genauigkeit.
Dieser Detektor findet Tabellen anhand ihrer visuellen Rahmen oder Zellenhintergründe. Das Erkennungsergebnis ist sehr genau, erfordert nur minimale Leistung und benötigt keine externen Tools, weshalb dieser Detektor für den Tabellenfilter immer aktiv ist.
Das KI-Modell zur Tabellenerkennung verwendet ein lokales KI-Modell, um Tabellen zu finden, die keine sichtbaren Ränder haben und nur anhand der Struktur des Textinhalts identifiziert werden können. Dieser Ansatz ermöglicht die Erkennung von Tabellen, die vom Standarddetektor nicht identifiziert werden können. Die Verwendung des KI-Modells erfordert jedoch eine viel höhere Leistung als der Standarddetektor, weshalb es nur bei Bedarf für alle Benutzer verfügbar gemacht werden sollte.
Das KI-Modell ist auf externe Tools angewiesen, die installiert und konfiguriert werden müssen, damit dieser Detektor funktionsfähig ist.
Die Installation der erforderlichen Tools, Abhängigkeiten und KI-Modelle erfordert bis zu 1 GB Speicherplatz. Die Liste der erforderlichen Python-Abhängigkeiten finden Sie hier.
Hinweis: Bei Verwendung dieses Detektors werden die erforderlichen Abhängigkeiten und Modelle möglicherweise automatisch heruntergeladen und installiert.
Das KI-Modell erfordert die Python-Laufzeitumgebung zur Ausführung. Diese Laufzeitumgebung muss installiert und für den Benutzer, der i-net PDFC ausführt, verfügbar sein.
Um Python zu installieren, gehen Sie wie folgt vor:
python –version aus, um zu überprüfen, ob Python verfügbar ist..pkg und folgen Sie den Anweisungen./Applications/Python X.X und fügt es zu /usr/local/bin hinzu, wo es für alle Benutzer zugänglich ist.python3 –version aus./usr/local/bin/python3 verfügt (die Standardberechtigungen sind in der Regel ausreichend).sudo apt update.sudo apt install python3 python3-pip -y./usr/bin/python3.python3 –version aus, um dies zu bestätigen./usr/bin/python3)./usr/local/bin:tar -xzf Python-X.X.X.tar.gz cd Python-X.X.X ./configure --prefix=/usr/local make sudo make install
/usr/local/bin/python3 –version.Das KI-Modell und die erforderlichen Abhängigkeiten werden bei der ersten Verwendung des Plugins automatisch heruntergeladen. Bei diesem Vorgang werden bis zu 1 GB zusätzliche Abhängigkeiten und das KI-Modell heruntergeladen.
Die Konfigurationsoption KI-Modell für Tabellen wird aktiviert, sobald i-net PDFC überprüfen kann, dass Python installiert ist und alle erforderlichen Abhängigkeiten sowie das KI-Modell verfügbar sind.
Falls eine der Voraussetzungen nicht erfüllt ist, wird eine Fehlermeldung angezeigt. Häufige Probleme sind: