Skip to main content

PDFxFlight / PDFxPlore

Analyse, Aufbereiten und Ausgabe von PDF-Dokumenten.

PDFxPlore – Datenanalyse und Datenextraktion

Die Analyse der Daten, auch die Entnahme von Inhalten erledigt PDFxPlore, ohne Änderungen im eigentlichen Dokument auszuführen. Damit wird die Analyse nicht nur extrem schnell, es ist auch eine revisionssichere Verarbeitung der Dateien sichergestellt. 

PDFxPlore dient der Analyse von existierenden PDF-Dateien, mit dem Ziel, die enthaltenen Daten im weiteren Druckprozess zu nutzen. Das Tool liest zuerst die Metadaten einer PDF-Datei aus, in denen die Eigenschaften eines Dokuments beschrieben werden. Aus den hinterlegten Informationen zu Inhalt und Struktur werden so die Werte identifiziert, die im weiteren Verarbeitungsprozess benötigt werden.

Das können Seitenanzahl, Papierformat und -typen, Ersteller-Informationen und weitere signifikante Inhalte sein. Die Metadaten werden anschließend in strukturierter Form an den Spooler übergeben, der sie nach einem vorab definierten Prozessworkflow weiterverarbeitet.

Weiterhin untersucht PDFxPlore die Texte im PDF-Dokument nach festgelegten Parametern, etwa einzelnen Wörtern oder Textbausteinen. Alternativ kopiert das Tool in einem weiteren Arbeitsschritt auch den kompletten Text aus einem PDF-Dokument. Die Daten stehen anschließend in vielfältiger Weise zur Steuerung der Weiterverarbeitung, etwa der Sortierung oder Zuordnung zu bestimmten Prozessen, die Anreicherung mit externen Daten oder der Übernahme in ein Textverarbeitungsprogramm, bereit.

Leistungsmerkmale 

  • Export von Metadaten (Anzahl der Seiten, Erzeuger-Informationen usw.)
  • Bestimmung von Papierformat und -typ
  • Suchen und Extrahieren von signifikanten Inhalten (z. B. Dateianhänge)
  • vollständige Textextraktion (z. B. in eine XML-Datei oder als Blocktext)
  • Erstellung XTF-Format zur externen Indexierung der PDF-Datei
  • Analyse von PDF-Eigenschaften (z. B. Farberkennung, Verwendung von Transparenzen,
  • Informationen zu eingebetteten Schriftarten)

Plattformen

  • Windows Server > 2016
  • Linux

Eingangs-Formate

  • PDF

Ausgabe-Format

  • XML (VOL)
  • TXT
  • XTF 
  • PDF 

PDFxFlight – Strukturanalyse und Korrektur

Die enorme Popularität des PDF-Formats sorgt für eine Vielzahl von Weiterentwicklungen rund um den eigentlichen Standard, etwa neue Ausgabetechniken oder gerätespezifische Funktionen. Oft entstehen überdies Fehler bei der Erzeugung von PDF-Dokumenten, so werden Schriften nicht eingebettet, Transparenzen nicht geglättet oder Grafiken im falschen Farbsystem anlegt. Diese Inkompatibilitäten führen zu unterschiedlichsten Problemen in der Ausgabe.

Daher gilt es besonders bei der Übernahme vorhandener Dokumente, diese einer Prüfung auf eventuelle Abweichungen von Standards zu überprüfen. PDFxFlight analysiert den Inhalt einer PDF-Datei und eine Reihe anderer Bedingungen und stellt fest, ob die Datei für die weitere Verarbeitung oder den Druck geeignet ist. 

Korrektur der PDF-Datei

Nach der Ermittlung möglicher Probleme und Fehler in der Datei werden die entsprechenden Parameter geändert, etwa die PDF-Version angepasst, das Farbmanagement durchgeführt und Farben in den korrekten Farbraum konvertiert.

Dazu können das Format der Datei verändert werden, Seiten gedreht und eingebettete Grafiken und Bilder in eine passende Auflösung konvertiert werden.

Multithreading

PDFxFlight unterstützt das sogenannte Multithreading, um eine Massendatenbearbeitung zu vereinfachen. Hierbei werden umfangreiche PDF-Dateien in mehrere kleine PDFs zerteilt und in einem parallelen Prozess auf mehreren Instanzen des Tools ausgeführt. 

Leistungsmerkmale

  •  Analyse von PDF-Dateien auf Basis eines vorgebenden Ausgabe-Profile
  • Ermitteln von Problemen und Fehlern
  • Korrektur der ermittelten Fehler
  • Umfangreiches Farbmanagement
  • Unterstützt Multithreading

Plattformen

  • Windows Server > 2016
  • Linux 

Eingangs-Formate

  • PDF

Ausgabe-Format

  • PDF

Demo-Termin PDFxFamilie

Vereinbaren Sie heute noch einen unverbindlichen Demo-Termin, um zu erfahren, wie die PDFxFamilie in erfolgreich in Ihre Systemlandschaft integriert werden kann.
Bilder © Hesniac

Gewährleistung

Änderungen inhaltlicher und funktionaler Art vorbehalten, insbesondere jene, die der Verbesserung der Produktqualität und Funktionalität. Die genannten technischen Vorgaben stellen lediglich einen Rahmen dar und müssen im Einzelfall vor einer Integration abgestimmt werden.

Die in diesem Text genannten Funktionen und Möglichkeiten sind lediglich ein Überblick, erheben keinen Anspruch auf Vollständigkeit und dienen lediglich der werblichen Darstellung und ersten Information.

Wir übernehmen daher keine Gewährleistung, dass sich die gezeigten Lösungen ohne zusätzliche Beratung, Entwicklung und individuelle Anpassungen auf andere Branchen und Unternehmen übertragen lassen. Gerne präsentieren wir Ihnen die Lösung in einem unverbindlichen Beratungstermin, in dem wir dann auch auf individuelle Anforderungen und Fragen eingehen können.