Universaltalent - mit kleinen Einschränkungen

In den mittlerweile mehr als 30 Jahren seit seiner Einführung hat sich das Dateiformat PDF (portable document format) allmählich zum "Superstar" in seiner Klasse entwickelt und ist aus dem heutigen Leben nicht mehr wegzudenken. So gut wie alle elektronisch lesbaren Schriftstücke, Bestätigungen, Formulare und Ähnliches liegen heutzutage in diesem Format vor.

Dieser Erfolg ist an sich gut nachvollziehbar, einerseits durch die technischen Eigenschaften begründet (lässt sich auf allen Geräten sehr gut darstellen, ganz egal ob großer Desktop-PC oder kleines Smartphone, die Dokumente sehen auch überall gleich aus und sind auch nicht von vorinstallierten Schriftarten etc. abhängig). Andererseits durch die weite Verbreitung, kostenlose Leseprogramme sind überall verfügbar und meist auf jedem neuen PC, Tablet oder Smartphone bereits vorinstalliert.

Im Bereich LIMS / Laborinformationssysteme zeigt sich natürlich das gleiche Bild, die Ausgabe von Berichten, Auftragsblättern, Angeboten, Rechnungen etc. als PDF-Datei ist eigentlich Standard, vielfach noch mit Optionen zur digitalen Signierung und dem automatischen Mailversand durch das LIMS, wie z.B. unser System "uniLIME".

Durch diese weite Verbreitung denkt man als LIMS-Anwender für die Ein- und Ausgabe von Dateien daher gerne als erstes an eine PDF-Datei. Das ist aber leider nicht immer eine geschickte Wahl, denn PDF ist primär für die gute Lesbarkeit durch Menschen gemacht, nicht aber durch Maschinen, also insb. wieder einen Computer.

Wenn wir von Zeit zu Zeit die Anfrage von unseren Kunden bekommen, eine als PDF vorliegende Datei in uniLIME zu importieren, müssen wir davon eher abraten, da die Weiterverarbeitung der enthaltenen Informationen nicht so einfach und die richtige Erkennung der korrekten Daten oft uneindeutig ist. Zwei für den Anwender fast gleich aussehende PDF-Dokumente können intern ganz unterschiedlich formatiert sein und die Zuordnung durcheinanderbringen.

Es gibt natürlich (teure) Spezialsoftware, die unter Anwendung von AI (artificial intelligence) Ansätzen die richtige Zuordnung doch noch sicherstellen und automatisieren können. Aber viel einfacher und noch sicherer geht es mit für diesen Zweck besser geeigneten Dateiformaten. So zum Beispiel tabellenorientierte Dateiformate wie Microsoft Excel, aber auch einfache Textformate (CSV, tabulator-getrennter Text etc.). Hier muss uniLIME z.B. nur wissen, dass das Probenahmedatum in Zelle C7 steht und die Parameter, Messwerte und Einheiten in den Spalten A-C ab Zeile 10.

Noch sicherer und zuverlässiger, allerdings viel aufwändiger in der Definition, sind Dateien im Format XML (extensible markup language). Diese kommen vor allem bei umfangreich genützten Schnittstellen wie elektronische Rechnungen etc. zur Anwendung.

Aber PDF hat hier noch nicht ausgedient - es gibt die Möglichkeit von "Hybridformaten", einfach eine PDF-Datei, die für die Ansicht durch Menschen optimiert ist. Die aber in einem speziellen Unterformat von PDF (PDF/A-3) die Option bietet, Originaldaten oder andere für die automatisierte Verarbeitung besser geeignete Dateiformate direkt in der PDF-Datei einzubinden. Dies kann z.B. eine XML-Datei (elektronische Rechnung) oder eine Excel-Datei sein. Wenn man so will "das Beste aus beiden Welten" ...

< Früherer Beitrag