XML-Teil einer ZUGFeRD-Rechnung unter Linux extrahieren
ZUGFeRD (Zentraler User Guide des Forums elektronische Rechnung Deutschland) ist ein Standard für elektronische Rechnungen, der sowohl eine visuelle Darstellung im PDF-Format als auch maschinenlesbare Daten im XML-Format kombiniert. Der XML-Teil ist in die PDF-Datei eingebettet und enthält strukturierte Daten, die von Buchhaltungs- und ERP-Systemen verarbeitet werden können.
Unter Linux kann der XML-Teil einer ZUGFeRD-Rechnung mit dem Kommandozeilentool pdfdetach extrahiert werden. Dieses Tool ist Teil des Poppler-Pakets und ermöglicht das Extrahieren von eingebetteten Dateien aus PDF-Dokumenten.
Die Extraktion kann über folgendes Kommando gestartet werden (vor der Ausführung muss sichergestellt werden, dass pdfdetach installiert ist):
pdfdetach -saveall RECHNUNG.pdf
Die XML-Daten werden dadurch in eine eigenständige Datei geschrieben.