XML-Teil einer ZUGFeRD-Rechnung extrahieren
ZUGFeRD (Zentraler User Guide des Forums elektronische Rechnung Deutschland) ist ein Standard für elektronische Rechnungen, der sowohl eine visuelle Darstellung im PDF-Format als auch maschinenlesbare Daten im XML-Format kombiniert. Der XML-Teil enthält strukturierte Daten, die von Buchhaltungs- und ERP-Systemen verarbeitet werden können. Der XML-Teil ist in die PDF-Datei eingebettet.
Unter Linux kann der XML-Teil einer ZUGFeRD-Rechnung mit dem Kommandozeilentool pdfdetach extrahiert werden. Dieses Tool ist Teil des Poppler-Pakets und ermöglicht das Extrahieren von eingebetteten Dateien aus PDF-Dokumenten.
Die Extraktion kann über folgendes Kommando gestartet werden:
pdfdetach -saveall RECHNUNG.pdf
Die XML-Daten werden dadurch in eine eigenständige Datei geschrieben.
Veröffentlicht am 17.04.2025