Metadaten in PDF-Dokumenten

Die meisten Dateien enthalten neben den eigentlichen Daten auch noch weitere Informationen, die über über die Datei-Informationen (wie Dateigrösse und Erstellungsdatum) hinausgehen. Die PDF-Metadaten können beispielsweise der Name des Author, Titel und Stichworte sein.

Bei der Erstellung von PDF-Dateien mit pdflatex können diese Informationen in der Definition eingesehen werden.

Bei PDF-Dateien, welche aus Word- oder OpenOffice-Dokumenten erstellt werden, können diese Informationen zwar auch eingesehen und geändert werden, jedoch sind sie ein bisschen versteckt und häufig mit Standard-Werten gefüllt. Das heisst, dass im Authoren-Feld in vielen Fällen nicht der richtige Name des Erstellers steht, sondern ein Benutzername (oder der Name, mit welchem er sich eingeloggt hat). Wenn nun noch der Firmen-Name drinsteht, existiert ein Ansatz für einen Brute-Force-Angriff. Dieser kann beispielsweise auf Webinterfaces für Mail oder ähnliches ausgeführt werden.

Mit pyPDF gibt es ein Python-Modul, das sehr einfach genutzt werden kann, um Details über PDF-Daten auszulesen.

So lässt sich der Autor jedes Dokumentes bestimmen. Wie oft steht da nun ein Benutzername?

This entry was posted in Security. Bookmark the permalink.

Leave a Reply

Your email address will not be published. Required fields are marked *

Time limit is exhausted. Please reload CAPTCHA.