Data Masking / Daten-Anonymisierung mit Oracle
Oft müssen Daten für Test-Systeme und Development anonymisiert bzw. maskiert werden. Unabhängig vom eingesetzten Datenbankmanagementsystem gelten hierfür einige Regeln:
- Die Maskierung bzw. Anonymisierung der Daten muss irreversible sein. Es darf nicht möglich sein, sensible Original-Daten aus dem anonymisierten Datenbestand zurück gewinnen zu können.
- Das Ergebnis sollte representativ für die Quell-Daten sein. Maskierung spiegelt im Gegensatz zu einem einfachen Randomize die Verteilung der Quelldaten wieder. Nur so ist die Konstanz der Ausüfhrungspläne und damit der Datenzugriffe zwischen produktiven und Test- bzw. Entwicklungssystem gesichert. Das Verhalten der Datenbank kann bei einer abweichenden Verteilung der Daten ein bei Datenzugriffen ebenfalls abweichen.
- Referentielle Integrität muss beibehalten werden. Master- und Detail-Daten müssen einander zugeordnet werden können.
- Nicht-sensitive Daten müssen nur dann maskiert werden, wenn aus ihnen sensible Daten abgeleitet werden können.
- Maskierung muss ein wiederholbarer Prozess sein. Entwicklungs- und Test-Daten müssen regelmäßig aus der produktiven Umgebung übernommen und erneut maskiert werden können. Nur so ist es möglich, Änderungen der produktiven Datenverteilung und damit des Verhaltens des Optimizers im Test- und Entwicklungssystem zu reproduzieren.
Stefan Ausmann
info
held-informatik
de