Data Masking / Daten-Anonymisierung mit Oracle

 

Oft müssen Daten für Test-Systeme und Development anonymisiert bzw. maskiert werden. Unabhängig vom eingesetzten Datenbankmanagementsystem gelten hierfür einige Regeln:

 

  1. Die Maskierung bzw. Anonymisierung der Daten muss irreversible sein. Es darf nicht möglich sein, sensible Original-Daten aus dem anonymisierten Datenbestand zurück gewinnen zu können.
  2. Das Ergebnis sollte representativ für die Quell-Daten sein. Maskierung spiegelt im Gegensatz zu einem einfachen Randomize die Verteilung der Quelldaten wieder. Nur so ist die Konstanz der Ausüfhrungspläne und damit der Datenzugriffe zwischen produktiven und Test- bzw. Entwicklungssystem gesichert. Das Verhalten der Datenbank kann bei einer abweichenden Verteilung der Daten ein bei Datenzugriffen ebenfalls abweichen.
  3. Referentielle Integrität muss beibehalten werden. Master- und Detail-Daten müssen einander zugeordnet werden können.
  4. Nicht-sensitive Daten müssen nur dann maskiert werden, wenn aus ihnen sensible Daten abgeleitet werden können.
  5. Maskierung muss ein wiederholbarer Prozess sein. Entwicklungs- und Test-Daten müssen regelmäßig aus der produktiven Umgebung übernommen und erneut maskiert werden können. Nur so ist es möglich, Änderungen der produktiven Datenverteilung und damit des Verhaltens des Optimizers im Test- und Entwicklungssystem zu reproduzieren.