Über unsMediaKontaktImpressum
[Sponsored Post] 13. Dezember 2016

Testdatenmanagement: Datenanonymisierung muss unumkehrbar sein

Testsysteme sind keine produktiven Systeme. © jijomathai / Fotolia.com
© jijomathai / Fotolia.com

Testsysteme benötigen Daten. Doch Live-Daten sind sensibel, Datenschutz ist ein wichtiges Thema. Um diesen einzuhalten, müssen Testdaten regelmäßig anonymisiert und aufbereitet werden. Doch was ist mit Datenverteilungen, die Auswirkungen auf Auswertungen haben?

Die ISO-Norm 27001 spielt ebenfalls eine Rolle, doch wie ist sie optimal zu berücksichtigen? Wir haben mit Hans-Joachim Krüger (Vorstand/CTO der Libelle AG) über das Management von Testdaten gesprochen.

Informatik Aktuell: Sie sprechen im Rahmen der IT-Tage über Daten-Anonymisierung und ISO27001-konformes Testdatenmanagement. ISO 27001 – Was ist das? Was sind die Kernthemen dieser Norm? Und was muss ich beachten??

Hans-Joachim Krüger: Die ISO27001 wird in vielen Unternehmen und Organisationen gefordert. Das betrifft z. B. viele Hostingunternehmen und Systemdienstleister. Die ISO27001 definiert einen sogenannten IT-Grundschutz. Und dieser IT-Grundschutz betrifft nicht nur produktive Systeme sondern auch Testsysteme.

Informatik Aktuell: Worauf ist bei Testsystemen bezüglich der ISO 27001 zu achten?

Hans-Joachim Krüger: Ich benötige Testsysteme mit Daten. Leere Testsysteme ohne Daten sind sinnlos. Damit kann man nicht testen. Auch künstlich erstellte Daten in Testsystemen geben häufig kein Abbild der realen IT-Welt wieder. Also brauche ich produktive Daten, die die reale Welt abbilden, in Testsystemen, die aber nicht mehr "produktiv" sind. Das Thema ist hierbei: Die produktiven Daten müssen anonymisiert werden.

Informatik Aktuell: Welche Herausforderungen haben Unternehmen bzw. Organisationen damit?

Hans-Joachim Krüger: Testsysteme sind keine produktiven Systeme. Testsysteme haben daher auch nicht den Fokus auf Sicherheit gegen unbefugten Zugriff, wie es produktive Systeme haben. Die Testsysteme sind also leichter angreifbar. Aus diesem Grund und aufgrund von Datenschutzvorgaben gilt daher: Keine produktiven Daten in Testsystemen. Das Motto lautet also: Daten aus produktiven Systemen werden anonymisiert als Testdaten genommen.

Informatik Aktuell: Worauf sollte man bei der Anonymisierung von Testdaten achten?

Hans-Joachim Krüger: Ein Ziel ist: Die Datenanonymisierung muss unumkehrbar sein. Ich darf aus den anonymisierten Daten nicht auf die Originaldaten zurückschließen können. Eine weitere Zielsetzung ist, dass alle personen- und organisationsbezogenen Daten anonymisiert werden. Das sind Personal-Nummern, Namen, Vornamen, Adressen. Aber genauso auch Geburtsdatum, E-Mail-Adressen, Bankverbindungen und Kreditkarteninformationen.

Das Ziel ist ganz klar: keine produktiven Daten in Testsystemen.

Informatik Aktuell: Welche Varianten des Testdatenmanagements gibt es denn?

Hans-Joachim Krüger: So kurios es auch klingen mag: die einfachsten Varianten sind: Löschen und konstanter Wert. Das sollte man nicht außer Acht lassen. Aber natürlich sind die "echten" Varianten Shuffle-Algorithmen, Referenz-Daten bzw. eigene Algorithmen. Beim Shuffle werden einfach die Daten aus den bestehenden Datenbeständen gemischt. Bei Referenz-Daten wird auf externe Daten zugegriffen. Wichtig ist in allen Fällen, dass nach der Anonymisierung die Anwendung konsistent ist. Und wenn ich mehrere Anwendungen in einer Landschaft anonymisieren muss, dann muss auch die ganze Landschaft anschließend wieder konsistent sein.

Informatik Aktuell: Wie organisiert man das Management von Testdaten am besten?

Hans-Joachim Krüger: Indem man Prozesse, Workflows und Checklisten zu Hilfe nimmt. Damit definiert man die eigenen Anforderungen und Lösungen sowie deren Umsetzung. Und schon ist man in diesen komplexen Vorgängen, Testdaten und ISO-Anforderungen zusammenzubringen, unterwegs und hat einen strukturierten Ablauf darin.

Informatik Aktuell: Was können Sie daher als Best Practices empfehlen?

Hans-Joachim Krüger: Das Ziel ist ganz klar: keine produktiven Daten in Testsystemen. Beginnen Sie mit einfachen Anonymisierungen. Der große Ansatz "Alles muss anonymisiert werden" ist nicht realistisch. Starten Sie also mit einem überschaubaren Anonymisierungs-Projekt. Die Projekte sind ja periodisch zu wiederholen. Denn die Testdaten müssen regelmäßig auf einen aktuellen Stand gebracht werden. Und mit der Iteration können sie die einfachen Anonymisierungen ergänzen, optimieren und automatisieren. Und mit diesem evolutionären Ansatz schafft man dann auch den letzten Schritt – eine Komplett-Anonymisierung.

Informatik Aktuell: Gibt es dabei Hürden für Unternehmen?

Hans-Joachim Krüger: Beteiligt sind bei diesen Aktivitäten neben der IT-Abteilung die Fachbereiche und üblicherweise der Datenschutzbeauftragte. Viele andere IT-Projekte können allein von der IT-Abteilung organisiert und durchgeführt werden. Das ist von der Organisation her viel einfacher. Beim Testdatenmanagement sprechen nun aber schon mindestens drei Abteilungen eines Unternehmens/Organisation mit. Und das ist sehr viel schwieriger zu organisieren. Viele Unternehmen und Organisationen haben große Probleme damit.

Informatik Aktuell: Wie lassen sich solche Hürden am besten meistern?

Hans-Joachim Krüger: Am besten geht das mit einem Software-Tool, das mich bei diesem Prozess unterstützt. Die Organisation und die Voraussetzungen muss ich selbst auf den Weg bringen. Wenn das gemacht ist, bekomme ich mit einer Software den ganzen Durchlauf sehr schnell umgesetzt.

Informatik Aktuell: Libelle DataMasking (LDM) ermöglicht eine automatisierte und optimierte Anonymisierung von Daten. Für welche Anwendungen kann LDM denn eingesetzt werden, um Daten zu maskieren??

Hans-Joachim Krüger: Wir sind mit unserem Produkt LDM in der Lage, beliebige Umgebungen und damit auch beliebige Anwendungen zu maskieren.

Informatik Aktuell: Kann LDM denn auch für SAP-Systeme eingesetzt werden? Und was ist mit anderen proprietären Anwendungen??

Hans-Joachim Krüger: Ja, wir können sowohl SAP- als auch Non-SAP-Umgebungen behandeln. Und da wir nicht nur einzelne Systeme betrachten, sondern ganze Landschaften von Systemen, kann mit einem Anonymisierungslauf eine SAP-Umgebung, deren Schnittstellen und nach- bzw. vorgelagerte Anwendungen maskiert werden. Neben den Standard-Anwendungen SAP, etc. können wir auch individuelle, kunden-eigene Anwendungen anonymisieren.

Informatik Aktuell: Das Ergebnis sind anonymisierte, konsistente Daten für Entwicklung und Test von Software. Die eingesetzten Anonymisierungsverfahren sollen dabei realistisch aussehende Werte liefern, mit denen fast alle Geschäftsfälle beschrieben und getestet werden können. Wie ist das denn intern realisiert?

Hans-Joachim Krüger: Wir setzen dabei auf unsere LibellePlatform. Dazu gehören u. a. die LibelleConnectors, die es uns ermöglichen, auf quasi beliebige Daten zuzugreifen. Das sind alle gängigen relationalen Datenbanken, neue NoSQL-Datenbanken, aber auch Mainframe-Umgebungen und Files, wie XML, JSON, ASCII oder Excel. Zusätzlich haben wir in der LibellePlatform unsere eigene Sprache LibelleShell. Sie ermöglicht es, heterogene Umgebungen anzusprechen, wie z. B. ein Remote-Zugriff auf entfernte Systeme, Datenbanken und Applikationen.

Informatik Aktuell: Wie geht man dabei genau vor? Welche technischen Voraussetzungen sind zu erfüllen??

Hans-Joachim Krüger: Die Libelle-Produktpolitik lautet: Wir passen uns mit unseren Tools den Kundenumgebungen an, nicht umgekehrt. Dazu gehören ein Installer, der auch Remote installieren kann, ein Server- Prozess mit einer Embedded-DB und ein Web-Interface für die Konfiguration, das Monitoring und das Controlling der Abläufe. Im einfachsten Fall genügen uns dazu ein Standard-Linux oder Standard-Windows-Rechner.

Informatik Aktuell: Wie lange dauert der Prozess der Datenanonymisierung?

Hans-Joachim Krüger: Wie immer lautet die Antwort da: es kommt darauf an. Die Installation ist einfach, da der Installer alles macht. Die Konfiguration kann bei einer überschaubaren Umgebung in einem Tag gemacht sein. Ein Anonymisierungslauf muss dann getestet und im Einzelnen kontrolliert werden. Wenn das aber ein wenig optimiert und automatisiert ist, läuft eine Anonymisierung in einer Nacht durch. Wie gesagt, wenn die Umgebung überschaubar ist. Das kann natürlich bei komplexen Umgebungen wesentlich mehr sein. Unsere Erfahrung zeigt aber, die organisatorischen Themen nehmen ein Vielfaches an Zeit ein. Da steckt die Komplexität. Unsere Software LDM ist da "locker und einfach".

Informatik Aktuell: Herr Krüger, ganz herzlichen Dank für das Gespräch.

libelle.com

Libelle AG:

Automatisierte und optimierte Daten-Anonymisierung mit realistischen Werten

Hans-Joachim Krüger auf den IT-Tagen 2016

Daten-Anonymisierung: ISO27001 konformes Testdatenmanagement

Hans-Joachim Krüger hat am 14.12.2016 zum Thema "Daten-Anonymisierung: ISO27001 konformes Testdatenmanagement" eine Session auf unserer Jahreskonferenz, den IT-Tagen 2016 gehalten.

Im Interview

Hans-Joachim Krüger

Hans-Joachim Krüger ist Diplom-Informatiker und Co-Founder der Libelle Informatik GmbH (später Libelle AG). Heute ist er tätig als Entwicklungsleiter und Vorstand der Libelle AG in Stuttgart.
>> Weiterlesen
botMessage_toctoc_comments_929