Brücken über die Textflut bauen
Neue Gesetze und Verordnungen bereiten nicht nur JuristInnen Kopfzerbrechen. Die im Mai 2018 in Kraft getretene Datenschutzgrundverordnung (DSGVO) der EU zum Beispiel betrifft all jene, die ihre privaten Daten schützen bzw. Personendaten verarbeiten wollen – dazu gehören Firmen, Vereine, Einzelpersonen oder auch Universitäten.
Aller Anfang ist schwer
"Gerade am Anfang, wenn eine neue Regelung kommt, ist oft unklar, was genau geschehen muss. Alle lesen sich ein und interpretieren – das ist nicht nur bei der DSGVO der Fall", weiß Stefanie Rinderle-Ma, die mit ihrer Forschungsgruppe "Research Group Workflow Systems and Technology" an der Fakultät für Informatik an der Schnittstelle von Wissenschaft und unternehmerischer Praxis forscht.
"Viele Unternehmen stehen vor Herausforderungen, wenn sie regulatorische Vorgaben umsetzen", so Rinderle-Ma. Denn häufig sind sie mit einem Bündel an Normen, Regelungen und umfangreichen juristischen Dokumenten konfrontiert. Längst nicht alles ist für eine Firma relevant; das Prüfen der Unterlagen kostet Zeit und Ressourcen. "Wir forschen seit Jahren daran, wie man Firmen dabei unterstützen kann", betont die Informatikerin.
Ein schneller Überblick
Zusammen mit Nachwuchsforscherin Karolin Winter hat sie eine Text Mining-Methode entwickelt und prototypisch umgesetzt, die Laien wie Unternehmen den Schrecken juristischer Dokumente nehmen kann. "Wir haben uns die Frage gestellt, wie sich aus diesen Texten automatisch wertvolle Informationen herausziehen lassen. BenutzerInnen wollen sich schnell einen Überblick verschaffen oder – wenn sich Regelungen ändern – unterschiedliche Textdokumente unkompliziert vergleichen", erläutern die Wissenschafterinnen. Gemeinsam forschen sie im vom Wiener Wissenschafts-, Forschungs- und Technologiefonds (WWTF) geförderten Projekt CRISP.
Das neu entwickelte Programm macht ein rasches Verständnis komplexer Inhalte möglich. Wie eine Suchmaschine filtert es Texte nach darin enthaltenen Themen oder Anweisungen an bestimmte NutzerInnen. Ein Beispiel: Abschnitte aus der DSGVO, die Nationalstaaten betreffen, sind für eine Firma nicht interessant. Das Unternehmen möchte nur wissen, was von ihm konkret erwartet wird – aber diese Informationen sind über das gesamte Dokument verteilt und damit schwer erfassbar.
Automatisierte Unterstützung
Mit Hilfe dieses Text Mining-Verfahrens lässt sich die DSGVO nach den angesprochenen Personengruppen und Organisationen strukturieren. "NutzerInnen finden die relevanten Anweisungen auf einen Blick – der Leseaufwand reduziert sich deutlich", betont Karolin Winter. "Das Programm markiert die jeweils relevanten Sätze, die wiederum mit den entsprechenden Textstellen im Dokument verlinkt sind." Wer also nachlesen möchte, in welchem Zusammenhang eine Regel beschrieben wird, braucht das Dokument nicht zu durchsuchen.
Ähnlich einfach ist es, wenn sich NutzerInnen lediglich über eine bestimmte Frage informieren wollen: Indem sie Textstellen mit dem Programm thematisch gruppieren, erhalten sie die gewünschten Informationen mit verhältnismäßig geringem Aufwand. "Mit maschineller Unterstützung lassen sich auch mehrere Texte gleichzeitig bearbeiten", ergänzt die Informatikerin.
Vergleichen ohne Aufwand
Die neue Methode des Text Minings leistet aber noch mehr: "Die Textmenge kann nicht nur reduziert werden. Das Programm kann darüber hinaus auch Verknüpfungen zwischen Textstellen herstellen", so die Forscherinnen. Vielfach finden sich in einem Dokument ähnliche Passagen, die das Programm als solche kennzeichnet und zusammenfasst – NutzerInnen können sie nacheinander durchsehen und vergleichen. Auch Konflikte werden angezeigt. So erkennen NutzerInnen schnell widersprüchliche Regeln oder auch Veränderungen von einer früheren Version des Dokuments zur nächsten.
Neue Wege des Text Minings
Indem sie in ihrem Verfahren die ursprüngliche Struktur der eingespeisten Dokumente auflösen und einen Vergleich von Regeln und Textpassagen untereinander per Mausklick ermöglichen, betreten die Forscherinnen Neuland. Aber auch mit der Möglichkeit, Text Mining auf große und komplex strukturierte Einzeldokumente anzuwenden, gehen sie über bisherige Methoden hinaus."Wir nutzen zwar bestehende Verfahren, aber die Aufbereitung des Dokuments ist neu", freuen sich die Forscherinnen.
Nach dem Durchdringen des Dschungels juristischer Texte steht nun die Suche nach weiteren Anwendungsmöglichkeiten in Wirtschaft und Wissenschaft auf dem Programm. Die Informatikerinnen wollen die Methode kontinuierlich erweitern. Denn letztlich ist der alltägliche Kampf mit der Textflut nicht nur auf Rechtsdokumente beschränkt. (jr)