Dokumentenerstellung KI

Dokumentenerstellung mit KI? Vier Hindernisse und wie sie überwunden werden

Von Markus Feller und  Mathias Landhäußer

Legal Tech hat einen Wandel hinter sich: erst Zukunftsmusik, dann Hype, jetzt in den Kanzleien. Doch der Weg zu einem gewinnbringenden Einsatz ist steinig und immer wieder hört man von gescheiterten Projekten (oder von welchen, die trotz hoher Investitionen abgebrochen wurden). KI gehört dabei zu den neueren, aber auch komplexeren Anwendungen, die durchaus einmal näher betrachtet werden sollte – denn das Potenzial für eine Arbeitserleichterung ist groß. In diesem Beitrag beleuchten wir daher die vier – aus unserer Sicht – größten Hindernisse für den Einsatz von KI in der Dokumentenerstellung und wie sie überwunden werden können.

In der täglichen juristischen Arbeit sind enorme Mengen an Text eine große Herausforderung. Selbst wenn fallbezogen Sach- und allgemeine (oder spezielle) Fachkenntnisse vorhanden sind, müssen umfassende Schriftsätze gelesen, systematisch aufbereitet und (abschließend) bearbeitet werden.

Die Dokumentenerstellung ist zwar repetitiv, jedoch nie gleich – das lässt eine technische Bearbeitung oder gar Automatisierung unmöglich erscheinen. Wir beschäftigen uns im Folgenden mit vier Hindernissen, die eine Automatisierung der Textarbeit erschweren:

  1. Zu große sprachliche Varianz in den Texten.
  2. Mangel an Trainingsdaten für die Dokumentenerstellung.
  3. Anwaltliche Expertise und Erfahrung für eine vernünftige juristische Beurteilung wird benötigt.
  4. Der innere bzw. wirtschaftliche Schweinehund muss überwunden werden.

Hindernis 1: Zu viel Varianz!

Obwohl in vielen Dokumententypen wiederkehrende Themen diskutiert werden, ist die sprachliche Varianz enorm: Dokumentstruktur, Argumentationsketten, Formulierungen und Dokumentgestaltung unterscheiden sich. Verfahren oder Lösungen, die zum Beispiel auf Stichwörtern basieren, lassen sich leicht aushebeln, wodurch die Automatisierung verhindert wird. Alle Varianten zu pflegen, verbietet sich aufgrund des enormen Aufwands.

Weit gefehlt! Moderne Ansätze, die sich Methoden der KI bedienen, können mit derartigen Problemen umgehen. Sprachliche Varianz stellt für sie kein Hindernis dar: KI-Sprachmodelle können heute dergestalt umgesetzt werden, dass sie – zu einem gewissen Maß – sprachliches Verständnis entwickeln. Dieses kann dann genutzt werden, um allgemeines Textverständnis unabhängig vom Wortlaut zu erzeugen.

Hindernis 2: Trainingsdaten für die Dokumentenerstellung fehlen!

Nun gut, denkt man, nutzen wir also KI. Doch in den Medien ist immer von Machine Learning oder Deep Learning die Rede. Hier trainieren Informatiker künstliche neuronale Netze so, dass sie wiederkehrende Muster erkennen und entsprechend reagieren können. Dafür benötigt man Trainingsdaten, genauer „Paare”, die aus einem Beispiel und einer sogenannten Annotation (oder Musterlösung) bestehen. Derartige Verfahren nutzt man zum Beispiel bei der Objekterkennung in Bildern oder beim Sortieren von Spam-E-Mails. Ein Bild und die Information „hier ist ein Vogel zu sehen” können beispielsweise ein solches Paar bilden. Ein anderes Beispiel ist eine E-Mail und die damit verknüpfte Information „dies ist Spam” oder „dies ist eine legitime E-Mail”.

Doch die benötigten Trainingsdaten sind immens: Der weithin bekannte Datensatz ImageNet umfasst über 14 Mio. (!) Bilddateien inklusive menschlicher Annotationen. Die Datenmengen für Googles C4 (ein aktuelles KI-Sprachmodell) sind unvorstellbar groß: Es wurde auf fast 37 GB Text[1] trainiert, was etwa 7500 mal der deutschen Ausgabe der Bibel (altes und neues Testament) entspricht. Derart umfangreiche Trainingsdaten sind im juristischen Umfeld kaum verfügbar und im europäischen Rechtsraum praktisch nicht vorhanden. Hinzu kommen rechtliche Fragestellungen wie, „darf ich mit diesen Daten überhaupt trainieren?” Das Training einer spezifischen Künstlichen Intelligenz ist folglich unpraktikabel – insbesondere, da man für jeden Anwendungsfall ein neues Training und damit neue, manuell annotierte Trainingsdaten benötigt. Diese zu erzeugen, ist in etwa so teuer, wie die Aufgaben direkt von Clickworkern erledigen zu lassen.

Systeme, die das erste Hindernis mit allgemeinem Sprachverständnis gemeistert haben, können jedoch mit einem wissensbasierten Ansatz kombiniert werden. Sie lösen sich damit z. B. von der konkreten Wortwahl eines Satzes und erkennen vielmehr seine Bedeutung. Dann trainiert man das System nicht mit einer riesigen Menge an Beispielen, sondern erklärt, was zu tun ist. Die KI kann damit umgehen. Sie ist daher – grob – vergleichbar mit einem Auszubildenden, dem man nicht 100.000 Klauselbeispiele ohne Erklärung vorlegt, sondern mit Prüfschemata und Handlungsanweisungen ausbildet. Dies vermögen heutige KI-Systeme zu leisten, insbesondere wenn eine Fachexpertin oder ein -experte die dedizierte Ausbildung übernimmt.

Hindernis 3: Für die Details benötigt man Experten und Expertinnen!

Eine zielgerichtete – und damit eine für Mandant:innen brauchbare – Analyse kann eine allgemeine Software nicht durchführen. Freilich: Zu prüfen, ob ein Flug verspätet landete, ob dadurch ein Entschädigungsanspruch entstand und eine formelle Forderung und eine anschließende Zahlungsüberwachung inkl. Mahnwesen und ggf. Klageeinreichung anzustoßen, lässt sich offensichtlich automatisieren. Doch wie soll ein solches System einen Bußgeldbescheid wegen Geschwindigkeitsübertretung im Straßenverkehr angreifen oder einen Softwareüberlassungsvertrag prüfen und mit einer Mandantin bzw. einem Mandanten die Vor- und/oder Nachteile diskutieren, gar alternative Lösungsansätze entwickeln? Die kurze Antwort: gar nicht. Gerade die Würdigung von Details des konkreten Einzelfalls ist eine der Kernaufgaben von Jurist:innen, die eine Software nicht übernehmen kann. Eine allgemeine – also gerade nicht auf einen spezifischen Ablauf zugeschnittene – wissensbasierte Textanalyse kann im Kanzleialltag dennoch hilfreich sein. Die Frage ist: Wie?

Verwendet man eine wissensbasierte Textanalyse, so kann sie mit vergleichsweise wenig Aufwand in den täglichen Arbeitsalltag integriert werden. Wiederkehrende Aufgaben lassen sich zu einem sehr hohen Prozentsatz automatisieren. Die KI ist dann ein „künstlicher Paralegal”, der die repetitive Vorarbeit übernimmt. Investiert man ein wenig mehr in die Ausbildung der KI, kann sie Dokumente analysieren und je nach Anwendungsfall eine intelligente Vorarbeit leisten oder eine Automatisierung anstoßen.

Dies könnte zum Beispiel eine Vorkategorisierung von eingehenden Briefen oder eine automatisierte Prüfung von Verträgen auf spezielle Themenpunkte sein. Die fachliche Würdigung bleibt dabei stets bei der Juristin – genau so, wie wenn ein Anwaltsgehilfe die Vorarbeit geleistet hätte. So kann nicht nur vermieden werden, dass z. B. unter Zeitdruck Dinge übersehen werden, sondern die Vorarbeit wird deutlich beschleunigt und die juristische Bewertung (und damit auch die Antwort an die Mandant:innen) kann schneller erfolgen. In der heute so schnelllebigen Zeit ein mehr als nur kleiner Wettbewerbsvorteil.

Hindernis 4: Der Schweinehund!

Bisher haben wir beleuchtet, was die landläufig bekannten Hindernisse sind und wie wir sie umgehen oder zu unserem Vorteil nutzen können – doch das größte Hindernis bleibt: Das Hadern und Abwägen, ob nun eine Technologie eingeführt oder die Arbeit weiterhin nach althergebrachter manueller Art erledigt werden soll. Natürlich gelangt man so zum Ziel – doch was, wenn die Konkurrenz auf den Zug aufspringt, niedrigere Bearbeitungszeiten liefert (womöglich garantiert) und damit Druck aufbaut? Dann kann man nur noch reagieren. Deshalb: Es lohnt sich, alle Aufgaben genau unter die Lupe zu nehmen und zu hinterfragen, wo Technologie helfen kann, die oft zu knappen menschlichen Kapazitäten wirklich sinnvoll einzusetzen. Das Rad hierbei selbst neu zu erfinden, dürfte in den wenigsten Fällen wirtschaftlich sein – zu groß sind die Aufwände für die Implementierung und zu weit weg ist das tägliche Geschäft einer Anwaltskanzlei von der Softwareentwicklung. Daher empfiehlt sich die Zusammenarbeit mit Softwarespezialisten, die entweder bereits ein passendes System anbieten oder bei der Anpassung oder Entwicklung unterstützen können.

Ein so ausgerüsteter Jurist bzw. eine so ausgerüstete Juristin kann sich auf die schwierigen Themen konzentrieren: das Abwägen, Formulieren von Alternativen und zuallererst auf den Dialog mit der Mandantschaft und den Gegenparteien. Dann liegt der Fokus auf der Beratung und nicht mehr auf der Papierarbeit.

[1] Siehe c4/realnewslike
Foto: Adobe Stock/zapp2photo
Weitere Beiträge

Markus Feller ist im Bereich Business Development bei der thingsThinking GmbH. Er legt besonderen Wert darauf, vorerst die genauen Herausforderungen auf Seiten der Kundinnen und Kunden zu verstehen, um dann mit einem einheitlichen Verständnis gemeinsam passende Lösungen zu entwickeln.

Weitere Beiträge

Mathias Landhäußer ist Geschäftsführer und Gründer von thingsTHINKING. tT ist ein KI-Start-up, das hilft, die Bedeutung von Texten zu verstehen. Er wendet Computerlinguistik und Knowledge Engineering auf kreative Aufgaben an. Mit einem starken Fokus auf die Generierung von Mehrwert für die Kunden und Kundinnen, legt er großen Wert auf das Benchmarking der Lösungen während der Entwicklung eines Produkts.

Nach oben scrollen