Seit langem wird der Einsatz von Künstlicher Intelligenz (KI) im Recht diskutiert. Erste Projekte gab es bereits in den 1980er Jahren mit wissens- und logikbasierten Systemen, etwa ein gemeinsames Vorhaben von IBM Deutschland und der Universität Tübingen zur Lösung von Fällen zum unerlaubten Entfernen vom Unfallort (§ 142 StGB).[1] Wie auch in anderen Anwendungsgebieten stellte es die größte Herausforderung dar, die umfangreiche Wissensbasis (juristisches Wissen, linguistisches Wissen und Allgemeinwissen/Weltwissen) aufzubauen und konsistent zu halten. Insofern folgte eine Abkehr von den wissensbasierten Systemen hin zu Verfahren des maschinellen Lernens, die die heutigen Anwendungen von KI nicht nur im Rechtskontext dominieren.
In meinem Beitrag im Legal Tech-Magazin vom 28. November 2023 habe ich eine Reihe von Bereichen, in denen KI-Verfahren in der Justiz erprobt werden, identifiziert, u. a. Massenverfahren, Umfangsverfahren, die Anonymisierung von Gerichtsentscheidungen, das automatisierte Auslesen von Metadaten und die Unterstützung in der Strafrechtspflege.[2] Ein gesonderter Aufsatz im Magazin vom 27. Februar 2024 war den Möglichkeiten von Large Language Models in der Rechtsprechung gewidmet.[3]
Der nachfolgende Beitrag gibt hierzu ein Update und beleuchtet die seither erfolgten weiteren Entwicklungen zum KI-Einsatz in der Justiz. Dabei soll der Fokus auf den tatsächlichen KI-Anwendungen liegen, da nicht alles, was mit Digitalisierung zu tun hat, auch KI-Techniken nutzt. Der geradezu inflationäre Gebrauch des Begriffs KI[4] erschwert den Diskurs, da die unterschiedlichen Konzepte im Hinblick auf Chancen und Risiken nicht vermengt werden sollten und zwischen „einfachen“ Algorithmen und dem, was zur KI zu zählen ist, zu unterscheiden ist.[5] Besonders hinsichtlich des Begriffs Expertensystem prägen Missverständnisse die Diskussion in der (deutschsprachigen) juristischen Literatur: Ein System, das lediglich vom Menschen fest programmierte Wenn-Dann-Regeln abarbeitet, und seien es viele, ist weder Expertensystem noch KI.[6] Dazu bedarf es, wie die KI-VO (Art. 3 Nr. 1 sowie ErwG 12) richtig festhält, der Ableitung, also der Inferenz aus einer Wissensbasis. Insofern sind Hilfsprogramme z. B. im Bereich der Unterhaltsberechnung, nicht als KI-Systeme zu werten.[7]
Inhaltsverzeichnis
I. Aktuelle Einsatzbereiche von Künstlicher Intelligenz in der Justiz
- Projekte zur Unterstützung bei Massenverfahren
- Einsatz in Umfangsverfahren
- Anonymisierung und Erhöhung der Veröffentlichungspraxis
- Automatisiertes Auslesen von Metadaten
- Sonstige Einsatzbereiche
II. Aufbau eines generativen Sprachmodells der Justiz
III. Fazit
Aktuelle Einsatzbereiche von Künstlicher Intelligenz in der Justiz
1. Projekte zur Unterstützung bei Massenverfahren
Am prominentesten sind weiterhin die verschiedenen Projekte zur Unterstützung der Richterinnen und Richter bei der Bewältigung von Massenverfahren. Nach den Dieselverfahren, die mittlerweile deutschlandweit rückläufig sein dürften, verzeichnen nunmehr die Fluggastverfahren nach einem coronabedingten Rückgang in den Jahren 2020 bis 2022 neue Rekordzahlen. So sind die Eingänge in diesem Bereich von 125.000 Verfahren im Jahr 2023 auf 131.000 Verfahren im Folgejahr gestiegen. Das Amtsgericht Köln war dabei mit 41.300 Verfahren im Jahr 2024 Spitzenreiter, da das Gericht nicht nur für den Flughafen Köln-Bonn zuständig ist, sondern auch die Lufthansa AG ihren Hauptsitz im dortigen Gerichtsbezirk hat.[8]
Bekannt sind im Kontext der Massenverfahren OLGA, das für den Bereich der Dieselverfahren am OLG Stuttgart entwickelt wurde und für OberLandesGerichts-Assistent steht, sowie FRAUKE, das Akronym für FRAnkfurter Urteils-Konfigurator, Elektronisch, das Fluggastverfahren (Entschädigung nach der EU-Fluggastrechteverordnung bei Verspätung oder Annullierung von Flügen) zum Gegenstand hat. In beiden Fällen ist IBM-Technologie zur verbesserten Extraktion von Entitäten, wie den relevanten Daten für die Dieselfälle oder den Flugdaten im Fall von FRAUKE, im Einsatz.[9] Für die Unterstützung bei den Fluggastsachen soll in Hessen das Ausschreibungsverfahren für ein entsprechendes System starten[10], um einen umfassenderen Einsatz zu ermöglichen.
Zur Unterstützung bei Fluggastverfahren experimentieren mittlerweile auch andere Gerichte mit den Möglichkeiten der Künstlichen Intelligenz, z. B. das Amtsgericht Erding, das für den Münchener Flughafen zuständig ist. Hier liegen die gleichen Überlegungen zugrunde, nämlich die automatisierte Extraktion von relevanten Informationen aus den Schriftsätzen.[11] Ähnlich ist die Situation bei den Dieselverfahren, hierzu soll beim Oberlandesgericht München die Erprobung einer Software zur Unterstützung in zweitinstanzlichen Dieselverfahren erfolgen.[12]
Ein vielversprechender Ansatz, die bestehenden Anwendungen in diesem Kontext zu verbessern, liegt darin, vortrainierte Large Language Models zu verwenden. Bei den bisherigen Projekten werden die Systeme anhand einer nicht unbeträchtlichen Zahl von annotierten Schriftsätzen, in denen die relevanten Daten wie Flugdaten, Verspätungsdauer oder Automobilhersteller und Motorentyp händisch markiert werden und die als Lernmaterial dienen, trainiert (überwachtes Lernen).[13] Durch den Einsatz von vortrainierten Sprachmodellen könnte sich der Aufwand für das Training verringern und damit der Gegenstandsbereich vergrößern.
Diesen Ansatz verfolgt das System MAKI (Akronym für Massenverfahrens-Assistenz durch Künstliche Intelligenz), das in Niedersachsen entwickelt und getestet wird. Die Software soll durch ein einmaliges Anlernen eines Musterfalls (one shot annotation) leichter auf verschiedene Domänen und Fallmuster trainiert werden können, z. B. auf den wiederkehrenden Parteivortrag in zivilrechtlichen Streitfällen, Abrechnungspositionen in Kostenverfahren oder Daten aus maschinell erstellten Messprotokollen in Ordnungswidrigkeitenverfahren.[14] Das System MAKI „soll nach dem individuellem Training in der Lage sein, vergleichbare Fälle sicher zu erkennen und auf bereits getroffene Entscheidungen und Entscheidungsmuster aus gleichgelagerten Fällen zurückzugreifen,“ so das Bundesministerium der Justiz.[15] Einerseits könne dadurch schnell auf neue Massenphänomene reagiert werden, ohne die Software neu programmieren zu müssen, andererseits könnten Richterinnen und Richter dem System ihre individuelle Arbeitsweise beibringen.[16]
Das System hat damit gegenüber FRAUKE und OLGA den Vorteil, nicht an einen bestimmten Fall oder ein bestimmtes Massenverfahrensphänomen geknüpft zu sein und damit nicht nur für bestimmte Zivilverfahren, sondern beispielsweise auch für Asylverfahren geeignet zu sein. Getestet wird MAKI am Amtsgericht Hannover (Fluggastrechteklagen), an den Landgerichten Osnabrück und Hildesheim (Dieselklagen, Verstöße gegen die DSGVO, Verluste bei Online-Glücksspielen), am Oberlandesgericht Braunschweig (Bankensachen) und an Kammern der Verwaltungsgerichte Braunschweig, Göttingen und Hannover (Asylverfahren). Wissenschaftlich begleitet wird das Projekt durch die Georg-August-Universität Göttingen.[17]
2. Einsatz in Umfangsverfahren
Im Kontext von KI-Projekten in der Justiz wird immer wieder Codefy[18] genannt, das vor allem bei der Strukturierung von Akten, insbesondere in Umfangsverfahren, helfen soll.[19] Inwieweit hier tatsächlich Verfahren der Künstlichen Intelligenz zum Einsatz kommen, ist fraglich, gleichwohl erscheint es als nützliches Tool, das gerade in umfangreichen Verfahren von den Richterinnen und Richtern als hilfreich eingeschätzt wird. Seit Ende 2024 wird es in Bayern ausgerollt und stellt damit nicht mehr nur ein Pilotprojekt dar, sondern ist in der Fläche angekommen.
In dem baden-württembergischen Projekt AKIRA („Allgemeine KI-Richterassistenz“), bei dem die Sozialgerichtsbarkeit im Fokus steht, wird erforscht, wie die inhaltliche Zusammenfassung und juristische Vorstrukturierung des Verfahrensstoffs mittels KI unterstützt werden kann, um „Akteninhalte schneller, korrekt und vollständig zu erfassen“; am Sozialgericht Ulm soll ein „erster Entwurf“ in Zusammenarbeit u. a. mit dem Heidelberger Start-up Aleph Alpha, das große Sprachmodelle entwickelt, erarbeitet werden.[20] Das Projekt „StruKI“ (Strukturierung mit KI) hat ebenfalls die Strukturierung von Verfahrensakten zum Gegenstand. Auf Basis einer KI-Anwendung soll ein universelles Strukturierungswerkzeug für Justizverfahrensakten entwickelt werden und dabei die Möglichkeit zur umfassenden Aufbereitung sämtlicher Daten aus einem Gerichtsverfahren beinhalten.[21] Die Koordination des Projekts hat das Ministerium der Justiz und für Migration Baden-Württemberg übernommen. Nach Mitteilung des Bundesministeriums der Justiz soll 2024 mit der Erstellung von Grob- und Feinspezifikationen unter breiter Beteiligung der Justizpraxis begonnen werden.[22]
3. Anonymisierung und Erhöhung der Veröffentlichungspraxis
Seit langem wird gefordert, dass mehr Entscheidungen veröffentlicht werden, u. a. um als Material für Verfahren des maschinellen Lernens zur Verfügung zu stehen. Ein Umstand, der die Veröffentlichung erschwert, ist, dass zwar alle Entscheidungen schon seit vielen Jahren bei den Gerichten in digitaler Form vorliegen, diese aber nicht anonymisiert sind. Mittlerweile gibt es eine Reihe von Initiativen, die die Anonymisierung erleichtern sollen. Hier sind das Projekt des Bayerischen Staatsministeriums der Justiz und der Friedrich-Alexander-Universität Erlangen-Nürnberg und das Projekt JANO (für Justiz-Anonymisierung), das von Hessen und Baden-Württemberg zusammen mit IBM gestartet wurde, zu nennen[23] sowie das bayerisch-niedersächsische Anonymisierungs- und Leitsatzerstellungs-Kit zur smarten Veröffentlichung von Gerichtsentscheidungen (ALeKS)[24].
Erkennbar ist insgesamt das Bemühen um eine höhere Veröffentlichungsquote. So ist geplant, in den nächsten drei Jahren mindestens 50.000 Entscheidungen aus der bayerischen Justiz zu anonymisieren und zu veröffentlichen.[25] Auch der Reformkommission „Zivilprozess der Zukunft“ ist die Stärkung der derzeitige Veröffentlichungspraxis, die bei unter fünf Prozent aller Entscheidungen liegt, ein Anliegen:
„Darüber hinaus ist die Veröffentlichung für die Förderung von Innovationen im Legal-Tech-Bereich von zentraler Bedeutung. Die Entwicklung neuer Anwendungen erfordert den Zugang zu möglichst vielen Entscheidungen. Nur große und qualitativ hochwertige Datensätze ermöglichen ein Training von Legal-Tech und KI-gestützten Anwendungen wie Large Language Models (LLM) für Justiz, Anwaltschaft und Wissenschaft. Die Veröffentlichung einer hinreichenden Anzahl von Gerichtsentscheidungen ermöglicht zudem die quantitative Rechtstatsachenforschung.“[26]

Wenig Zeit für Digitalisierung?
Digitalisierungstipps, die Sie weiterbringen, erhalten Sie in unserem monatlichen Legal Tech-Newsletter.
4. Automatisiertes Auslesen von Metadaten
Bereits seit 2019 wird im Projekt SMART/IMJ (kurz für semantische Metadatengewinnung und automatische Textanalyse bzw. Input Modules Justiz[27]) in Bayern und Rheinland-Pfalz getestet, inwieweit mittels Einsatzes von maschinellen Lernverfahren in Zivilverfahren eingehende PDF-Dokumente automatisiert kategorisiert und Metadaten extrahiert werden können.[28] Auch hier kann von einer Verstetigung des Projekts gesprochen werden, da nunmehr eine Ausschreibung dieses der Entlastung der Serviceeinheiten dienenden Analysetools in Vorbereitung ist.[29]
5. Sonstige Einsatzbereiche
Ein weiteres neues Vorhaben zum Einsatz von KI in der Justiz bezieht sich auf juristische Fragestellungen des Handels-, Gesellschafts- und Registerrechts. Projektziel ist „ein digitaler Assistent, der eine automatische Erstellung, Vollziehung und Kontrolle von Handelsregistervorgängen ermöglicht,“ wofür die bayerische Justiz Daten der bayerischen Registergerichte zur Verfügung stellt.[30]
Zudem sind im Bereich des Strafrechts neben den Projekten zur Identifizierung und automatisierten Klassifizierung kinder- und jugendpornographischer Bildinhalte, zur Durchsuchung des Darknets, zur Identifikation auffälliger Finanztransaktionen, zur Extraktion strafzumessungsrelevanter Aspekte aus Strafurteilen sowie zur Videoüberwachung und KI-unterstützten Situationseinschätzung zur Suizidverhinderung in Justizvollzugsanstalten[31] weitere Projekte etabliert worden, wie etwa zum frühzeitigen Aufspüren von Phishing-Domains im Internet.[32]
Von Bedeutung sind weiterhin Projekte zur Verbesserung der Spracherkennung mittels KI-Verfahren, die von der effizienteren Erstellung von Protokollen von Verhandlungen oder Vernehmungen über maschinelle Übersetzung bis hin zur Entwicklung eines Chatbots zur Unterstützung von Rechtsantragsstellen reichen.[33]
Aufbau eines generativen Sprachmodells der Justiz
In einem gemeinsamen Forschungsprojekt von Bayern und Nordrhein-Westfalen sowie der TU München und der Universität zu Köln soll ein generatives Sprachmodell speziell für die Bedürfnisse der Justiz entwickelt werden. Die entsprechende Vereinbarung wurde im Juli 2024 unterzeichnet. In der Pressemitteilung dazu heißt es: „Das Generative Sprachmodell der Justiz (GSJ) könnte beispielsweise dafür eingesetzt werden, neue Text-Bausteine zu formulieren, unstreitige Sachverhalte aus einer Akte herauszufiltern und Schriftsätze aus verschiedenen Akten zu vergleichen. Die Anwendungsfälle werden unmittelbar mit Praktikerinnen und Praktikern in Legal Design-Workshops entwickelt. Die Testphase dauert bis Ende 2026 und wird aus Mitteln der Digitalisierungsinitiative des Bundes für die Justiz finanziert.“[34] Auf die Ergebnisse dieses Projekts darf man gespannt sein.
Fazit und Ausblick
Die Zahl der KI-Projekte in der deutschen Justiz hat zugenommen, so wird mittlerweile an vielen Gerichten mit Verfahren des maschinellen Lernens experimentiert, um v. a. bei Routineaufgaben zu unterstützen (vgl. etwa die entsprechenden Projekte zu den Fluggastverfahren nicht mehr nur in Frankfurt a. M., sondern auch an anderen damit belasteten Gerichten wie dem Amtsgericht Erding). Gleichzeitig ist festzustellen, dass die Projekte, die sich bewährt haben, durch entsprechende Ausschreibungen noch stärker in die Fläche kommen (siehe etwa oben zu FRAUKE oder zu Codefy, das ebenfalls häufig als KI-Projekt bezeichnet wird). Des Weiteren geraten Large Language Models stärker in den Blick. Ihr Einsatz wird u. a. erprobt, um maschinelle Lernverfahren einfacher und weniger domänenspezifisch zu gestalten (z. B. im Projekt MAKI). Darüber hinaus soll ein auf die Justizbedürfnisse speziell zugeschnittenes Sprachmodell entwickelt werden.
Um die verschiedenen Projekte stärker zu vernetzen, soll im Frühjahr 2025 eine KI-Strategie der Justiz vorgestellt werden, die derzeit noch final in Bund-Länder-Gremien abgestimmt wird.[35] Für 2026 ist außerdem eine gemeinsame KI-Plattform geplant, über die Anwendungen länderübergreifend ausgetauscht und eingesetzt werden können.[36]
Derzeit ist es nicht ganz einfach, den jeweiligen Stand der verschiedenen Vorhaben festzustellen. Man hat zudem den Eindruck, dass einige Projekte ineinander übergehen, ohne dass dies besonders kenntlich gemacht wird. Eine wissenschaftliche Begleitung bzw. Evaluierung wäre wünschenswert. Soweit eine solche angekündigt wurde, sind bislang noch keine Ergebnisse publiziert. Zu hoffen ist auch, dass eine gemeinsame KI-Strategie sowie eine entsprechende KI-Plattform zu mehr Transparenz hinsichtlich der verschiedenen Projekte beitragen.
Prof. Dr. jur. Bettina Mielke, M.A. ist Präsidentin des Landgerichts Ingolstadt und lehrt an der Universität Regensburg sowohl im Staatsexamensstudiengang als auch in den Studiengängen LL.M. Legal Tech und LL.B. Digital Law zu den Themen Digitalisierung und Recht, Logik sowie Legal Tech. Aufbauend auf ihrem Zweitstudium der Informationswissenschaft und Germanistik ist sie seit vielen Jahren im Bereich der Rechtsinformatik wissenschaftlich tätig. Sie war und ist zudem an Konzeption und Durchführung der Angebote zu Legal Tech / Digitalisierung und Recht im Referendariat in Bayern beteiligt.