Digitales Diktat, oder lieber doch gleich Spracherkennung?

Von Simon Reuvekamp

Das Verfahren, Text zu Papier zu bringen, hat sich seit Jahrhunderten grundsätzlich nicht geändert. Entweder man schreibt selbst oder man lässt schreiben. Wer es sich leisten kann, nutzt in der Regel die Zeit anderer Personen, die die eigene Sprache in Text umwandeln. Das Diktat war geboren. Warum sollen wir also heute digitale Diktat-Systeme nutzen? Unser Autor Simon Reuvekamp über die Vorteile, Chancen und Herausforderungen der noch jungen Technologie.

„Digitales Diktat, echt jetzt? Das ist doch ein alter Hut!“ Das war mein erster Gedanke, als ich gebeten wurde, einen Artikel zu diesem Thema zu verfassen. Bei näherer Betrachtung wurde mir jedoch klar, dass dies von (m)einer Definition von digitalem Diktat herrühren mag.

Was genau ist digitales Diktieren?

Digitales Diktat ist für mich nichts anderes als die digitale Aufnahme von analog gesprochenen Worten. Damit unterscheidet sich ein digitales Diktat nicht wesentlich von der analogen Aufzeichnung auf Bändern oder sogar Wachsplatten. Die digitale Variante kann lediglich mit ein paar Komfortfunktionen, wie dem Einfügen von zusätzlichem Text an einer bestimmten Stelle, dienen. Verständlich also, wenn oftmals diese wenigen Vorteile die Anwenderinnen und Anwender analoger Diktiergeräte nicht zu einem Wechsel verleiten können.

Wann ist digitales Diktat ein echter Vorteil?

Die Vorteile einer digitalen Bearbeitung sind immer die Gleichen, so auch beim digitalen Diktat:  manuelle Prozesse beschleunigen oder sogar ersetzen. Bezogen auf das Diktat sind dies ganz konkret:

  • Weniger Platz für die Lagerung von Datenträgern
  • Schnellerer Transport
  • Verbesserung interner Workflows
  • Smartphone-Einsatz

Dank der rasanten Entwicklung von Speichermedien und Kompressionsverfahren ist die Speicherung von 700 Minuten in einem Diktiergerät mit nur 4 GB RAM möglich. Dies entspricht 1.400 Steno-Kassetten.

Nun kaufen Sie bitte nicht für jedes Diktat einen Speicherchip und legen diesen auf die Akte, damit die Rechtsanwaltsfachangestellte, beide abholen kann. Investieren Sie in ein System, das die Diktate elektronisch in Ihrem Netzwerk an das Personal weiterleitet, also Ihren Workflow beschleunigt. Hier gibt es ausreichend Auswahl im Markt, die teilweise auch mit der eventuell im Einsatz befindlichen Kanzleisoftware harmoniert. Wer einfach nur sein bisheriges analoges Diktiergerät gegen ein digitales Gerät austauschen möchte, könnte beim Hersteller des Vertrauens nach einer digitalen Variante fragen. Die meisten Hersteller haben dann auch ein kleines – meist sehr günstiges – Softwareprodukt im Angebot, das den Workflow unterstützt. Weil die Geräte der jeweiligen Hersteller meist in der Handhabung vergleichbar sind, fällt der Wechsel dann besonders leicht. Wer eine Kanzleisoftware einsetzt, sollte mit dessen Hersteller Kontakt aufnehmen und nach kompatiblen Produkten fragen.

Egal für welches System Sie sich entscheiden, der Workflow bei digitalen Diktaten geht nahezu automatisch damit einher, dass Diktate über das Internet weltweit binnen Sekunden mit jedem ausgetauscht werden können, auch wenn Sie zur Not die Diktate einfach (hoffentlich verschlüsselt) via E-Mail versenden. Für die Nutzer von Smartphones ist von Vorteil, dass eine Diktier-App auf dem Handy das spezielle Diktiergerät ersetzen kann, wenn Sie auf die für Handys exotischen Schiebeschalter verzichten wollen.

Nur Diktieren – oder geht da noch mehr?

Für jemanden, der ständig mobil diktieren möchte, sind dies schon genügend Gründe für das digitale Diktat. Und doch lösen alle diese Vorteile nicht das eigentliche Problem bzw. den eigentlichen Zeitfresser beim Diktat. Wie zu Kaisers Zeiten werden die Diktate dann dennoch in einem manuellen Vorgang abgeschrieben, denn Spracherkennung im „professionellen Umfeld“ ist noch lange keine Selbstverständlichkeit. Zwar nutzen mittlerweile Millionen von Menschen in Deutschland Spracherkennung. Der überwiegende Teil jedoch nur zur Versendung kurzer Nachrichten oder zur Bestellung von Produkten via Amazon Alexa. Die echten Potenziale der Technologie werden selten genutzt.

Stolpersteine: Warum nutzen so wenige Juristinnen und Juristen Spracherkennung?

Auch wenn SPRACHERKENNUNG in den Büros keine Seltenheit mehr ist, eine Selbstverständlichkeit ist sie deshalb aber noch lange nicht. Dafür gibt es diverse Gründe. Hier die in meinen Augen wichtigsten:

  • Vorurteil: Spracherkennung funktioniert nicht
  • Keine Geduld
  • Falsche Bedienung Diktant
  • Falsches Produkt
  • Falsche Bedienung Sekretariat
  • Spracherkennung kann nicht interpretieren

Potenzielle Fallen beim Einsatz einer Spracherkennung

Oft begründen sich die Vorurteile in Aussagen von Kolleginnen und Kollegen, die „das mal ausprobiert haben und es nicht mehr nutzen“. Die Wenigsten haben tatsächlich selbst in den letzten Jahren einer aktuellen Spracherkennung eine echte Chance gegeben. Denn Spracherkennung ist ein Lernprozess, den viele Juristinnen und Juristen einfach nicht konsequent gehen, weil die Spracherkennung in ihren ganz persönlichen Schaffensprozess eingreift und sie dazu zwingt, sich mit dem System zu beschäftigen. Und wenn das dann nicht von Beginn an funktioniert, landet es schnell in der Ecke. Für die Einführung einer Spracherkennung müssen Sie sich wirklich Zeit nehmen. Wenn Sie sich mit den Funktionen und Einschränkungen vertraut machen und diese beachten, werden Sie ein Werkzeug haben, das die versprochenen Leistungen erfüllt.

Wenn „keine Zeit“ da ist, sich mit dem System wirklich intensiv zu beschäftigen, werden Fehler gemacht. Diese führen zu Fehlern in der Anwendung, keiner Verbesserung der Erkennung oder sogar verlorenen Diktaten. Frust und ablehnende Haltung ist dann nur menschlich.

Manchmal ist es aber auch nur die Entscheidung für das falsche Produkt. Spracherkennung allein reicht nicht aus. Sie muss zum Anwender passen. Das fängt beim Wortschatz an und hört bei der Auswahl der richtigen Diktiergeräte auf. Wenn Sie beispielsweise das Diktiergerät nicht in der Hand halten möchten, könnte ein Headset die richtige Entscheidung sein, um die notwendige Qualität der Aufzeichnung zu erreichen.

Spracherkennung steht und fällt mit dem richtigen Fachwortschatz

Der Wortschatz oder besser Kontext ist vor allem für die Erkennungsrate von Wörtern verantwortlich. Wenn Sie sich als Juristin oder Jurist für einen Kontext entscheiden, der wichtige Fachbegriffe nicht beinhaltet, werden Sie oder Ihr Personal dafür die Quittung in der Korrektur erhalten, denn Sie müssen dem System in langwieriger Kleinstarbeit diese Begriffe beibringen. Nicht nur die Begriffe, sondern vor allem den Kontext, in dem die Wörter stehen, sind entscheidend. Spracherkennung arbeitet heute nämlich nicht mehr als Worterkennung. Die Erkennung kontinuierlicher Sprache basiert auf den Wahrscheinlichkeiten, in denen diese Worte in allen möglichen Kombinationen vorkommen können. Die Erforschung dieses Kontextes ist auch der Grund, warum die „Big Player“ am Markt – Apple (Siri) Amazon (Alexa) und Google – ihre  „Wanzen“ in Haus und Hosentaschen platzieren möchten. So werden „Kontexte“ aus aller Welt gesammelt, mit denen die Spracherkennung und die damit verbundenen Assistenzsysteme gefüttert werden. Wie wir ja mittlerweile alle wissen, werden diese Audiodateien von Menschen interpretiert, wenn hier die automatische Analyse nicht ausreicht.

Spracherkennung ist nur so gut wie ihr/e NutzerIn

Damit sind wir auch beim nächsten potenziellen Problem von Spracherkennung in Ihrer Kanzlei. Das System lernt durch die Korrektur – nicht durch die Anwendung. Wenn Sie ein wirklich gutes System haben, dann lernt die Spracherkennung auch dann, wenn die Korrektur der Diktate durch andere Personen erfolgt. Bei der Korrektur kann die Korrekturkraft das Diktat hören und Fehler korrigieren. Oft werden jedoch auch hier Fehler gemacht, die dann dazu führen, dass das System nicht – oder sogar noch schlimmer – falsch lernt.

Spracherkennung funktioniert heute noch nicht wie in Science Fiction-Filmen. Die Sprachkennung setzt das um, was sie versteht. Sie kann Aufgaben oder unverständliche Worte nicht interpretieren. Sie ist eine Spracherkennung. Trennen Sie daher Arbeitsaufgaben vom Diktat. Wenn Sie Ihrer Servicekraft eine Aufgabe während des Diktates geben möchten, die nicht als Text im Diktat geschrieben werden soll, dann hat dies nichts im Diktat selber zu suchen. Es gibt Systeme, die Diktat und Arbeitsanweisungen gemeinsam aufzeichnen und getrennt abwickeln lassen. Hier genügt dann nur ein Klick, um dem System den Unterschied anzuzeigen.

So verbessern Sie nicht nur die Erkennungsleistung, sondern vermeiden auch peinliche Fehler, die dann entstehen, wenn die interne Arbeitsanweisung den Weg ins Endprodukt und damit zum Empfänger findet. Sprechen Sie bitte verständlich. Damit meine ich nicht Ihren eventuellen Dialekt, denn selbst den kann eine Spracherkennung  „erlernen“  bzw. adaptieren. Wenn Sie aber so schnell oder undeutlich diktieren, dass selbst Ihr erfahrenes Sekretariat die Abspielgeschwindigkeit reduzieren oder sogar raten muss, was Sie gemeint haben könnten, dann wird eine Spracherkennung keine zufriedenstellenden Ergebnisse liefern.

Erlauben Sie mir zum Schluss noch eine Warnung: Vor allem Smartphones gaukeln Ihnen heutzutage eine Spracherkennung auf dem Gerät vor. Falls Sie dies glauben sollten, dann wäre das für Sie als Juristin oder Jurist jedoch ein ganz gefährlicher Irrtum. Ihnen muss bei nahezu allen Apps bewusst sein, dass Ihre Diktate direkt auf den Servern der Hersteller landen – unter dem Aspekt des Ihnen auferlegten Datenschutzes ein strafrechtliches Problem! Sollten Sie sich für eine sichere Lösung interessieren, greifen Sie auf Programme oder Dienstleister zurück, die individuelle Wortschätze und exklusive Systeme unterstützen. Kostenfrei sind diese dann natürlich nicht. Dafür wird aber auch das Geld nicht mit Ihren Daten verdient.

Fazit: Wer Spracherkennung richtig nutzt, wird nicht mehr auf sie verzichten wollen

Die Vorteile einer gut eingeführten Spracherkennung sind überzeugend. Ich kenne diverse Kanzleien, die auf den Einsatz einer Spracherkennung heute nicht mehr verzichten wollen oder könnten. Auch das Alter der Diktanten spielt dabei keine entscheidende Rolle. Erst vor wenigen Tagen habe ich mit einem Anwalt, Jahrgang 1960, gesprochen, der mir begeistert von seinen Erfahrungen mit Spracherkennung berichtet hat. Wenn Sie sich an die Regeln, die Ihnen heute eine Spracherkennung noch auferlegt, halten, werden Sie erstaunt sein, welche Vorteile diese Systeme heute schon bieten.

Weitere Beiträge

Simon Reuvekamp ist CTO bei Meyer-Köring mit Sitz in Bonn und Berlin. Seit 1990 berät er als Spezialist für Kanzleisoftware und Diktiersysteme Rechtsanwaltskanzleien. Seit 2019 leitet er die IT-Abteilung der Kanzlei mit 90 Mitarbeiter:innen. Die Kanzlei setzt einen eindeutigen Fokus auf den Einsatz von IT. Hierzu zählen diverse Produkte von der klassischen Kanzleisoftware bis hin zu RPA-Anwendungen zur Prozessautomatisierung.

Nach oben scrollen

Immer up-to-date in Sachen Legal Tech
mit dem Legal Tech-Newsletter!

Abonnieren Sie jetzt unseren
Newsletter und erhalten Sie
alle Magazinausgaben und
die neusten Beiträge des Blogs direkt in Ihr Postfach: