„Künstliche Intelligenz“ ist in aller Munde und es gibt inflationär viele Produkt- und Tool-Ankündigungen. Die Menge an fantastischen und „umwerfenden“ Tools mit Künstlicher Intelligenz („KI“) oder Artifical Intelligence („AI“) erlangt immer neue Höhepunkte und Ausmaße.
Bei vielen der o. g. Produkten geht es um operative Unterstützung des täglichen Arbeiten wie die Einteilung in Produktivitäts-, Schreib- oder Chatbot-Werkzeuge zeigt: Das können beispielsweise Simultanübersetzer, die die Vision des umfassenden „Babelfisches“ als Ohr-Dolmetscher aus Douglas Adams „per Anhalter durch die Galaxis“ realisieren wollen. Andere KI-Funktionen unterstützen die Texterstellung und damit verbunden auch Textanalyse oder automatisches Tagging von Web-Sites.
Darüber hinaus sind auch Tools für Audio- und Video-Inhalte mit beachtlichem Funktionsumfang vorhanden, die auch in ECM-Lösungen integriert werden können.
Für die Unternehmensdokumente in einem ECM-System können diese Hilfsmittel sehr hilfreich sein, um Heinrich von Pierers Siemens-Problem aus den 90er Jahren zu vermeiden, als er meinte „wenn Siemens wüsste, was Siemens weiß“ [1]. Denn die heutigen Werkzeuge könnten das Wissen noch effizienter zur Verfügung stellen, als es die damals ausgelöste Wissensmanagement-Welle konnte.
ECM-Lösungen können diese Tools integrieren und den Anwendern zur Verfügung stellen, manche Anbieter ergreifen die Initiative und bieten ihre ECM-Lösungen mit integrierten KI-Funktionen an, um den Dokumentenbestand direkt den KI-Möglichkeiten nutzbar zu machen.
Welche Möglichkeiten es nun gibt wird auf den folgenden Seiten beschrieben.
Die Begriffe Dokumenten Management und Enterprise Content Management („ECM“) sind nach wie vor weit verbreitet, wenn es um die Verwendung dokumentenzentrierter Funktionen und Prozesse geht.
Die AIIM hat die ECM-Beschreibung vor über 20 Jahren mit einem mittlerweile sehr bekanntem Bild systematisiert, welches das aktuelle Verständnis noch gut abbildet, auch wenn Kontinental-Europa mit dem Begriff „Records Management“ fremdelt und sich dieser Begriff nie wirklich durchgesetzt hat.
Demnach kann der kreisförmig dargestellte Lebenszyklus durch folgende Komponenten unterstützt werden:
Soweit dürfte dieses Bild mit seinen Aufgaben und Komponenten bekannt sein und es soll grundlegendes Verständnis für die folgende Ergänzung mit „Künstlicher Intelligenz“ sein. Dabei werden wir berücksichtigen, dass die nur ein Teil der KI-Tools für die ECM-Nutzung geeignet ist. In erster Linie sind dies Chatbots, Writing- und Produktivitäts-Tools.
Zum besseren Verständnis der KI-Erweiterung soll das AIIM-Modell als Mindmap-Diagramm dargestellt werden, so dass das Modell beim Leser sich in seinem Sinne weiter entwickeln kann. (siehe Kasten rechts).
Wie wirkt sich nun die KI auf das ECM und die Dokumenten Management-Systeme aus?
Ein oft genanntes Anwendungsfeld lautet „Formularerkennung“, „Rechnungserkennung“ und „Inhaltsanalyse bei unstrukturierten Dokumenten“. Diese Aufzählungen betreffen allesamt die Erfassungsfunktion eines ECM und haben sich von regelbasierten Erkennungslösungen über unscharfe Verfahren hin zu „neuronalen“ KI-Lösungen entwickelt. Diese Funktionen sind seit Jahren erfolgreich im produktiven Einsatz.
KI kann aber nicht nur im Capture-Bereich sondern bei allen Komponenten eines Enterprise Content Management (ECM)-Systems gewinnbringend eingesetzt werden, um die Effizienz, Genauigkeit und Automatisierung zu verbessern.
Im Folgenden sollen einige Beispiele für die jeweils oben genannten Hauptkomponenten genannt werden. Weiterhin fassen wir Speichern & Archivieren zusammen und lassen den Baustein Records Management mangels Verwendung außen vor.
Die Kombination von Capture-Produkte mit KI-Funktionen wird mittlerweile als Intelligent Document Processing „IDP“ bezeichnet. Bei der Dokumentenerfassung ist die KI-Unterstützung offensichtlich und es sollen zwei bedeutsame Anwendungsfelder genannt werden:
Als Produktbeispiel können die Erfassungskomponenten der Eingangsrechnungslösungen oder fortgeschrittene Erfassungslösungen angeführt werden.
Beim Speichern und Archivieren wird die KI-Unterstützung etwas „spezieller“ und kann wie folgt genutzt werden:
Automatische Datenorganisierung:
KI kann fachlich dabei helfen, Inhalte effizient zu strukturieren und zu organisieren, indem sie wiederkehrende Muster in Daten identifiziert. So könnten ähnliche Dokumente automatisch miteinander verknüpft oder in entsprechenden Akten Cluster oder Ordnern abgelegt werden.
Datenkomprimierung und -optimierung:
Unter einer speichertechnischen Sicht können KI-gestützte Algorithmen Daten komprimieren und optimieren, um Speicherplatz zu sparen, ohne die Qualität der Inhalte zu beeinträchtigen.
Diese Unterstützung kann dann je nach Inhalt eher Text- oder Bildoptimierte Kompressionsverfahren wählen, so dass hinsichtlich Qualität und Größe eine automatische Optimierung erfolgt.
Als Beispiel für die fachlich geprägte automatische Datenorganisation soll die Dokumenten Management Lösung von EVANA genannt werden. Die Speziallösung für die Immobilienwirtschaft kann Dokumente über die EVANA-KI Dokumente automatisch sortieren, klassifizieren und Inhalte extrahieren. Daraus lassen sich dann verschiedene Sichten bzw. Akten bilden und ESG- und GDRPR-Dokumente werden entsprechend gekennzeichnet. Je nach (konfiguriertem) Regelwerk kann ein dynamischer Datenraum definiert werden.
Dieses Beispiel zeigt wie die „Erkennungs-KI“ um weitere Funktionen ergänzt wird. Perspektivisch werden aus Sicht des Verfassers auch konfigurierbare Regelwerke durch KI-Regelwerke ersetzt werden. Die Daten oder Dokumente können dann rascher und ohne Vorkonfiguration präsentiert werden (Deliver-Funktion).
Der umfassende Kern eines ECM-Systems ist die Verwaltungs- bzw. Managing-Funktion der Dokumente. Je nach Systemausprägung können KI-Funktionen für folgende Verwaltungsfunktionen eingesetzt werden
Beim klassischen Dokumentenmanagement können KI-basierte Automatisierte Inhaltsverknüpfungund erweiterte Suchfunktionen die ARbeiten erleichtern. Beispielhaft sei hier nochmals das Produkt DOXIS der SERGroup genannt, die mit OpenAI out of the box eine konfigurierte Lösung für die Doxis-Plattform angekündigt hat: Prompt Fast Starter sind eine neue Kategorie unserer vordefinierten Templates, die SER Anfang 2025 in Doxis Business Studio bereitstellen wird. Sie enthalten vordefinierte, sofort nutzbare KI-„Prompts" für OpenAI
Die Prozessunterstützung erfolgt bei gut strukturierten mittels Robotic Process Automation („RPA“) und birgt aus Sicht des Autors eher wenig Perspektive, da gut strukturierte Prozesse sei über 30 Jahren schon automatisiert werden und bekannt ist, dass ohne Prozessanalyse und -optimierung eine reine Automatisierung sinnlos ist. Aus Sicht der Verfassers ist dieses Potenzial bereits durch Fachanwendungen, und automatisierte Standard-Workflows etc. ausgeschöpft, hingegen sehen wir sinnvolle Unterstützungsformen bei zwei anderen Prozessthemen:
Die Prozessanalyse und -optimierung wird in der operativen Arbeit bei vielen Anwendern vernachlässigt. Weder Durchlaufzeit-Analysen noch Qualitätschecks werden periodisch durchgeführt, so dass Veränderungen (z. B. Rückgabe von Aufgaben an den Vorgänger wegen Unvollständigkeiten) und schlummernde Optimierungspotenziale nicht erkannt werden. Die KI-Unterstützung könnte Geschäftsprozesse aufgrund der gesammelten Ablaufdaten analysieren, häufige Wiederholungen und Rückverweise wie auch ineffiziente Bereiche identifizieren und Vorschläge zur Verbesserung der Abläufe können daraus abgeleitet werden.
Die ECM-Managing-Funktion Kollaboration kann auch als das „unstrukturierte Ende“ von Workflows bezeichnet werden, und wird deswegen oft gleich gesetzt mit dem Begriff „ad-hoc-Prozess“. Bei diesen Einzelfällen oder teilstrukturierten Tätigkeiten fallen oft zusätzliche manuelle Such-Tätigkeiten an, die ein „KI-Agent“ im Hintergrund erledigen könnte. Ähnlich einer automatischen Ergänzungs-Funktion „Das könnte zu Ihrem Thema passen“ in manchen E-Mail-Systemen, können weitere E-Mails, Dokumente nicht nur dem Sachverhalt hinzugefügt, sondern in einer Zusammenfassung angeboten werden.
Diese Funktion ist bereits jetzt mit den Recherche-Funktionen eines ECMs und den textuellen KI-Funktionen verschiedener Anbieter umsetzbar. Durch die Nutzung der neuen Möglichkeiten werden sich spezielle Anwendungen herauskristallisieren:
Eine solche Anwendung ist der im Juli 2024 angekündigte KI-Assistent F13 von Aleph Alpha, der in der Landesverwaltung von Baden-Württemberg eingesetzt werden soll: Der KI-Assistent soll den Mitarbeiterinnen und Mitarbeitern helfen, größere Textmengen nach relevanten Informationen zu durchsuchen. Eingesetzt werden kann er zum Beispiel bei Anträgen auf Wohngeld und Kfz-Zulassungen [3].
Ähnliche Funktionen wie beim Web Content Management können für das generelle Bereitstellen von Inhalten durch eine KI-Unterstützung gesehen werden
Hierbei gilt es zu beachten, dass ein ECM oft für unternehmensinterne Anwender oder explizit zugelassene externe Partner ausgelegt sind, so dass diese Interaktionen eher in diesem festgelegten Rahmen zum Zuge kommen.
Die o. g. systematische Beschreibung zeigt, dass die KI in allen Aspekten eines ECM-Systems eine bedeutsame Rolle spielen kann, indem sie Dokumenteninhalte automatisch erfasst, organisiert, verwaltet und bereitstellt. Die tägliche Arbeit wird dadurch einfacher und der berücksichtigte Informationsbestand umfangreicher genutzt.
Dadurch können Prozesse effizienter oder transparenter, Fehler reduziert und die Einhaltung von Vorschriften erleichtert werden.
Der Einsatz von KI führt in manchen Fällen zu einer intelligenten Automatisierung, die Unternehmen dabei unterstützt, ihre Dokumenten- und Informationsprozesse besser und aufwandsärmer zu bewältigen.
Bei all diesen fachlichen Beschreibungen darf ein Aspekt nicht übersehen werden:
Die Standard KI-Dienste gibt es meistens nicht „on premise“ zur Installation in der Unternehmens-Infrastruktur, sondern die Daten und Dokumente müssen diesen Diensten zur Verfügung gestellt werden. Damit treten auch Themen wie die Wahrung von Geschäftsgeheimnissen (GeschGehG), die Wahrung des Urheberrechtsschutzes (UrhG) und bei Personenbezug, der Schutz personenbezogener Daten (DSGVO) in den Fokus. Am 01. August 2024 ist zusätzlich die europäische Verordnung über künstliche Intelligenz (KI-Verordnung) in Kraft getreten. Mit ihr sollen die verantwortungsvolle Entwicklung und der Umgang mit KI geregelt werden.
Durch eine „dezentrale Datenspeicherung“, die ausschließlich unternehmensintern genutzt wird, könnten die genannten Anforderungen der verschiedenen Gesetze in Teilen gelöst bzw. entschärft werden. Auch hierzu gibt es mehr als eine Lösungsvariante und es gibt kein „entweder….oder“. Das Lösungsspektrum ist breit und wird durch multivariate Kriterien bestimmt.
Architektur und Datenhaltung - ECM-Dokumente als Basis für Large Language Modells
Das Thema Architektur und Datenhaltung soll deswegen an dieser Stelle nicht weiter erörtert werden, sondern der Fokus bleibt auf der Zusammenarbeit von KI-Funktionen mit ECM-Lösungen. Es soll nur so viel festgestellt werden, dass ECM-Lösungen auf die Integration von Funktionen und Daten von Drittsystemen schon immer ausgelegt sind und grundsätzlich auch Cloud- oder Service-basierte KI-Dienste integrieren können (sollten!).
Weiterhin sei erwähnt, dass manche Unternehmen zur Lösung des Geschäftsgeheimnis- und Datenschutz-Themas nun verfügbare Sprachmodelle (sogenannte Large Language Modell, abgekürzt LLM) in ihrer IT-Umgebung installieren und mit eigenen Daten und Dokumenten befüllen und trainieren. Damit werden die klassischen Manage-Funktion und Speichern/Archivieren-Funktion-unternehmensintern mit LLMs umgesetzt. Diesen LLM-Systemen fehlen jedoch die klassischen ECM-Funktionen für die Dokumentenbearbeitung, Aktenbildung, Prozesssteuerung und strukturierte Metadatennutzung.
Geht man nun diesen Schritt weiter, gelangt man zu komplexen und multimedialen Dokumenten und damit zum Begriff des „Rich Content“. Diesen Begriff schauen wir uns im nächsten Teil des Beitrages genauer an. um dann nochmals die KI-Unterstützungsmöglichkeiten für Rich-Content in ECM-Umgebungen zu überprüfen und beurteilen zu können.