Früher war der Prozess der Dateneingabe langsam, ressourcenintensiv und fehleranfällig.

Ausgabe 11 | 2021

KI erhöht Effizienz bei Datenextraktion signifikant

BLP Digital AG

Obwohl OCR Technologien zu einer starken Steigerung des Automationsgrades bei dokumentbasierten Prozessen führten, entsteht immer noch viel manuelle Arbeit bei der manuellen Nachbearbeitung von Dokumenten. Während die repetitive Abtipparbeit der Dokumentendaten bei Mitarbeiter zu grosser Demotivation führt, entstehen für Unternehmen viele Kosten. Künstlich Intelligenz bietet jedoch die Lösung für dieses Problem und kann sowohl Unternehmen als auch die Menschen dahinter stark entlasten.

Früher wurden sämtliche Dokumente wie Rechnungen von Angestellten in Finanz- und Kreditorenbuchhaltungsabteilungen manuell bearbeitet. Der Prozess der Dateneingabe in die entsprechenden Buchhaltungssysteme war dadurch nicht nur langsam, ressourcenintensiv und fehleranfällig, sondern enorm mühsam für die betroffenen Mitarbeiter. So verbrachten sie Stunden mit demselben repetitiven Umschreiben von Informationen aus Papierrechnungen. Mit dem Aufkommen von OCR (Optical Character Recognition) Technologien, welche auf Regeln und Templates beruhten, konnte dieser Aufwand ein erstes Mal beträchtlich reduziert werden.
Bald stellte sich jedoch heraus, dass vorkonfigurierte Regeln und Vorlagen jedes Mal geändert werden mussten, wenn sich das Dokumentenlayout nur minim veränderte. Folglich entstanden neue damit verbundene Kosten und Prozessineffizienzen.

Existierende Automationslösungen bedürfen viel manueller Nacharbeit
Die Inflexibilität bei sich ändernden Dokumentenstrukturen führt dazu, dass regelbasierte OCR und Template Systeme nur 80 Prozent der relevanten Daten aus Rechnungsdokumenten auslesen können. Dies selbst in der Krankenversicherungsbranche, die aufgrund der enormen Menge an zu bearbeitenden Rechnungsdokumenten einer der am stärksten automatisiertesten Branche ist. Bei einem der grössten Schweizer Krankenversicherer, welcher rund 13 Millionen Arztrechnungen jährlich erhält, müssen so rund 2,5 Millionen Dokumente von Mitarbeitern im Backoffice händisch ins ERP System eingelesen werden. Geht man davon aus, dass ein Mitarbeiter für ein Dokument rund 4 Minuten braucht und pro Stunde CHF 50 brutto verdient, entstehen so rund 8 Millionen an direkten Lohnkosten. Indirekte Kosten durch Prozessineffizienzen und Fehler nicht mit einberechnet.
Es gibt jedoch eine neuere Technologie, die ungleich bisherigen OCR Technologie ein wesentlich höheres Automationspotenzial hat. Genannt wird sie künstliche Intelligenz (KI). KI wird grundsätzlich als Überbegriff für Anwendungen verwendet, bei denen Maschinen menschenähnliche Intelligenzleistungen wie Lernen, Urteilen und Problemlösen erbringen. Aufgrund des hohen Potenzials der Technologie Menschliche Aufgaben zu übernehmen, hat der heutige CEO von Apple, Tim Cook, einmal folgendes Statement gemacht: «KI wird wahrscheinlich das Ende der Welt einleiten, aber bis dahin wird es ein paar tolle Unternehmen geben». Obwohl wir bei BLP Digital nicht ganz diese Meinung teilen und den Standpunkt einer kollaborativen Rolle von KI in der Menschheit vertreten, versuchen auch wir eines dieser Unternehmen zu sein.

Datenextraktion mittels künstlicher Intelligenz
Um dies zu erreichen, kombinieren wir bei der Entwicklung unseren Datenextraktions- und Verarbeitungslösung mehrere KI-basierte Technologien. Im Gegensatz zum Menschen, sind unsere künstlich intelligenten Algorithmen stets fokussiert und motiviert. Dadurch kann nicht nur 98 Prozent Genauigkeit bei der Datenextraktion erreicht werden, sondern Prozesse können auch 20-mal schneller durchlaufen werden, bei gleichzeitig über 80-prozentiger Kostenreduktion. Doch wie genau funktioniert das?
Unser Prozessmodell lässt sich in den Grundzügen sehr einfach beschreiben. Dokumente können in allen gängigen Formaten (zum Beispiel PDF, Scan, Word usw.) in System hochgeladen werden. Dies kann entweder per API, E-Mail-Import, Robotic Process Automation oder Drag-and-Drop geschehen. Die anschliessende Datenextraktion aus den Dokumenten läuft analog der menschlichen Vorgehensweise ab. So werden relevante visuelle Regionen wie das Logo oder Tabellen mittels Bildverarbeitung erkannt. Parallel dazu analysieren Algorithmen der Sprachverarbeitung die dahinerliegenden Informationen und bilden damit die relevanten Key Value Pairs (zum Beispiel Bezeichnung Rechnungsnummer und die tatsächlich dazugehörende Nummer).
Anschliessend validiert die Lösung die vorausgesagten Key Value Pairs mithilfe von internen Crosschecks, vergleicht sie mit dem Wissen von bereits analysierten Dokumenten und führen externe Crosschecks mit dem entsprechende IT-Systems des Unternehmens (zum Beispiel ERP System) durch. Die künstlich intelligente Lösung ist so in der Lage einzuschätzen, wie hoch die Wahrscheinlichkeit ist, den richtigen Wert extrahiert zu haben. Bei Werten, bei denen die Unsicherheit zu hoch ist, wird der menschliche Operator angeleitet, welche Fehler zu korrigieren sind.
Ist in einem Spezialfall eine solche Korrektur notwendig, kann das Modell mit einem minimalen Input (es werden nur zwei Klicks zur Anpassung benötigt) des Nutzers entsprechend trainiert werden. Von den Verbesserungen lernenden die intelligenten Algorithmen umgehend und können dieses Wissen schon auf das nächste Dokument anwenden.
Die ausgeklügelte Technologie fügt sich nahtlos in bestehende Prozesse und Workflows ein und ermöglicht so deren end-to-end Automatisierung. Mit end-to-end ist gemeint, dass nicht nur einfach Daten aus einem Dokument extrahiert werden (wie dies übrigens viele Softwareprovidern mit ihren API-Lösungen tun), sondern die extrahierten Daten werden mit bestehenden Datenbankeinträgen abgeglichen. Ein Beispiel dafür ist die Lieferscheinkontrolle. Dort entsteht durch eine Automationslösung nur dann einen Mehrwert, wenn die extrahierten Lieferscheindaten mit den Bestelldaten im ERP System abgeglichen werden. Durch diesen Abgleich werden Über-, Unter- oder Falschlieferungen entdeckt, womit sämtliche manuelle Datenerfassungs- und vergleichsarbeit des Logistikmitarbeiters entfällt. Da dadurch der Fokus auf die eigentlichen Tätigkeiten gelegt werden kann, erhöht sich die Produktivität signifikant.
Bei Beendigung des Prozesses, welche durch eine Bestätigung des involvierten Mitarbeiters geschieht, werden die Daten via offene Schnittstellen ins Unternehmenssystem zurückgeschrieben.

End-to-end Technologie ist die Zukunft
Das Dokumentenvolumen nimmt zu und Unternehmen erhalten immer mehr Dokumente von unterschiedlichen Lieferanten und Kunden. Erschwerend kommt hinzu, dass Mitarbeiter tendenziell teurer werden und sich immer weniger für das Copy-Pasting von Informationen begeistern lassen. Gerade in dieser schwierigen Zeit, welche zu hohem Spardruck in allen Volkswirtschaften geführt hat, kann sich eigentlich kein Unternehmen mehr die händische Administration von Dokumenten leisten.
Die Zukunft liegt also in der KI-gestützten Datenextraktion- und verarbeitung von Dokumenten. Mit der einfach implementierbaren Technologie von BLP Digital, lassen sich ihre dokumentenbasierten Prozesse innert kürzester Zeit digitalisieren, was bereits kurzfristig zu enormen Produktivitätssteigerungen und Kosteneinsparungen führt.

INFOS | KONTAKT
BLP Digital AG
Technoparkstrasse 1
CH-8005 Zürich
T +41 (0)75 413 19 21
www.blp-digital.com
info@blp-digital.com

April

HANNOVER MESSE, Hannover

Weltleitmesse der Industrie mit dem Leitthema «Energizing a Sustainable Industry»
22. bis 26. April
www.hannovermesse.de

Intertool, Wels

Österreichs Fachmesse für Fertigungstechnik
23. bis 26. April
www.intertool.at

Schweissen, Wels

Österreichs Fachmesse für Füge-, Trenn- und Beschichtungstechnik
23. bis 26. April
www.schweissen.at

Mai

KUTENO, Rheda-Wiedenbrück

Kunststofftechnik Nord
14. bis 16. Mai
www.kuteno.de

Optatec, Frankfurt

Internationale Fachmesse für optische Technologien, Komponenten und Systeme
14. bis 16. Mai
www.optatec-messe.de