Texterkennung 4.0 mit OCR

Text-erkennung 4.0 mit OCR

Texterkennung 4.0 – Herausforderungen & Chancen von OCR für die Prozessautomatisierung

OCR (Optical Character Recognition) hat in der Geschäftswelt lange eine untergeordnete Rolle gespielt. Erst der Siegeszug der Digitalisierung und Prozessautomatisierung rückt OCR vermehrt in das Blickfeld vieler Unternehmen. Seit 2018 wächst die Branche jährlich um bis zu 20%. Alles zu den Herausforderungen & Chancen von OCR für RPA findest du in diesem Artikel.

Was ist OCR?

Noch lange bevor Automatisierung zu einem Top-Thema geworden ist, gab es bereits OCR-Software. OCR steht für Optical Character Recognition und beschreibt elektronische Systeme, die Texte in Bildern und Scans erkennen können.

Das erste OCR-System ist laut Historiker Herbert Schantz bereits 100 Jahre alt:

Im Zuge des 1. Weltkriegs entwickelte Emanuel Goldberg eine Maschine, die geschriebenen Text in telegrafischen Code umwandeln konnte.
Diese Maschine war so erfolgreich, dass Goldberg sie anschließend zur ersten Business-Lösung weiterentwickelte. Unternehmen archivierten Daten damals noch auf Mikrofilm, die das Sichten des Archivs extrem aufwendig machte. Goldberg baute eine Maschine, die automatisch Mikrofilme nach bestimmten Zeichenfolgen durchsucht.
OCR war allerdings lange durch Schriftarten limitiert. Für jede Schriftart musste das OCR-Tool zunächst mit entsprechenden Bildern trainiert werden. Erst in den 1970ern wurde ein OCR-Tool entwickelt, dass fast alle Schriftarten erkennen konnte.
Mit der Durchsetzung des Heimcomputers kamen in den 2000ern dann die ersten OCR-Tools für den PC. Mit ihnen können Anwender beispielsweise Texte scannen und anschließend lesbare PDF-Dateien daraus machen.

Datentypen und OCR

OCR wurde ursprünglich für die Verarbeitung strukturierter Daten entwickelt. In modernen Unternehmen sind andere Datentypen allerdings mindestens genauso häufig vertreten:

Strukturierte Daten

Semistrukturierte Daten

Unstrukturierte Daten

Strukturierte Daten

Semistrukturierte Daten

Unstrukturierte Daten

Wie können semi- und unstrukturierte Daten verarbeitet werden?

Semi- und unstrukturierte Daten aus Rechnungen, Bewerbungsunterlagen, Ausweisdokumente und E-Mails zu erfassen, setzt eine intelligente Lösung voraus, die sowohl mit verschiedenen Datentypen als auch mit verschiedenen Formaten zurechtkommt.

Einen wesentlichen Fortschritt in der Weiterentwicklung der OCR-Technologie markierte die vorlagenbasierte OCR-Technologie. Anhand einer Vorlage extrahiert das OCR-Programm, die gewünschten Information an der gewünschten Stelle im Dokument. Vorlagen-basierte OCR-Software beinhaltet damit bereits einen Schritt zur Automatisierung der Datenverarbeitung: Kein Mitarbeiter muss die wesentlichen Informationen aus dem Dokument filtern. Stattdessen gibt die Software von Anfang an nur die richtigen Daten aus.

Moderne OCR Tools gehen weiter, in dem Sie die elektronische Texterkennung mit KI-Technologien verbinden. Intelligente OCR-Technologie setzt auf Machine Learning-Algorithmen und arbeitet nach diesem Schema:

Digitalisierung und Klassifizierung des Dokuments anhand von OCR und z.B. Keyword-Klassifikation
Extraktion und Validierung der Datenpunkte aus dem Dokument mithilfe von spezifisch trainierter KI
Verifikation der ausgelesenen Inhalte eines menschlichen Mitarbeiters
Weiterverarbeitung der extrahierten Datenpunkte in Zielsysteme
Zudem wird anhand der validierten und erfolgreich ausgelesenen Dokumente die KI trainiert, um in Zukunft noch zielsicherer zu sein.

Eine intelligente OCR-Lösung lässt sich damit sowohl für strukturierte, semistrukturierte und unstrukturierte Daten nutzen und bietet eine Reihe von Vorteilen:

Automatische Erkennung von Dokumenten-Mustern und anlernen dieser Muster für die zukünftige automatisierte Datenextraktion von semistrukturierten Dokumenten wie Rechnungen oder Auftragsbestätigungen
Bessere Erkennung von Zeichenfolgen und dadurch Vermeidung von Fehlern zum Beispiel bei Datumsangaben
Machine Learning zum selbstständigen Anlernen von spezifischen Dokumententypen
NLP zur Erkennung von relevanten Datenpunkten in unstrukturierten Dokumenten
Frei gestaltbaren oder vorgegebenen Form-Templates anhand derer Datenpunkte aus strukturierten Dokumenten gezielt extrahiert werden können (Beispiel: Personalausweis, Krankheitsattest)

Drei Anwendungsfälle für OCR & RPA im Unternehmen

Mit den Fortschritten auf dem Gebiet des Machine Learning und der Spracherkennung können OCR und RPA ihre Stärken voll ausspielen und ermöglichen Hyperautomatisierung: die Automatisierung komplexer End-to-End-Prozesse. Microsoft Power Automate, ABBYY und UiPath verfügen als Automatisierungsplattformen beispielsweise über moderne OCR-Software, die auch semistrukturierte und unstrukturierte Daten erkennen und komplexe Workflows abbilden können.

Durch den Einzug von Machine-Learning-Technologien in OCR-Software und RPA ergeben sich so vielfältige neue Anwendungsfälle für alle Unternehmen.

KYC-Prozesse (Know Your Customer)

Archivierung von Geschäftsdaten

Recruiting

KYC-Prozesse (Know Your Customer)

Archivierung von Geschäftsdaten

Recruiting

Fazit: OCR & RPA

OCR-Technologie führte lange ein Nischendasein innerhalb der Geschäftswelt. Aber die Integration von Machine Learning in die OCR-Technologie zeigt, wie groß das Potenzial der Technologie für die Prozessautomatisierung ist. Analysten rechnen in den nächsten 8 Jahren mit zweistelligen Wachstumsraten und damit einer Verdopplung des OCR-Markts. Unternehmen können bereits heute profitieren. RPA-Suiten wie Microsoft Power Automate oder UiPath bieten über eine leistungsfähige OCR-Lösung in Kombination mit künstlicher Intelligenz, mit denen sich einfach und effektiv erste Workflows automatisieren lassen.

Du willst mehr von uns lesen?

Abonniere unseren monatlichen Newsletter

Texterkennung 4.0 mit OCR