Was ist OCR Texterkennung und welche Rolle kann sie für kleine Unternehmen spielen?

Veröffentlicht am 21.8.2019 von Abhishek Singh und Ines Bahr

Artikel teilen

Robotor macht OCR Texterkennung

Zuallererst: „OCR“ steht für Optical Character Recognition (Deutsch etwa: optische Zeichenerkennung, gebräuchlicher ist „Texterkennung“ – „OCR Texterkennung“ ist also strenggenommen doppelt gemoppelt) und ist ein Verfahren, mit dem in Bildformaten vorliegende Daten in maschinenlesbare Texte umgewandelt werden können. Klingt kompliziert, ist es aber mindestens in der Handhabung eigentlich gar nicht: Als User*in lege ich zum Beispiel einen Brief auf den Scanner. Der Scanner übermittelt Bildinformationen an meinen Computer und das darauf hoffentlich installierte OCR-Programm wandelt diese in Schrift um. Damit kann ich meine Texte etwa bei einer Dokumentensuche finden, auch wenn das Schlagwort, nach dem ich gesucht habe, nicht im Dokumententitel enthalten ist. Praktische Sache.

Soweit ist das natürlich in den meisten IT-Abteilungen und Unternehmen bekannt. Aber was kann man damit eigentlich noch alles anstellen?

Bevor wir uns das näher anschauen, muss ich noch ein paar Worte zur Technologie selbst verlieren. Dazu, was sie ist, aber auch dazu, was sie nicht ist. Das Wichtigste an dieser Stelle: „OCR“ ist im Grunde kein Softwaretyp, sondern eine Technologie. Das hat ein paar durchaus relevante Folgen für Anwender*innen, denn auch wenn es „reine“ OCR-Software gibt, so ist OCR auch ein häufiger Teil von komplexeren Systemen. Das wiederum führt dazu, dass der Leistungsumfang – und damit die denkbaren Anwendungsfälle – sich unter Umständen deutlich unterscheiden.

Einen weiteren Haken hat die Sache: In der eingangs beschriebenen Form funktioniert das leider nur mit maschinengeschriebenen Texten und auch da letzten Endes hauptsächlich mit Fließtexten und einfacheren Strukturierungselementen. Neben der „OCR“ gibt es außerdem eine artverwandte Technologie, die sich „ICR“ nennt, was seinerseits für „Intelligent Character Recognition“ steht. Die beruht auf der gleichen Art von Mustererkennung, ist aber um gewisse intelligente Elemente sowie zusätzliche Datenbanken erweitert und zum Beispiel trainierbar. Damit lassen sich dann gegebenenfalls auch mal handschriftliche Elemente erkennen, aber nur unter sehr bestimmten Voraussetzungen wie etwa bei der Briefsortierung, wo die Software genau weiß, dass es sich dort, wo die Postleitzahl zu stehen hat, nur um Ziffern handeln kann, wenn die Empfängeradresse in Deutschland ist und dass eine amerikanische 1 ohne Aufstrich einfach kein großes i sein kann. Eine Erkennung von handgeschriebenen Fließtexten ist gewissermaßen im Labor und mit stundenlangem Training der Algorithmen in der Erkennung der Handschrift einer ganz bestimmten Person zu erreichen, das Ganze lässt sich aber noch nicht recht wirtschaftlich anwenden und bleibt hier deshalb außen vor.

Wo kann OCR gewinnbringend eingesetzt werden?

Butter bei die Fische: Sinnvoll eingesetzt werden kann Texterkennung überall da, wo sonst eine händische Datenerfassung erforderlich wäre. Paradebeispiele sind die Archivierung, Rechnungserfassung und Layouterfassung. Auch für blinde Mitarbeiter*innen ist sie ein wertvolles Hilfsmittel und für alle, die eine Papiervorlage digital bearbeiten wollen. Des Weiteren nutzt Formularerkennungs- und -ausfüllsoftware mindestens OCR oder ICR. In diesem Text wollen wir uns insbesondere mit den Vorteilen für die Buchhaltung und die Archivierung befassen, weil diese Bereiche für jede Firma von grundlegender Bedeutung sind.

Buchhaltung

Die Kreditorenbuchhaltung, also die Verwaltung eingehender Rechnungen, ist ein wichtiger Teil der buchhalterischen Aufgaben eines jeden Unternehmens.

Dennoch ist die Umstellung auf eine automatisierte Rechnungsverarbeitung und die dazugehörende Buchhaltungssoftware besonders für kleine Unternehmen eine große Herausforderung.
Hierfür gibt es mehrere Gründe, zum Beispiel:

  • Unzureichende IT-Kenntnisse oder zu wenig entsprechendes Personal
  • Mangelndes Bewusstsein für die Anwendungsmöglichkeiten

Im Ergebnis nutzen nur 14,7 % der Unternehmen ausschließlich elektronische Rechnungen. Und das ist B2B. Die hohe Prävalenz von Papierrechnungen verlängert nicht nur die Bearbeitungsdauer enorm, sondern sie führt auch dazu, dass der Faktor Mensch vermeidbare Fehler produziert, zum Beispiel bei der händischen Eingabe von Rechnungsdaten.

Vertippt man sich und schreibt 12.000 statt 21.000, sind ganz schnell 10.000 Euro futsch – das reißt schlimmstenfalls ein hübsches Loch in die Bilanz.

Ein höherer Automatisierungsgrad kann gerade in kleineren Unternehmen segensreich wirken. Und da sind wir wieder bei der OCR, die für eingehende Rechnungen hier große Dienste erweisen kann.

Kleine Unternehmen, die ihre Kreditorenbuchhaltung nicht digitalisieren, haben durch die manuelle Datenerfassung gleichzeitig höhere Personalkosten, eine niedrigere Kundenzufriedenheit und durch die daraus folgenden Unregelmäßigkeiten häufiger Probleme mit dem Finanzamt.

 

Beispiel: So funktioniert die automatisierte Verarbeitung von Papierrechnungen

Abbildung zu OCR Scanner Prozess

Archivierung

Jedes Unternehmen, und sei es noch so klein, muss bestimmte Unterlagen archivieren, für einige gibt es gesetzliche Aufbewahrungsfristen. Angesichts der bereits erwähnten Tatsache, dass diese Unterlagen teils digital, teils auf Papier vorliegen, ist es gar nicht so einfach, ein einheitliches Archiv zu erstellen. Natürlich könnte man alles ausdrucken und auf altbewährte Art im Aktenschrank unterbringen, aber mal ehrlich: Wer hat soviel Platz? Von den Umweltfolgen in Zeiten der Klimakrise ganz zu schweigen.

Es empfiehlt sich also, den umgekehrten Weg zu gehen: Papierunterlagen zu digitalisieren und dann elektronisch zu speichern. Dabei ist eine OCR von großer Hilfe, so kann man sich die mühsame, händische Indexierung und damit einhergehende Verschlagwortung sparen. Nicht nur ist eine Volltextsuche möglich, wenn der Text erkannt ist, insbesondere ICR-basierte Dokumentenmanagementsysteme können die Verschlagwortung sogar automatisch vornehmen.

OCR-Scanner und KI: Eine tolle Verbindung

Wie für vieles andere auch war die Einbeziehung künstlicher Intelligenz (KI) ein Quantensprung für die Texterkennung. Maschinenlernen und neuronale Netzwerke bieten neue Wege, um die Erkennungsgenauigkeit deutlich zu verbessern und Fehler zu minimieren.

Was heißt das für kleinere Unternehmen im Einzelnen?

KI und maschinelles Sehen ermöglichen eine Musteranalyse, die wiederum dabei hilft, wichtige Unterlagen schneller und mit höherer Genauigkeit zu verarbeiten.

So lernt die Software dazu und die Erkennungsgenauigkeit verbessert sich nach und nach immer weiter.

Hauptvorteile der OCR in der Rechnungsbearbeitung

Die grundlegenden Vorteile liegen vor allem in der erheblichen Kostenersparnis durch die Vermeidung von menschgemachten Fehlern.

Gleichzeitig haben Mitarbeiter*innen mehr Zeit für andere Aufgaben wie die Debitorenbuchhaltung und damit die Liquidität des Unternehmens, repetitive Aufgaben wie die Dateneingabe können automatisiert werden.

 

Weitere Vorteile sind:

  • Verbesserter Workflow im Dokumentenmanagement. Die Daten werden zentralisiert digital abgelegt, was den Zugriff aller betreffenden Kolleg*innen erleichtert, ganz gleich, an welchem Standort sie arbeiten.
  • Verbesserte Zusammenarbeit und Verfügbarkeit digitaler Rechnungenals PDF oder in anderen Dateiformaten.
  • Verbesserte Produktivität in der Kreditorenbuchhaltung durch die Vermeidung von Fehlern bei der händischen Dateneingabe.

 

Hauptvorteile der OCR in der Archivierung

Ein weiterer wichtiger Anwendungsbereich für OCR- wie ICR-Technologien ist die Archivierung. Viele Unternehmen erhalten noch erstaunliche viele wichtige Unterlagen ausschließlich auf Papier, man denke an die Aktenberge, die in einer durchschnittlichen Anwaltskanzlei täglich hin- und hergetragen werden. Auch hier wird wertvolle Arbeitszeit frei, wenn der Automatisierungsgrad steigt, weil repetitive, zeitaufwändige Aufgaben wegfallen. Diese Zeit kann wiederum gewinnbringend verwendet werden und wieder geht diese Kostenersparnis mit einer Minimierung des menschlichen Fehlerpotenzials einher.

 

Weitere Vorteile sind:

  • Verbesserter Workflow im Dokumentenmanagement. Die Daten werden zentralisiert digital abgelegt, was den Zugriff aller betreffenden Kolleg*innen erleichtert, ganz gleich, an welchem Standort sie arbeiten.
  • Verbesserte Produktivität in der Ablage durch die Vermeidung von Fehlern bei der händischen Dateneingabe und Bearbeitung.
  • Zusammenführung aller Dokumente, unabhängig vom Eingangsformat, an einem zentralen Speicherplatz.
  • Vereinfachte Auffindbarkeit durch Schlagwortsuche. Durch die Umwandlung in durchsuchbare Dokumente lassen sich bestimmte Informationen auch dann gut auffinden, wenn man den betreffenden Dateinamen gerade nicht zur Hand hat.

4 Fragen, die du dir vor der Anschaffung stellen solltest

1. Wofür soll die Software eingesetzt werden?

Wer nur Rechnungen mit einer Software bearbeiten will, tut gut daran, in eine Buchhaltungssoftware mit integrierter OCR-Funktionalität zu investieren. Diese bietet üblicherweise einen optimierten Workflow und ist mit zusätzlichen Möglichkeiten ausgestattet, zum Beispiel einer automatischen Kontoüberwachung. Ähnliches gilt für Leute, die ihre OCR ausschließlich für die Archivierung nutzen wollen, weil meist gleich eine Anbindung an die Datenbank und eine automatische Verschlagwortung enthalten sind.

2. Wie hoch ist das zu erwartende Dokumentenaufkommen?

Manche Software ist für die Verarbeitung großer Datenmengen besser geeignet als andere, Stapelverarbeitungsfunktionen zum Beispiel kosten unter Umständen etwas mehr in der Anschaffung, die damit einhergehende höhere Automatisierung macht sich aber über kurz oder lang gegebenenfalls mehr als bezahlt.

3. Welche Sprachen sollen erkannt werden?

OCR-Software ist da ein bisschen wie ein Mensch: Sie kann nicht unbedingt alle Sprachen. Achte also darauf, dass die von dir gewählte Software auch tatsächlich die Eingabesprachen unterstützt, die für dein Unternehmen wichtig sind.

 

4. Welche Integrationen sind gegebenenfalls sinnvoll?

Manche Lösungen bieten Integrationen mit anderen Programmen oder Systemen wie ERP-Systemen. Es ist sinnvoll, hier rechtzeitig zu überlegen, welche Integrationen hilfreich sein können und auf welche man getrost verzichten kann. Gerade für auf weiteres Wachstum ausgelegte Unternehmen empfiehlt es sich hier und bei den Sprachen besonders, gegebenenfalls zukünftige Entwicklungen vorwegzunehmen.

 

Nächste Schritte und weitere Ressourcen

Vor einer Neuanschaffung stehen diese 3 Schritte auf dem Programm:

3 Schritte zur Anschaffung von OCR Texterkennung

Für die Auswahl geeigneter Software kannst du unsere Listen nutzen, Schlagwortsuche inklusive:

Artikel teilen


Dieser Artikel kann auf Produkte, Programme oder Dienstleistungen verweisen, die in deiner Region nicht verfügbar sind oder die durch die Gesetze oder Vorschriften des Landes eingeschränkt sein können. Wir empfehlen, sich direkt an den Softwareanbieter zu wenden, um Informationen über die Produktverfügbarkeit und Rechtskonformität zu erhalten.