![]() ![]() |
Automatische Dokumentenerkennung
TriebfedernDie Motivation für die automatische Dokumentverarbeitung ist klar: Kosten sparen. Dies trifft für die Tätigkeiten, wie Sortierung, Klassifizierung oder Datenerfassung zu. Ergebnis ist hierbei die Beschleunigung von Transport- und Verteilprozessen mit dem angenehmen Nebeneffekt der Zentralisierung von Verarbeitungs- und Korrekturregeln. Wer kennt nicht die Eingangsrechnung, die bereits Wochen durch das Haus gewandert ist, bis sie beim richtigen Ansprechpartner eintrifft?Im Idealfall ist eine sogenannte Dunkelverarbeitung ohne manuellen Eingriff möglich. Paradebeispiel ist auch hier wieder die Eingangsrechnung: Wenn hierzu eine passende Bestellung und ein passender Wareneingang im ERP-System existiert, kann auf manuelle Prüfungen weitgehend verzichtet werden und eine automatisierte Buchung erfolgen. Weitere Beispiele sind einfache Bestellvorgänge, Stammdaten- oder Adressänderungen, aber auch die Indizierung von Altakten. Unterschiedliche AufgabenstellungenDie Aufgabenstellung für eine OCR-Software kann unterschiedlich sein. Benötigt der Anwender nur eine Möglichkeit zur Suche über Dokumentinhalte, hilft eine reine Volltext-Erkennung, die möglichst viele Formate, bspw. auch in PDF eingebettete Grafiken verarbeiten kann. Zielformat ist typischerweise wieder PDF, da hier der erkannte Text als Layer hinter die Grafiken gelegt und von der Volltext-Datenbank übernommen werden kann.Gerade bei einer elektronischen Sachbearbeitung (mit elektronischem Postkorb) müssen oftmals komplexe Informationen wie z.B. Bestellnummern, Adressdaten, Rechnungspositionen etc. aus gescannten Dokumenten in eine DMS- oder Fachanwendung manuell erfasst werden. Hierfür gibt es einfach zu nutzende, Client-basierte OCR-Lösungen, die "Tipparbeit" spart, vor allem bei komplexen Zeichenketten. Anspruchsvoller wird es, wenn aus Dokumenten automatisiert Daten ausgelesen werden müssen. Sind diese strukturiert und standardisiert, wie bei Meldezetteln oder Bestellformularen, besteht die Möglichkeit, exakt zu definieren, an welcher Stelle eines Formulars sich ein Wert befindet. Viele Dokumentarten besitzen aber keine feste Struktur, sodass diese formularbasierte Definition nicht möglich ist. Die relevanten Informationen in einer Rechnung sind zwar definiert, befinden sich aber je nach Lieferant immer an unterschiedlichen Positionen. Hier eine formularbasierte Software einzusetzen ist unsinnig, da eine Vielzahl von Formulardefinitionen erstellt werden müssten – schlimmstenfalls für jeden Kreditor und jede Rechnungsvariante. Ändert sich das Layout, muss auch noch nachadministriert werden. Gefordert sind an dieser Stelle Produkte, die in der Lage sind, den OCR-erkannten Text nach definierten Regeln zu analysieren. Man nennt dies Freiformerkennung, da keine feste Struktur eines Dokumentes vorgegeben werden muss, sondern bspw. nur Regeln wie:
Viele Anwender stellen sich so eine vollautomatisierte Verarbeitung der gesamten Eingangspost vor. Je nach Dokumentart sind aber unterschiedliche Inhalte für eine Sachbearbeitung von Interesse. Für einen Eingangsbrief ist ggfs. nur der interne Ansprechsprechpartner für die Weiterleitung relevant, für Eingangsrechnungen sind aber die Mindestangaben einer Rechnung ein KO-Kriterium. Vor dem eigentlichen Auslesen von relevanten Daten ist ebenso wie der manuellen Sortierung von Eingangspost eine Klassifizierung in Dokumentarten erforderlich. Diese automatische Klassifizierung auch für E-Mails einzusetzen, scheint aufgrund bereits vorliegender elektronischer Daten eher einfacher zu sein als bei Papierdokumenten. In der Praxis sind aber E-Mails aufgrund fehlender Vorgaben für die Strukturierung von Inhalten eher komplizierter zu verarbeiten. Eine per Ping Pong-Verfahren hin- und hergeschickte E-Mail enthält mit großer Wahrscheinlichkeit Inhalte, die den letzten Sachstand nicht widerspiegeln. Für eine Klassifizierung wichtige Informationen wie Kundennummer, Auftragsnummer, Adressangeben etc. sind oftmals gar nicht vorhanden. Die Klassifikation in Dokumentarten oder Vorgangstypen ist aber auch für Papierdokumente nicht trivial. Nicht immer sind alle Entscheidungskriterien eindeutig definierbar. Dokumente mit der Phrase "hiermit kündige ich", sind nicht in jedem Fall Kündigungen: "hiermit kündige ich an, dass ich den Vertrag verlängern werde". Die typischen Prozessschritte einer Erfassungsstrecke sind in der folgenden Darstellung noch einmal zusammengefasst: ![]() Detailansicht Einflußfaktoren auf ErkennungsergebnisseEine automatisierte Erkennung lebt von der Qualität der bereitgestellten Daten und einer Minimierung von manuellen Nachbearbeitungsaufwänden. Eine wesentliche Maßnahme stellt die Validierung gelesener Informationen in führenden Fachanwendungen dar: Existiert die gelesene Bestellnummer im ERP-System? Ist die im Antrag erkannte Kundennummer bereits in der Partnerdatenbank? Haben wir eine solche Schadennummer im System?Oft können auch Syntax-Definitionen, Summenprüfungen oder einfache Berechnungen zur Verbesserung der Ergebnisse führen. Je nach Schriftgut macht der Einsatz von Voting-Verfahren Sinn, bei denen mehrere OCR-Engines parallel Ergebnisse erarbeiten und diese Ergebnisse dann gewichtet und verglichen werden. Weitere Optimierungen basieren auf dem Eingriff eines Benutzers. Dieser korrigiert die Klassifikation oder die erkannten Werte und trainiert die Anwendung für die zukünftige Verarbeitung. Beispiele sind formularspezifische Regeldefinitionen: "Bei der Müller AG steht die Rechnungsnummer unter dem Text "SAP-Nr." oder allgemeine Erweiterung der Regelbasis: "Bei Dokumenten mit dem Begriff "kündige" ist ein manueller Eingriff vor der Klassifikation erforderlich". Natürlich hilft es auch immer, einen Blick auf das Beleggut selbst zu werfen. Bei Dokumenten von Dritten, wie Lieferanten oder Kunden sind die Möglichkeiten der Optimierung oftmals beschränkt. Anders verhält es sich jedoch bei Rückläufern, d.h. selbsterstellten Dokumenten die wieder in das Unternehmen zurückkommen. Hier kann durch unterschiedliche Maßnahmen leicht eine Erhöhung der Erkennungs-Qualität erreicht werden. Möglichkeiten zur Erhöhung der Lesequalität:
Stolpersteine in der PraxisTrotz aller Technologie gibt es einige Probleme in der Praxis, die auch auftreten, wenn eine OCR zu 100% arbeitet. Dies fängt bei der Trennung der einzelnen Dokumente im Scan-Stapel an. Gerade gemischtes Beleggut verlangt oftmals eine Zusortierung von Trennblättern, da die Software-Regeln für die Erkennung von Dokumentgrenzen nicht richtig greifen. Schwierig wird es auch bei der Mehrfachklassifikation von Dokumenten, also der Identifikation mehrerer Geschäftsvorfälle in einem Dokument ("anbei finden Sie die Abrechnung und ich bitte um die Zusendung von Information zum Produkt …"). Hier lassen sich Dokumentenklassen nicht immer ausreichend genau unterscheiden. Wichtig sind dann aussagefähige Statistik-Funktionen, um schnell einen Überblick über typische Problemfälle zu bekommen.Apropos 100% OCR: Oft hört man die Aussagen: "Unsere Erkennnungsrate liegt bei 99%". Forscht man hier weiter, stellt man leicht fest, dass bei dieser Aussage die Bezugsgröße wichtig ist: Geht es um Dokumente, Seiten, Felder oder Zeichen? Bei einer Modellrechnung mit 500 Belegen à 2 Seiten (insg. 1.000 Seiten) mit jeweils 3 Feldern pro Seite und insg. 24 Zeichen pro Seite kann hierbei ein deutlicher Unterschied für den Aufwand zur Nachbearbeitung entstehen:
Im schlimmsten Fall sind also fast die Hälfte der Belege zu korrigieren, was so in der Praxis zwar nicht vorkommt, doch es zeigt, dass man bei entsprechenden Aussagen in die Details gehen muss. Das trifft übrigens für das gesamte Thema Produktbewertung zu: Allgemeine Produkt-Demos oder lange Feature-Listen helfen bei der Bewertung und Auswahl entsprechender Software nicht weiter. ProduktauswahlWichtig ist die Prüfung der Verarbeitung mit eigenen, repräsentativen Dokumenten und Dokument-Stapeln – möglichst mit den eigenen Scannern gescannt. Der Anbieter sollte auch das Regelwerk für die Erkennung und Prüfung kennen und passende Datensätze zur Verfügung gestellt bekommen. Hiermit kann das System vortrainiert werden.Anbieter-Übersicht
Zu Beginn einer Produkt-Demonstration wird dann ein weiterer Dokumentstapel übergeben. Nach der Verarbeitung muss nun im Detail verglichen, geprüft und gezählt werden. Es erfolgt hierbei auch eine Bewertung, wie einfach eine Korrektur möglich ist. Interessant ist natürlich das Verhalten beim zweiten übergebenen Dokumentenstapel, da hier die Optimierungen, die für den ersten Stapel bereits durch den Anbieter erfolgt sind, nun gemeinsam erfolgen. Man stellt meist schnell fest, ob ein Produkt Endbenutzer-tauglich ist oder ob Programmierkenntnisse für die Optimierung erforderlich sind. Dies ist übrigens neben der Erkennungs-Qualität das ausschlaggebende Bewertungskriterium. Übersicht Bewertungskriterien
- Qualität der Erkennung geht vor Geschwindigkeit
- Übersichtlichkeit und Funktionalität der Admin-Anwendung
- Komplette und einfache Bedienung über Tastatur
Anzahl gescannter Dokumente = Anzahl bearbeiteter Dokumente = Anzahl exportierter Dokumente
- ERP-Systeme oder andere Systeme für Prüfdaten oder Weiterverarbeitung
- Kosten für das Training und Optimierung der Dokumente FazitBedarf an Technologien zur automatischen Dokumentenerkennung gibt es in vielen Anwendungsbereichen wie bspw. beim zentralen Posteingang, bei der Rechnungsverarbeitung, bei Bestellungen und Anträgen, Auswertung von Fragebögen/Umfragen oder Meldezettel (Strom, Wasser, Gas). Gute OCR-Lösung reduzieren hier Sortier- und Erfassungsaufwände deutlich.Eine pauschal beste Lösung gibt es nicht. Dies wird schon durch die unterschiedlichen Technologieansätze deutlich, mit denen die Produkte arbeiten. Es gibt formularbasierte Lösung, Freiform-Verarbeitung mit Regelwerken oder auf Basis von neuronalen Netzen. Daher ist der Test unter eigenen Rahmenbedingungen und mit dem eigenen Beleggut Pflicht. Abschließend muss aber noch der Hinweis erlaubt sein, dass diese gesamte Technologie zwar bei der Kostenreduzierung der Dokumentverarbeitung hilft, aber doch nicht den Königsweg darstellt. Erster Schritt sollte immer die Vermeidung des Medienbruchs von Papier zu elektronischen Informationen sein. Die direkte elektronische Verarbeitung bspw. über ein elektronisches Formular, über EDI oder FTP, ist immer effizienter als der Einsatz von OCR-Technik. Allerdings wurde das papierlose Büro auch schon vor vielen Jahren propagiert, ist aber noch lange nicht Realität… 12/2009, Jobst Eckardt
Jobst Eckardt hat durch seine Tätigkeit bei internationalen Anbietern mehr als 15 Jahre Erfahrung mit Archiv-, Workflow- und EDM Lösungen, davon über 8 Jahre mit Schwerpunkt der Integration in SAP R/3. Seit 2001 ist er Senior-Berater bei Zöller & Partner.12/2009, Thorsten Brand
| ![]() ![]() | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
© 1999-2010 FEiG & PARTNER | Nutzungsbedingungen | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
![]() | ||
![]() |