Seite wählen

Document Data Mining – eine ungenutzte Wertquelle

Einführung

Data Mining ist ein exotisch klingender Begriff, der Bilder von forensischen Computeranalytikern heraufbeschwört, die aus riesigen digitalen Datenbeständen Informationsbrocken herauspicken und diese verwenden, um Trends und damit verbundene Verhaltensweisen zu identifizieren. Während Mining-Operationen komplex und mysteriös sein können, beinhalten viele Anwendungen für extrahierte Daten keine Suche nach versteckten Mustern und Zusammenhängen. Eine ergiebige Quelle für nützliche Daten, die oft übersehen wird, sind alltägliche Geschäftsdokumente.

Dokumente enthalten bereits Informationen, die aus verschiedenen Quellen im gesamten Unternehmen gesammelt wurden. Diese Daten können dazu beitragen, dass Dokumentenvorgänge effizienter und präziser werden oder neue Technologien genutzt werden. Sie können Unternehmen dabei helfen, ihre Kunden besser zu verstehen, relevantere Kommunikation aufzubauen und das Kundenerlebnis zu verbessern. Darüber hinaus können aus archivierten Dokumenten gewonnene Daten Unternehmen dabei helfen, Marketingstrategien zu entwickeln oder behördliche Vorschriften einzuhalten.

Extrahierte Dokumentdaten können Inserter-Dateien füllen, Indizes für archivierte Seiten erstellen oder Nachrichten in alternative Formate konvertieren, beispielsweise um barrierefreie Mitteilungen zu erstellen. Sie können auch verwendet werden, um Transpromo-Nachrichten zu senden, Druckdateien neu zu ordnen oder Poststücke im Rahmen einer Haushaltsstrategie zu kombinieren.

Unternehmen, die die Vorteile von Whitepaper-Workflows nutzen möchten, werden mit ziemlicher Sicherheit daran interessiert sein, Daten aus Druckdateien zu extrahieren. Die Kontrolle der Integrität von Poststücken, die aus mehreren Aufträgen generiert werden, nachdem sie für die Druckproduktion zusammengeführt wurden, ist zwingend erforderlich. Barcodes, die mit aus den Originalseiten extrahierten Daten erstellt werden, stellen sicher, dass jede Seite von der Endverarbeitungsanlage erfasst wird. Extrahierte Daten können auch automatisierte Nachdrucke ermöglichen, falls ein Dokument beschädigt wird.

Ein Wettbewerbsvorteil für Dienstleister

Druck-/Postdienstleister haben häufig keinen Zugriff auf die Rohdaten, die sie für die Erstellung der Dokumente verwenden, die sie drucken und verteilen sollen. Ihre einzige Datenquelle ist die Druckdatei. Selbst grundlegende Vorgänge wie das Extrahieren von Adressdaten für die Postverarbeitung oder das Bestimmen der Seitenanzahl hängen von ihrer Fähigkeit ab, Daten, die auf den gedruckten Seiten vorhanden sind, zu prüfen, zu entfernen und manchmal zu ersetzen.

Mithilfe von Data-Mining-Tools können Druckdienstleister ihre eigenen Verarbeitungsabläufe optimieren und Mehrwert für ihre Kunden schaffen. Ein Geschäft, das beispielsweise Kontoauszüge für Anlagekonten produziert, könnte Konten mit hohem Saldo vom Rest der Druckauflage trennen. Es könnte Berichte hinzufügen, Auszüge auf hochwertigerem Papier drucken oder die Seiten in Portfolio-Ordnern zusammenstellen, anstatt die Auszüge zu falten und in Fensterumschläge zu stecken. Durch Data-Mining können Druckdienstleister mehr Funktionen anbieten, um sich von ihren Mitbewerbern abzuheben und höhere Preise zu verlangen.

Mit externen Daten kombinieren

Manchmal können extrahierte Daten mit anderen Informationen als den Quelldokumenten kombiniert werden, um völlig neue Dokumente zu erstellen, die auf Papier oder digital bereitgestellt werden können. Ein Unternehmen könnte beispielsweise Kreditkartentransaktionsdaten mit demografischen Kundeninformationen kombinieren, um relevante Angebote zu erstellen, die den Einkäufen, dem Einkommensniveau oder dem Alter eines Kunden entsprechen. Die Angebote können als eingebettete Anzeigen auf der Kreditkartenabrechnung oder als Handlungsaufforderungen in digitalen Rechnungen bereitgestellt oder sogar verwendet werden, um vorgedrucktes Marketingmaterial selektiv in Umschläge einzufügen.

In einem anderen Beispiel können Daten über einzelne Kunden in einer CRM-Datenbank gespeichert sein, aber nicht in den Dokumenten selbst. Es ist notwendig, Übereinstimmungsschlüssel wie Kontonummern aus der Druckdatei zu extrahieren, um auf weitere Informationen aus dem CRM-System zuzugreifen. Dies ist wichtig, wenn barrierefreie Dokumente erstellt werden, da Kunden je nach ihren Fähigkeiten und Ressourcen unterschiedliche Dokumentformate verlangen können. Kunden benötigen möglicherweise Großdruck, Brailleschrift oder eine akustische Übermittlung der Dokumente. Unternehmen sind verpflichtet, angemessenen Anpassungswünschen nachzukommen, die in der CRM-Datenbank erfasst werden. Die Verknüpfung der Dokumentdaten mit externen Datenquellen ist eine effiziente Möglichkeit, die gesetzlichen Bestimmungen einzuhalten.

Warum Daten aus Dokumenten abrufen?

Es mag seltsam erscheinen, Dokumente als Datenquelle zu betrachten, aber der Zugriff auf diese leicht verfügbaren Informationen bietet Vorteile, anstatt die Daten aus den Originalquellen zu beziehen. Der Zugriff auf Datensätze, die in weit verstreuten Datenbanken im gesamten Unternehmen gespeichert sind, erfordert die Dienste von IT-Spezialisten, sichere Konnektivität und Kenntnisse der Datenstruktur.

Die Beschaffung von Finanzmitteln und Unterstützung für solche Initiativen kann ein langwieriger und unsicherer Prozess sein. In den meisten Fällen ist das Herausziehen der benötigten Informationen direkt aus den Dokumenten eine der wenigen Möglichkeiten, Projekte innerhalb einer angemessenen Zeit abzuschließen.

Dokumentarchive sind statisch, wohingegen Data Warehouses normalerweise nur die aktuellsten Informationen enthalten. Bei Projekten, die Informationen aus der Vergangenheit erfordern, ist die Wahrscheinlichkeit höher, dass auf den damals erstellten Seiten genaue Daten gespeichert sind.

Da der Inhalt von Rechnungen und Kontoauszügen oft aus vielen unterschiedlichen Systemen stammt, gilt die Datensammlung als offizielle Aufzeichnung von Transaktionen, die aufbewahrt werden muss, um den gesetzlichen Verpflichtungen des Unternehmens in Bezug auf die Kundenkommunikation nachzukommen. Da es sich um die einzige vertrauenswürdige Quelle für diese wichtigen Daten handelt, ist es von entscheidender Bedeutung, dass die Informationen vollständig und korrekt sind.

Ein gutes Beispiel ist die Offenlegung von Beweismitteln. Unternehmen, die auf Rechtsstreitigkeiten, Prüfungen oder behördliche Anfragen reagieren, können in eine Zwickmühle geraten. Das Auffinden und Extrahieren von Daten, die in alten Versionen mehrerer Systeme gespeichert sind (die sich im Laufe der Zeit möglicherweise geändert haben), erfordert die Ausgabe von Geld für externe Dienstleister und/oder die Aufmerksamkeit von qualifizierten Mitarbeitern des IT-Personals des Unternehmens. In jedem Fall wird die Einhaltung von Vorschriften schwierig, störend und teuer.

Ohne eine umfassende Datenhistorie können die aus Dokumentenarchiven gesammelten Informationen den gesetzlichen Anforderungen nicht genügen. Was bei der Verarbeitung der Rohdaten Monate gedauert hätte, lässt sich in Wochen erreichen, wenn die E-Discovery-Daten aus dem Dokumentenarchiv abgerufen werden können.

Die richtigen Werkzeuge verwenden

Das heißt nicht, dass das Extrahieren von Dokumentdaten einfach ist. Dokumente sind für die Nutzung und Interpretation durch Menschen und nicht durch Maschinen konzipiert. In Druckdateien fehlen gängige Elemente, die Programmierer zur Identifizierung von Daten in Datenbanken verwenden, wie Tags oder feste Dateistrukturen. Das Auffinden bestimmter in Dokumenten eingeschlossener Informationen erfordert Techniken wie Datenmarkierungen, Offsets, Regeln und Überprüfung. Dokumente enthalten häufig Bedingungen, die zu Ausnahmen oder besonderen Umständen führen, die im Rahmen des Data-Mining-Vorgangs behandelt werden müssen. Das Isolieren der richtigen Daten erfordert die Kombination von physischer Seitenlokalisierung, Überprüfung und Logik. Ohne gute Tools zum Suchen und Interpretieren der Daten ist das Extrahieren von Informationen aus Druckdateien mühsam. Es kann sogar unmöglich sein.

Das Mining von Daten aus Dokumenten wird oft von Formularanalysten, Dokumentendesignern oder Mitarbeitern von Geschäftseinheiten durchgeführt. Sie sind keine Computerprogrammierer. Die Routinen zum Auffinden und Extrahieren der Daten müssen auf grafische Weise und mit einer benutzerfreundlichen Oberfläche erstellt werden. Das Hervorheben von Datenfeldern auf einem Bildschirm ist unendlich viel einfacher als das manuelle Berechnen von x- und y-Koordinaten oder das Schreiben von IF-THEN-ELSE-Logik von Hand. Die Möglichkeit, eingebettete, nicht druckbare Datenelemente in in Archiven gespeicherten Dokumenten zu erstellen, ist eine leistungsstarke Funktion und vereinfacht die Datenextraktion beim zukünftigen Zugriff auf das Archiv erheblich.

Einfallsreiche Verwendungsmöglichkeiten für extrahierte Daten

  • Die Verwendungsmöglichkeiten extrahierter Dokumentdaten sind nahezu unbegrenzt. Fortschritte in der Drucktechnologie und bei digitalen Übermittlungskanälen haben es Dokumententwicklern ermöglicht, Nachrichten persönlicher, relevanter und effektiver als je zuvor zu gestalten. Hier einige Beispiele:
  • Lieferadressdaten aus einem Bankauszug können Karten oder personalisierte Wegbeschreibungen für Kunden auslösen, die in der Nähe einer neu eröffneten Filiale wohnen.
  • Anhand der Transaktionsdetails für den Artikelkauf kann ein QR-Code generiert werden, der zu Anleitungsvideos führt, in denen häufig gestellte Fragen zu gekauften Produkten beantwortet werden. So wird die Zahl der Produktrücksendungen verringert und die Kundenzufriedenheit erhöht.
  • Mithilfe von Transaktionsinformationen zu vergangenen Zahlungen können Sie verhindern, dass Kunden, die immer online bezahlen, einen Überweisungsumschlag zugeschickt bekommen.
  • Durch die Analyse der auf den Rechnungen aufgeführten Dienste können Marketingbotschaften für Upgrades oder Zusatzdienste generiert werden – und das Unternehmen kann nicht für Dienste werben, die die Kunden bereits abonniert haben.
  • Die Möglichkeit, eingebettete, nicht druckbare Datenelemente in in Archiven gespeicherten Dokumenten zu erstellen, ist eine leistungsstarke Funktion und vereinfacht die Datenextraktion beim zukünftigen Zugriff auf das Archiv erheblich.
  • Aus den auf einer Rechnung enthaltenen Konto-, Kunden- und Rechnungsinformationen wird eine ausgedruckte persönliche URL erstellt, die zu einer Webseite mit personalisierten Anreizen für die Umstellung auf papierlose Rechnungsstellung führt.
  • Adressinformationen auf Transaktionsdokumenten dienen der gezielten Vermarktung von Werbebotschaften für Partnerunternehmen oder besondere Veranstaltungen in der Nähe des Wohnorts des jeweiligen Kunden. Einige Organisationen verkaufen Werbefläche in Rechnungen. Durch präzises Targeting wird diese Funktion für potenzielle Werbetreibende attraktiver.
  • Aus Dokumenten extrahierte Produktkaufinformationen können verwendet werden, um Folge-E-Mails mit der Bitte um Kundenbewertungen und Feedback auszulösen.
  • Das Mining von Daten aus Dokumenten kann weitaus effizienter sein als das Abrufen derselben Informationen aus verstreuten Datenbanken. Dokumentdesigner haben die Arbeit, Daten aus verschiedenen Quellen zu verknüpfen, bereits übernommen. Unternehmen sind nicht mehr auf IT-Ressourcen angewiesen, um die Daten zu erhalten, die sie benötigen, um ihre Betriebsabläufe zu verbessern, Kosten zu senken, auf rechtliche Anfragen zu reagieren oder die Kundenkommunikation zu verbessern.
  • Dokumentenbesitzer sollten den Wert der Dokumente, die sie bereits besitzen, nicht übersehen. Archivierte Dokumente stellen oft die genaueste Darstellung von Daten dar, wie sie während eines bestimmten Zeitraums existierten. Mit den richtigen Tools zum Extrahieren der Daten werden Unternehmen feststellen, dass ihre Dokumente eine wertvolle Quelle leicht zugänglicher Informationen sind.

Das Mining von Daten aus Dokumenten kann weitaus effizienter sein als das Abrufen derselben Informationen aus verstreuten Datenbanken. Dokumentdesigner haben die Arbeit, Daten aus verschiedenen Quellen zu verknüpfen, bereits übernommen. Unternehmen sind nicht mehr auf IT-Ressourcen angewiesen, um die Daten zu erhalten, die sie benötigen, um ihre Betriebsabläufe zu verbessern, Kosten zu senken, auf rechtliche Anfragen zu reagieren oder die Kundenkommunikation zu verbessern.

Dokumentenbesitzer sollten den Wert der Dokumente, die sie bereits besitzen, nicht übersehen. Archivierte Dokumente stellen oft die genaueste Darstellung von Daten dar, wie sie während eines bestimmten Zeitraums existierten. Mit den richtigen Tools zum Extrahieren der Daten werden Unternehmen feststellen, dass ihre Dokumente eine wertvolle Quelle leicht zugänglicher Informationen sind.

Wenn Sie ein Konto registrieren müssen, klicken Sie bitte hier .