Crawford Tech logo

Brücke zu Big Data | Extraktion, Bergbau und mehr

Im letzten Monat habe ich ziemlich viel Zeit damit verbracht, mit den verschiedensten Leuten über die Überbrückung der Lücke zwischen als Dokumente in einem Repository gespeicherten Inhalten und der Big Data-Analyse zu sprechen. Dabei ist mir aufgefallen, dass sich in den meisten meiner Gespräche ein gemeinsames Thema herauskristallisierte.

Um das Thema vollständig zu verstehen, ist es meiner Meinung nach wichtig, die Hauptprämisse zu verstehen – nämlich, dass wertvolle Daten als Inhalt in Dokument-Repositories gespeichert werden. Report Analytics ist ein neuer Name für eine relativ ausgereifte Technologie. Dabei geht es darum, Daten aus den in diesem Inhalt enthaltenen Informationen zu extrahieren, seien es Kontoauszüge, Rechnungen oder Berichte. Für die Zwecke dieser kurzen Erläuterung bezeichnen wir alle diese Inhalte als Berichte.

Ich verwende die unterschiedlichen Begriffe „Informationen“ und „Daten“ mit Absicht. Berichte liefern Daten, die so präsentiert werden, dass sie von Menschen gelesen werden können. Bis zu einem gewissen Grad werden relevante Informationen allein dadurch bereitgestellt, dass sie mit dem Auge lesbar sind. Die Position der Daten auf der Seite und ihre Beziehung zu anderen Daten auf der Seite weisen auf eine hierarchische Beziehung hin. Mit anderen Worten, wo die Daten erscheinen, kann normalerweise ihre relative Wichtigkeit, ihre Sortierreihenfolge und ihre „Zugehörigkeit“ zu anderen Daten auf der Seite anzeigen. Diese Positionierung und referenzielle Integrität liefert Informationen, die aus den Daten abgeleitet werden.

Natürlich beschränkt die Tatsache, dass die Struktur des Berichts zwangsläufig statisch ist, die Verwendung der Informationen im Bericht auf den spezifischen Zweck, für den der Bericht ursprünglich erstellt wurde. Auch wenn der Bericht Daten enthalten kann (und dies höchstwahrscheinlich auch tut), die für andere Zwecke und zur Beantwortung anderer Geschäftsfragen verwendet werden können, ist er in seinem ursprünglich erstellten Format für nichts anderes als seinen ursprünglichen Zweck verwendbar.

Diese Kontoauszüge, Rechnungen und Berichte, die in einem Enterprise Report Management-System wie IBM Content Manager OnDemand (CMOD) gespeichert werden, dienen dem sehr wichtigen ursprünglichen Zweck, ein Rechtsarchiv und eine Aufzeichnung von Transaktionen bereitzustellen, die zur Beantwortung rechtlicher und behördlicher Fragen sowie – vielleicht noch wichtiger – der Kundenanfragen verwendet werden können. Aber diese gespeicherten Dokumente können noch viel mehr bieten.

Zurück zum gemeinsamen Thema. Obwohl die meisten Leute, mit denen ich gesprochen habe, Kenntnisse über Data Mining hatten, verstand keiner wirklich die Brücke zu Big Data und die Macht der Datenextraktion aus den in Berichten enthaltenen Informationen. Dies ist Data Mining auf der nächsten Ebene – Extraktion von Daten aus den in Berichten, Rechnungen, Kontoauszügen usw. enthaltenen Informationen und Transformation, Umnutzung und Kombination der Daten mit Informationen aus externen Quellen. Dies führt zu kritischem Wissen, das verwendet werden kann, um zusätzliche Einblicke, Analysen und Informationen zu gewinnen.

Weitere Informationen zu internen Prozessen, Fertigungszeitplänen, Qualitätskontrolle, Kaufverhalten der Kunden, Kundenzufriedenheit und einer Vielzahl anderer wertvoller Informationen finden Sie in den Berichten, Rechnungen, Leistungserklärungen, Abrechnungen usw., die in Unternehmen und Branchen täglich erstellt werden. Die rechtzeitige Erfassung dieser überprüften, fundierten Daten kann dazu beitragen, den Umsatz zu steigern, Kosten zu senken und bessere Geschäftsentscheidungen zu treffen.

In vielen Gesprächen hatte ich die erfreuliche Erfahrung, einen „Aha!“-Moment zu schaffen. Zu erkennen, dass die in einem ECM-System gespeicherten Berichte zur Datenerfassung und nicht nur zur Daten- und Informationsverteilung verwendet werden können, ist für viele zugegebenermaßen ein Paradigmenwechsel. Aber wenn man es einmal erkannt hat, ist es ein Paradigma, das die Tür zu geringeren Kosten und wertvollen Erkenntnissen öffnet.

Crawford Technologies bietet Software, mit der Sie schnell und einfach relevante Daten aus riesigen Mengen von Rechnungen, Auszügen und Berichten extrahieren können. So können Sie Ihr altes Content-System in eine neue Big Data-Ressource verwandeln. Es ist alles da – man muss nur die Brücke schlagen.

Blogbeitrag bearbeiten
August 3, 2016

Autor

  • Ernie Crawford, keynote speaker
    CEO & President

    Ernie Crawford is the founder and CEO of Crawford Technologies, a global leader in the print and electronic document industries. With over four decades of experience, Ernie is a respected thought leader and innovator in the field of document management and has been recognized for his contributions to the industry with numerous awards and accolades. He is committed to delivering innovative solutions to his clients and has led Crawford Technologies through significant growth and expansion while maintaining a focus on exceptional customer service. Ernie is a sought-after speaker and has presented at numerous industry events and conferences.

Wenn Sie ein Konto registrieren müssen, klicken Sie bitte hier .