Durante el último mes, pasé bastante tiempo hablando con diversas personas sobre el tema de cómo cerrar la brecha entre el contenido almacenado como documentos en un repositorio y el análisis de big data, y me di cuenta de que surgió un tema común en la mayoría de mis conversaciones.
Para comprender completamente el tema, creo que es importante entender la premisa principal: que los datos valiosos se almacenan como contenido dentro de repositorios de documentos. Report Analytics es un nombre nuevo para una tecnología relativamente madura. Se trata de extraer datos de la información contenida en ese contenido, ya sean estados de cuenta, facturas o informes. Para los fines de este breve análisis, nos referiremos a todo este contenido como informes.
Utilizo los términos “información” y “datos” de forma intencionada. Los informes proporcionan datos que se presentan de forma que puedan ser leídos por un ser humano. Hasta cierto punto, la información relevante se proporciona únicamente por el hecho de que sea legible a simple vista. La posición de los datos en la página y su relación con otros datos de la página es indicativa de una relación jerárquica. En otras palabras, el lugar donde aparecen los datos suele indicar su importancia relativa, su orden de clasificación y su “pertenencia” a otros datos de la página. Este posicionamiento e integridad referencial proporciona información derivada de los datos.
Por supuesto, el hecho mismo de que la estructura del informe sea necesariamente estática limita el uso de la información contenida en el informe al propósito específico para el que fue diseñado originalmente. Aunque el informe puede (y es muy probable que así sea) contener datos que se pueden utilizar para otros fines y para responder a otras preguntas comerciales, no se puede utilizar en el formato diseñado originalmente para nada que no sea su propósito original.
Estos estados de cuenta, facturas e informes, almacenados en un sistema de gestión de informes empresariales como Content Manager OnDemand (CMOD) de IBM, cumplen el importante propósito original de proporcionar un archivo legal y un registro de transacciones que se puedan utilizar para responder a preguntas legales y normativas, así como, quizás más importante, a las consultas de los clientes. Pero estos documentos almacenados pueden ofrecer mucho más.
Volviendo al tema común, aunque la mayoría de las personas con las que hablé tenían conocimientos de minería de datos, ninguna entendía realmente el puente hacia el big data y el poder de extraer datos de la información contenida en los informes. Esto es minería de datos llevada al siguiente nivel: extracción de datos de la información contenida en informes, facturas, estados de cuenta, etc. y transformación, reutilización y combinación de los datos con información de fuentes externas. El resultado es un conocimiento crítico que se puede utilizar para obtener información, análisis e inteligencia adicionales.
En los informes, facturas, explicaciones de beneficios, estados de cuenta, etc. que se elaboran a diario en las empresas y en la industria, se puede obtener más información sobre los procesos internos, los plazos de fabricación, el control de calidad, los patrones de compra de los clientes, los niveles de satisfacción de los clientes y una gran cantidad de información valiosa. La adquisición oportuna de estos datos verificados y fundamentados puede ayudar a aumentar los ingresos, reducir los costos y tomar mejores decisiones comerciales.
En muchas conversaciones, tuve la gratificante experiencia de crear un momento de inspiración. Reconocer que los informes almacenados en un sistema ECM se pueden utilizar para la adquisición de datos y no solo para la distribución de datos e información es, sin duda, un cambio de paradigma para muchos. Pero, una vez comprendido, es un paradigma que abre la puerta a la reducción de costos y a la obtención de información valiosa.
Crawford Technologies proporciona software para extraer rápida y fácilmente los datos pertinentes de enormes volúmenes de facturas, extractos e informes, permitiéndote convertir tu antiguo sistema de contenidos en un nuevo recurso de Big Data. Está todo ahí, sólo es cuestión de crear el puente.












