Introducción
La minería de datos es un término que suena exótico y que evoca imágenes de analistas informáticos forenses extrayendo fragmentos de información de grandes cantidades de datos digitales y utilizándolos para identificar tendencias y comportamientos relacionados. Si bien las operaciones de minería de datos pueden ser complejas y misteriosas, muchas de las aplicaciones de los datos extraídos no implican la búsqueda de patrones y correlaciones ocultas. Una fuente abundante de datos útiles, y que a menudo se pasa por alto, son los documentos comerciales cotidianos.
Los documentos ya contienen información obtenida de diversas fuentes de toda la empresa. Estos datos pueden permitir que las operaciones documentales sean más eficientes y precisas, o aprovechar las nuevas tecnologías. Pueden ayudar a las empresas a comprender mejor a sus clientes, crear comunicaciones más relevantes y mejorar la experiencia del cliente. Además, los datos extraídos de los documentos archivados pueden ayudar a las empresas a desarrollar estrategias de marketing o a cumplir con las directivas regulatorias.
Los datos extraídos de los documentos pueden rellenar archivos de inserción, crear índices para páginas archivadas o convertir mensajes en formatos alternativos, como la creación de comunicaciones accesibles. También se pueden utilizar para impulsar mensajes transpromocionales, volver a secuenciar archivos impresos o combinar piezas de correo como parte de una estrategia de distribución de documentos.
Las empresas que deseen aprovechar las ventajas de los flujos de trabajo en papel blanco seguramente estarán interesadas en extraer datos de los archivos de impresión. Es fundamental controlar la integridad de las piezas de correo generadas a partir de varios trabajos después de fusionarlos para la producción de impresión. Los códigos de barras creados con datos extraídos de las páginas originales garantizan que el equipo de acabado contabilice cada página. Los datos extraídos también pueden hacer posible la reimpresión automática, en caso de que un documento esté dañado.
Una ventaja competitiva para los proveedores de servicios
Los proveedores de servicios de impresión y correo no suelen tener acceso a los datos en bruto que se utilizan para redactar los documentos que se les encarga imprimir y distribuir. Su única fuente de datos está contenida en el archivo de impresión. Incluso las operaciones básicas, como la extracción de datos de direcciones para el procesamiento postal o la determinación del número de páginas, dependen de su capacidad para inspeccionar, eliminar y, a veces, reemplazar los datos que existen en las páginas impresas.
Las herramientas de minería de datos pueden permitir a los proveedores de servicios de impresión optimizar sus propios flujos de trabajo de procesamiento y agregar valor para sus clientes. Por ejemplo, una tienda que produce estados de cuenta de inversiones podría segmentar las cuentas con saldos altos del resto de la tirada de impresión. Podrían agregar informes, imprimir estados de cuenta en papel de mayor calidad o ensamblar las páginas en carpetas de portafolios en lugar de doblar e insertar los estados de cuenta en sobres con ventana. Ofrecer más funcionalidad impulsada por la minería de datos distingue a los proveedores de servicios de impresión de sus competidores y les permite cobrar tarifas más altas.
Combinar con datos externos
En ocasiones, los datos extraídos se pueden combinar con otra información que no se encuentra en los documentos originales para crear documentos completamente nuevos que se pueden entregar en papel o en formato digital. Por ejemplo, una empresa podría combinar datos de transacciones de tarjetas de crédito con información demográfica de los clientes para crear ofertas relevantes que correspondan a las compras, el nivel de ingresos o la edad del cliente. Las ofertas se pueden entregar como anuncios integrados en la factura de la tarjeta de crédito, como llamadas a la acción en las facturas digitales o incluso se pueden utilizar para insertar selectivamente material de marketing preimpreso en sobres.
En otro ejemplo, los datos sobre clientes individuales pueden residir en una base de datos CRM, pero no en los documentos en sí. Es necesario extraer claves de coincidencia, como números de cuenta, del archivo de impresión para acceder a más información del sistema CRM. Esto es importante al crear documentos accesibles, ya que los clientes pueden exigir diferentes formatos de documentos, según sus capacidades y recursos. Los clientes pueden necesitar documentos en letra grande, braille o en formato auditivo. Las empresas están obligadas a satisfacer las solicitudes de adaptación razonable, que se registran en la base de datos CRM. Conectar los datos de los documentos a fuentes de datos externas es una forma eficiente de cumplir con la ley.
¿Por qué obtener datos de los documentos?
Puede parecer extraño recurrir a los documentos como fuente de datos, pero existen ventajas en acceder a esta información disponible en el momento como alternativa a adquirir los datos de las fuentes originales. Acceder a los registros almacenados en bases de datos dispersas por toda la empresa requiere los servicios de especialistas en TI, conectividad segura y conocimiento de la estructura de datos.
Obtener financiación y apoyo para este tipo de iniciativas puede ser un proceso largo e incierto. En la mayoría de los casos, extraer la información necesaria directamente de los documentos es una de las pocas formas de llevar a cabo los proyectos en un tiempo razonable.
Los archivos de documentos son estáticos, mientras que los almacenes de datos suelen contener solo la información más actualizada. Cualquier proyecto que requiera información del pasado tiene más probabilidades de encontrar datos precisos almacenados en las páginas que se crearon en ese momento.
Dado que el contenido de las facturas y los estados de cuenta suele proceder de muchos sistemas distintos, la recopilación de datos se considera el registro oficial de las transacciones que se deben mantener para cumplir con las obligaciones reglamentarias de la organización en materia de comunicaciones con los clientes. Como única fuente confiable de estos datos vitales, es claramente esencial que la información sea completa y precisa.
Un buen ejemplo es el descubrimiento legal. Las empresas que responden a litigios, auditorías o consultas regulatorias pueden encontrarse en apuros. Encontrar y extraer datos almacenados en versiones antiguas de múltiples sistemas (que pueden haber cambiado con el tiempo) requerirá gastar dinero en proveedores de servicios externos y/o la atención de personas capacitadas del personal de TI de la empresa. De cualquier manera, el cumplimiento será difícil, disruptivo y costoso.
Sin un historial de datos completo, la información recopilada de los archivos de documentos no puede cumplir con los requisitos legales. Lo que podría haber llevado meses lograrse al tratar con datos sin procesar se puede lograr en semanas si los datos de descubrimiento electrónico se pueden extraer del almacén de documentos.
Utilizando las herramientas adecuadas
Esto no significa que extraer datos de documentos sea fácil. Los documentos están diseñados para que los consuman e interpreten los seres humanos, no las máquinas. Los elementos comunes que utilizan los programadores para identificar datos en bases de datos, como etiquetas o estructuras de archivos fijas, no se encuentran en los archivos de impresión. La localización de información específica bloqueada en los documentos requiere técnicas como marcadores de datos, desplazamientos, reglas y verificación. Los documentos presentan con frecuencia condiciones que dan lugar a excepciones o circunstancias únicas, que deben gestionarse como parte de la operación de minería de datos. Aislar los datos correctos implica combinar la ubicación física de la página, la inspección y la lógica. Sin grandes herramientas para encontrar e interpretar los datos, el proceso de extracción de información de los archivos de impresión es tedioso. Puede incluso resultar imposible.
La extracción de datos de los documentos suele ser realizada por analistas de formularios, diseñadores de documentos o miembros del personal de las unidades de negocio. No son programadores informáticos. La construcción de las rutinas para encontrar y extraer los datos debe hacerse de forma gráfica, utilizando una interfaz amigable. Resaltar campos de datos en una pantalla es infinitamente más fácil que calcular manualmente las coordenadas x e y o escribir a mano la lógica IF-THEN-ELSE. La capacidad de crear elementos de datos incrustados y no imprimibles dentro de documentos almacenados en archivos es una capacidad poderosa y simplifica enormemente la extracción de datos al acceder al archivo en el futuro.
Usos ingeniosos para los datos extraídos
- Los usos de los datos extraídos de los documentos son casi ilimitados. Los avances en la tecnología de impresión y los canales de distribución digital han hecho posible que los desarrolladores de documentos elaboren mensajes más personales, relevantes y efectivos que nunca. A continuación, se ofrecen algunos ejemplos:
- Los datos de la dirección de entrega de un extracto bancario pueden activar mapas o indicaciones de manejo personalizadas para los clientes que viven cerca de una sucursal recién inaugurada.
- Los detalles de la transacción de compra de artículos pueden generar un código QR que conduce a videos instructivos que responden preguntas frecuentes sobre los productos comprados, lo que reduce las devoluciones de productos y aumenta la satisfacción del cliente.
- La información transaccional relacionada con pagos anteriores se puede utilizar para evitar el envío de un sobre de remesa a clientes que siempre pagan en línea.
- El análisis de los servicios que figuran en las facturas permite generar mensajes de marketing para actualizaciones o servicios adicionales, y evita que la empresa realice marketing de servicios a los que los clientes ya están suscritos.
- La capacidad de crear elementos de datos incrustados y no imprimibles dentro de documentos almacenados en archivos es una capacidad poderosa y simplifica enormemente la extracción de datos al acceder al archivo en el futuro.
- La información de cuenta, cliente y factura incluida en una factura se utiliza para construir una URL personal impresa que conduce a una página web con incentivos personalizados para la conversión a la facturación sin papel.
- La información de la dirección en los documentos transaccionales permite enviar mensajes de marketing selectivos a empresas asociadas o eventos especiales cerca del domicilio de cada cliente. Algunas organizaciones venden espacio publicitario en las facturas. La segmentación precisa hace que esta función sea más atractiva para los anunciantes potenciales.
- La información de compra de productos extraída de documentos se puede utilizar para activar correos electrónicos de seguimiento para solicitar opiniones y comentarios de los clientes.
- La extracción de datos de documentos puede ser mucho más eficiente que la recuperación de la misma información de bases de datos dispersas. Los diseñadores de documentos ya han realizado el trabajo de conectar datos de varias fuentes. Las organizaciones no tendrán que depender de recursos de TI para obtener los datos que necesitan para mejorar las operaciones, reducir los costos, responder a consultas legales o mejorar las comunicaciones con los clientes.
- Los propietarios de documentos no deben pasar por alto el valor oculto de los elementos que ya poseen. Los documentos archivados suelen representar la representación más precisa de los datos tal como existían durante un período de tiempo determinado. Si se cuentan con las herramientas adecuadas para extraer los datos, las empresas descubrirán que sus documentos son una valiosa fuente de información de fácil adquisición.
La extracción de datos de documentos puede ser mucho más eficiente que la recuperación de la misma información de bases de datos dispersas. Los diseñadores de documentos ya han realizado el trabajo de conectar datos de varias fuentes. Las organizaciones no tendrán que depender de recursos de TI para obtener los datos que necesitan para mejorar las operaciones, reducir los costos, responder a consultas legales o mejorar las comunicaciones con los clientes.
Los propietarios de documentos no deben pasar por alto el valor oculto de los elementos que ya poseen. Los documentos archivados suelen representar la representación más precisa de los datos tal como existían durante un período de tiempo determinado. Si se cuentan con las herramientas adecuadas para extraer los datos, las empresas descubrirán que sus documentos son una valiosa fuente de información de fácil adquisición.











