ページを選択

ドキュメントデータマイニング – 未開拓の価値の鉱脈

導入

データ マイニングは、科学捜査のコンピューター アナリストが膨大なデジタル データ ストアから情報を拾い集め、それを使用して傾向や関連する動作を特定するというイメージを思い起こさせる、エキゾチックな響きの言葉です。マイニング操作は複雑で謎めいている場合もありますが、抽出されたデータの多くの用途では、隠れたパターンや相関関係の検索は行われません。有用なデータの豊富なソースであり、見落とされがちなのが、日常のビジネス ドキュメントです。

ドキュメントには、企業全体のさまざまなソースから収集された情報がすでに含まれています。このデータにより、ドキュメント操作をより効率的かつ正確にしたり、新しいテクノロジを活用したりすることができます。また、企業が顧客をより深く理解し、より適切なコミュニケーションを構築し、顧客体験を向上させるのに役立ちます。さらに、アーカイブされたドキュメントからマイニングされたデータは、企業がマーケティング戦略を策定したり、規制指令に従ったりするのに役立ちます。

抽出されたドキュメント データは、インサータ ファイルに取り込んだり、アーカイブされたページのインデックスを作成したり、メッセージを別の形式に変換してアクセス可能な通信を作成したりすることができます。また、トランスプロモーション メッセージングの推進、印刷ファイルの再順序付け、または家庭内戦略の一環としての郵便物の結合にも使用できます。

ホワイト ペーパー ワークフローの利点を活用したいと考えている企業は、印刷ファイルからデータを抽出することに関心を持つでしょう。複数のジョブを統合して印刷物を作成した後、それらのジョブから生成された郵便物の整合性を管理することは不可欠です。元のページから抽出されたデータで作成されたバーコードにより、すべてのページが仕上げ装置によって処理されます。抽出されたデータにより、文書が破損した場合でも、自動再印刷が可能になります。

サービスプロバイダーにとっての競争上の優位性

印刷/郵送サービス プロバイダーは、印刷および配布を担当する文書の作成に使用された生データにアクセスできないことがよくあります。唯一のデータ ソースは印刷ファイル内にあります。郵便処理用の住所データの抽出やページ数の決定などの基本的な操作でさえ、印刷されたページに存在するデータを検査、削除、場合によっては置き換える機能に依存しています。

データ マイニング ツールを使用すると、印刷サービス プロバイダーは独自の処理ワークフローを効率化し、顧客に付加価値を提供できます。たとえば、投資口座の明細書を作成するショップでは、残高の多い口座を他の印刷物から分離できます。レポートを追加したり、明細書を高品質の紙に印刷したり、明細書を折りたたんで窓付き封筒に入れる代わりに、ページをポートフォリオ バインダーにまとめたりできます。データ マイニングによって強化された機能を提供することで、印刷サービス プロバイダーは競合他社との差別化を図り、より高い料金を請求できます。

外部データと組み合わせる

場合によっては、抽出されたデータをソース ドキュメント以外の情報と結合して、まったく新しいドキュメントを作成し、紙またはデジタルで配信できます。たとえば、企業はクレジットカード取引データと顧客の人口統計情報を組み合わせて、顧客の購入、収入レベル、または年齢に対応する関連オファーを作成できます。オファーは、クレジットカードの請求書に埋め込まれた広告として、またはデジタル請求書の行動喚起として配信されるか、または事前に印刷されたマーケティング資料を封筒に選択的に挿入するために使用できます。

別の例として、個々の顧客に関するデータは CRM データベースに存在していても、ドキュメント自体には存在しない場合があります。CRM システムから詳細情報にアクセスするには、印刷ファイルからアカウント番号などの一致キーを抽出する必要があります。これは、顧客が能力やリソースに応じて異なるドキュメント形式を要求する可能性があるため、アクセス可能なドキュメントを作成するときに重要です。顧客は、ドキュメントの拡大印刷、点字、または聴覚による配信形式を必要とする場合があります。企業は、CRM データベースに記録される合理的配慮の要求を満たす義務があります。ドキュメント データを外部データ ソースに接続することは、法律に準拠するための効率的な方法です。

ドキュメントからデータを取得する理由

ドキュメントをデータ ソースとして参照するのは奇妙に思えるかもしれませんが、元のソースからデータを取得する代わりに、このすぐに利用できる情報にアクセスすることには利点があります。企業全体に散在する遠隔地のデータベースに保存されているレコードにアクセスするには、IT スペシャリストのサービス、安全な接続、およびデータ構造の知識が必要です。

このような取り組みのための資金とサポートを得ることは、長くて不確実なプロセスになる可能性があります。ほとんどの場合、必要な情報を文書から直接引き出すことは、プロジェクトを妥当な時間内に完了させる数少ない方法の 1 つです。

ドキュメント アーカイブは静的ですが、データ ウェアハウスには通常、最新の情報のみが含まれます。過去の情報を必要とするプロジェクトでは、その時点で作成されたページに保存されている正確なデータが見つかる可能性が高くなります。

請求書や明細書の内容は、多くの異なるシステムから取得されることが多いため、データの収集は、顧客とのコミュニケーションに関する組織の規制義務を満たすために保持する必要がある取引の公式記録と見なされます。この重要なデータの唯一の信頼できるソースとして、情報が完全かつ正確であることは明らかに不可欠です。

良い例としては、法的証拠開示が挙げられます。訴訟、監査、または規制当局の調査に対応する企業は、困難に陥ることがあります。複数のシステムの古いバージョンに保存されているデータ (時間の経過とともに変更されている可能性があります) を見つけて抽出するには、外部のサービス プロバイダーに費用を費やしたり、会社の IT スタッフの熟練した人材に依頼したりする必要があります。いずれにしても、コンプライアンスは困難で、混乱を招き、費用もかかります。

包括的なデータ履歴がなければ、文書アーカイブから収集された情報は法的義務を満たすことができません。生データを扱う場合には数か月かかる作業も、電子証拠開示データを文書保管庫から取り出すことができれば数週間で完了します。

適切なツールの使用

これは、ドキュメント データの抽出が簡単だという意味ではありません。ドキュメントは、機械ではなく人間が使用および解釈するために設計されています。タグや固定ファイル構造など、プログラマがデータベース内のデータを識別するために使用する一般的な項目は、印刷ファイルには存在しません。ドキュメントにロックされている特定の情報を見つけるには、データ マーカー、オフセット、ルール、検証などの手法が必要です。ドキュメントには、例外や特殊な状況を引き起こす条件が頻繁に含まれており、これらはデータ マイニング操作の一部として処理する必要があります。正しいデータを分離するには、物理的なページの位置、検査、およびロジックを組み合わせる必要があります。データを検索して解釈するための優れたツールがなければ、印刷ファイルから情報を抽出するプロセスは面倒です。不可能になることもあります。

文書からデータをマイニングするのは、多くの場合、フォーム・アナリスト、文書設計者、あるいはビジネス・ユニットのスタッフである。彼らはコンピュータープログラマーではない。データを検索し抽出するルーチンを構築するには、グラフィカルな方法で、使いやすいインターフェイスを使用しなければならない。画面上でデータフィールドをハイライトすることは、手作業でxとyの座標を計算したり、IF-THEN-ELSEロジックを手で書いたりするよりも、限りなく簡単である。 アーカイブに保存されたドキュメント内に埋め込まれた非印刷データ要素を作成する機能は強力な機能であり、将来アーカイブにアクセスする際のデータ抽出が大幅に簡素化されます。

抽出されたデータの活用

  • 抽出されたドキュメント データの用途はほぼ無限です。印刷技術とデジタル配信チャネルの進歩により、ドキュメント開発者はメッセージをこれまで以上にパーソナルで、関連性が高く、効果的なものにすることが可能になりました。次に例をいくつか示します。
  • 銀行取引明細書の配送先住所データにより、新しく開設された支店の近くに住む顧客に対して地図や個別の運転ルート案内を表示できます。
  • 商品購入取引の詳細から QR コードを生成し、購入した商品に関するよくある質問に回答する説明ビデオにアクセスできます。これにより、商品の返品が減り、顧客満足度が向上します。
  • 過去の支払いに関する取引情報を使用することで、常にオンラインで支払いを行う顧客への送金封筒の郵送を抑制できます。
  • 請求書に記載されているサービスの分析により、アップグレードや追加サービスに関するマーケティング メッセージを生成することができ、顧客がすでに加入しているサービスに関するマーケティングを企業が行うことを防ぐことができます。
  • アーカイブに保存されたドキュメント内に埋め込まれた非印刷データ要素を作成する機能は強力な機能であり、将来アーカイブにアクセスする際のデータ抽出が大幅に簡素化されます。
  • 請求書に含まれるアカウント、顧客、請求書の情報を使用して、ペーパーレス請求への移行に対する個別のインセンティブを紹介する Web ページにつながる印刷された個人 URL が作成されます。
  • 取引文書の住所情報により、パートナー企業や各顧客の自宅近くで開催される特別イベントに関する選択的なマーケティング メッセージが送信されます。請求書の広告スペースを販売する組織もあります。正確なターゲティングにより、この機能は潜在的な広告主にとってより魅力的になります。
  • ドキュメントから抽出された製品購入情報を使用して、顧客のレビューやフィードバックを求めるフォローアップ メールをトリガーできます。
  • ドキュメントからデータをマイニングする方が、散在するデータベースから同じ情報を取得するよりもはるかに効率的です。ドキュメント設計者は、さまざまなソースからのデータを結合する作業をすでに行っています。組織は、業務の改善、コストの削減、法的問い合わせへの対応、顧客とのコミュニケーションの強化に必要なデータを取得するために IT リソースに頼る必要がなくなります。
  • ドキュメントの所有者は、すでに所有しているアイテムに隠された価値を見逃してはなりません。アーカイブされたドキュメントは、多くの場合、特定の期間に存在していたデータの最も正確な表現を表しています。データを抽出する適切なツールがあれば、企業はドキュメントが簡単に入手できる貴重な情報源であることに気付くでしょう。

ドキュメントからデータをマイニングする方が、散在するデータベースから同じ情報を取得するよりもはるかに効率的です。ドキュメント設計者は、さまざまなソースからのデータを結合する作業をすでに行っています。組織は、業務の改善、コストの削減、法的問い合わせへの対応、顧客とのコミュニケーションの強化に必要なデータを取得するために IT リソースに頼る必要がなくなります。

ドキュメントの所有者は、すでに所有しているアイテムに隠された価値を見逃してはなりません。アーカイブされたドキュメントは、多くの場合、特定の期間に存在していたデータの最も正確な表現を表しています。データを抽出する適切なツールがあれば、企業はドキュメントが簡単に入手できる貴重な情報源であることに気付くでしょう。

アカウント登録が必要な場合は、ここをクリックしてください。