Nous vous aidons à comprendre la richesse de l’AFP, la terminologie et les techniques requises pour l’indexer et la transformer, ainsi que son importance dans la migration des archives.
L’AFP, développé par IBM dans les années 80, est à l’origine un langage de description de page propriétaire utilisant le concept d’adressage en tous points pour permettre l’impression de texte et d’images sur des imprimantes connectées à l’ordinateur central. Il a évolué pour devenir un ensemble coordonné de normes de création, de visualisation, d’archivage et d’impression de documents. L’AFP est aujourd’hui maintenu et amélioré par le Consortium AFP et la norme ISO 18565:2015, et a été publié pour documenter et définir l’utilisation de l’AFP en tant que flux de données d’archivage.
Glossaire
L’AFP est une véritable soupe d’acronymes. La principale norme AFP, la référence MO:DCA (Mixed Object Document Content Architecture), décrit les objets AFP et la manière dont ils interagissent et fonctionnent ensemble. Cette norme est soutenue par sept autres normes de contenu d’objet qui fournissent des détails sur les ensembles d’opérateurs plus complexes. Il existe de nombreuses options et il n’est pas garanti que deux produits conformes traitent le même flux de données d’entrée de la même manière.
| MO:DCA | Architecture de contenu de document d’objet mixte |
| AFP GOCA | Architecture de contenu d’objets graphiques pour l’AFP |
| BCOCA | Architecture de contenu d’objet de code à barres |
| CMOCA | Architecture de contenu des objets de gestion des couleurs |
| FOCA | Font Object Content Architecture (architecture de contenu d’objet de police) |
| IOCA | Architecture de contenu d’objet d’image |
| MOCA | Architecture de contenu des objets de métadonnées |
| PTOCA | Architecture de contenu de texte et d’objet de présentation |
| IPDS | Flux de données de l’imprimante intelligente |
Fichiers AFP
La plupart des fichiers AFP suivent la structure d’objet décrite dans les normes. Un fichier d’impression comprend un groupe de ressources et un certain nombre de documents, chacun comprenant un certain nombre de pages. Ces pages correspondent à l’ordre naturel de lecture, la disposition sur la page physique imprimée étant déterminée par la ressource Form Definition. Chaque page comprend un certain nombre d’objets textuels et graphiques, qui adhèrent à la norme appropriée et peuvent à leur tour faire référence à des ressources telles que des polices de caractères ou des images.
Défis
Toutes les AFP valides et imprimables ne sont pas faciles à traiter et à réutiliser. Examinez les exemples suivants :
- Chaque page du document est une image, un fac-similé, sans caractères, mots ou polices de caractères réels référencés dans le fichier AFP. Une technologie de reconnaissance optique de caractères est donc nécessaire pour extraire les données.
- Le fichier AFP comprend des fichiers PDF incorporés dans un conteneur d’objets AFP.
- Métadonnées de police manquantes ou métadonnées ne correspondant pas aux caractères de la police
- Polices personnalisées créées dynamiquement et comprenant des caractères provenant de plusieurs polices
Opportunités
Grâce à une meilleure compréhension des objets AFP et de leurs relations, ainsi qu’à la connaissance de leur utilisation au sein d’une archive, vous pouvez alimenter vos archives actuelles sans modifier vos plateformes de création de documents. Vous pouvez fournir les services de représentation et de livraison électroniques requis par les clients internes et externes et vous avez les connaissances nécessaires pour migrer les archives existantes vers des plateformes de nouvelle génération, ce qui apporte de nombreux avantages à votre entreprise et crée une nouvelle valeur à partir d’anciennes données.
La semaine prochaine, nous approfondirons la question de l’AFP en publiant des démonstrations techniques pour vous aider davantage. Inscrivez-vous ici pour recevoir des notifications pour ces articles et d’autres articles de cette série.












