revues@enssib.fr
 
Expertise technique et organisationnelle

 

  Guylaine Beaudry,
Gérard Boismenu
La production d'une version électronique

Formats de production, de diffusion, et d'archivage
Les formats structurés (SGML et XML)
Le PDF et le Postscript
Les formats images
Chaînes de traitement : différentes options
Chaînes de production : modèles et enjeux
La numérisation rétrospective
La production des formats de diffusion de l'information
Les métadonnées

La numérisation rétrospective

La numérisation rétrospective consiste en la création d'un document électronique à partir d'un document, le plus souvent, sur support papier1. Les articles de revues dont on possède la source électronique peuvent être convertis au format "Word++" et suivre le reste de la chaîne. Les articles dont on ne possède pas la source doivent être numérisés et traités par reconnaissance optique de caractères, ou encore re-saisis, puis amenés dans le format "Word++" et suivre le reste de la chaîne.

Cette dernière solution suppose de consentir de très grands efforts et implique des coûts importants, ce qui rend difficile la mise en route de grands projets de numérisation rétrospective et d'application d'une chaîne de traitement XML. À titre indicatif, gardons à l'esprit que la numérisation rétrospective en format image coûte dix fois moins cher la page que la numérisation + ROC. Il faut ensuite ajouter les coûts de traitement pour la vérification des fichiers (coquilles ROC) et la conversion vers le XML. Pour cette seule considération, on peut être porté à utiliser une approche différente, qui consiste à diffuser en mode image les articles déjà publiés, dans un format PDF par exemple, ce qui permet aux lecteurs de les consulter assez aisément. Cette solution temporaire doit être implantée en pensant à l'avenir, afin de rendre possibles de futurs traitements en reconnaissance optique de caractères, voire de conversion vers XML. En plus de respecter un niveau de qualité de la numérisation, le format image retenu doit assurer l'archivage à long terme, le format TIFF par exemple, et permettre la récupération des fichiers pour les traitements futurs.

Numérisation rétrospective (PDF image)

Comme il est impossible d'effectuer une recherche plein texte dans un format image, des métadonnées doivent être associées aux articles numérisés pour assurer l'intégration des collections courante et rétrospective par l'outil de recherche et l'interface de navigation. L'ajout de ces métadonnées constitue toutefois une tâche manuelle qui peut être fastidieuse, même s'il est possible de récupérer une partie des métadonnées depuis une base de données bibliographiques.

Mise à jour : vendredi 23 février 2001
Droits d'auteur réservés Guylaine Beaudry / Gérard Boismenu - février 2001

 

1 La numérisation rétrospective peut également se faire à partir de microformes. Voir à ce sujet le projet Early Canadian Online/Notre mémoire en ligne

 

 
édition
économique
marketing
juridique
technique
  papier / électronique
infrastructure
version électronique
diffusion
archivage
glossaire
bibliographie
usages
services
étude de cas
débats

Accueil

   
   

Arborescence du site Crédits/contacts
Site optimisé
en 800X600
pour Netscape 4
et IE4

 

 

Toute reproduction à des fins autres que strictement personnelles et notamment toute reproduction destinée à une publication électronique, papier, ou audio, destinée à des tiers, est strictement prohibée et constitutive du délit de contrefaçon.