|
Numérisation
OCRisation
Conversion
Stockage
Création des méta-données
et indexation
Mise en ligne
Paiement électronique / Gestion
des abonnements
Numérisation
L'étape de numérisation
consiste à transformer le document papier en un document
électronique. Le coût de cette numérisation
est fonction d'une part du matériel de base disponible
et d'autre part du niveau qualitatif du résultat souhaité.
Afin de définir un ensemble de normes techniques, on
peut se baser sur les préconisations issues du projet
DIEPER
qui semble aujourd'hui une référence stable
dans ce domaine :
Adopter une résolution minimale de 600dpi pour
la numérisation.
Sauvegarder les images en TIFF.
Convertir en GIF, PNG ou JPEG pour la visualisation
sur le Web
On peut également citer l'étude sur la numérisation
de la sous-direction des bibliothèques universitaires
.
Ces choix techniques doivent permettre de garantir une numérisation
d'un niveau qualitatif suffisant pour assurer une pérennité
des documents numériques ainsi créés.
En effet, le niveau qualitatif de cette étape est capital
car il constitue la base des étapes de reconnaissance
de caractères et de balisage qui suivent.
A terme, le corpus issu de la numérisation a une visée
patrimoniale puisqu'il constitue le point de départ
de la conversion vers XML ou un autre format. C'est-à-dire
qu'il devra être construit et stocké de manière
à pouvoir être réutilisé en cas
d'évolution des formats nécessitant une rétro-conversion
à partir des documents originaux.
Le second point qui conditionne le niveau de coût de
cette étape est le matériel de base dont dispose
la revue. Le coût de numérisation sera sensiblement
différent selon qu'il s'agit de numériser des
numéros de la revue démontables ou des numéros
plus anciens qu'il n'est pas possible d'ouvrir à 180°.
Le travail de retouche de l'image obtenue après la
numérisation sera considérablement plus important.
Cet aspect de retouche des documents numérisés
est d'autant plus important en fonction de la politique de
diffusion choisie. Si la politique retenue est de diffuser
les contenus en mode texte, la numérisation doit être
faite dans l'optique de l'étape de reconnaissance des
caractères. Si l'orientation est un accès aux
documents dans un format image, les exigences pour la numérisation
seront liées à la qualité visuelle du
produit offert aux utilisateurs.
Au niveau des coûts, le coût matériel de
la numérisation a fortement diminué en raison
de la diffusion de l'équipement nécessaire.
De plus, le coût de fonctionnement de ce type d'équipement
est faible car il ne nécessite pas de consommables.
Le poste principal reste les ressources humaines. Le travail
de numérisation et surtout celui de retouche des documents
numérisés est très coûteux en temps.
JSTOR l'évalue entre 1 et 3 $ par page.
Le coût de cette phase est d'autant plus élevé
que l'antériorité visée est importante.
Globalement, le coût de la numérisation réside
principalement dans le volume horaire qu'elle nécessite.
Cette étape doit également s'effectuer avec
des exigences de qualité impliquant un certain niveau
d'équipement et de compétence.
Mise à jour
: jeudi 17 janvier 2002
Droits d'auteur réservés Benoît Epron-
janvier 2002
|