revues@enssib.fr
 
Expertise technique et organisationnelle

 

  Guylaine Beaudry,
Gérard Boismenu
La production d'une version électronique

Formats de production, de diffusion, et d'archivage
Les formats structurés (SGML et XML)
Le PDF et le Postscript
Les formats images
Chaînes de traitement : différentes options
Chaînes de production : modèles et enjeux
La numérisation retrospective
La production des formats de diffusion de l'information
Les métadonnées

Chaînes de traitement : différentes options

Nous avons constaté d'entrée de jeu que plusieurs façons de faire étaient à l'œuvre dans la publication des revues. Tout en reconnaissant que le scénario XML-intégrée est sans doute le plus porteur et systématique pour la transition vers l'adoption de l'édition électronique, les autres façons de faire méritent une mise en situation. Précisément, ces différentes façons de faire se caractérisent diversement selon les enjeux de la publication électronique.

Pour simplifier le traitement, nous avons ramené les options à quatre (PDF-texte, HTML, Quark-XML, XML-intégrée) et donné schématiquement les caractéristiques de chacune des options pour les principaux indicateurs, regroupés par grandes fonctions de l'édition électronique des revues. Quelque 13 indicateurs sont énumérés et sur lesquels des précisions doivent être apportées.

La fonction production peut être plus ou moins étendu selon l'introduction des fonctionnalités de l'électronique. C'est pourtant là une condition indispensable pour assurer une transition faisant, à terme, de la version électronique de la revue la version première de référence - non seulement pour la consultation, mais bien en amont au moment de la rédaction et de l'édition. Cela favorise l'achèvement de la transition dans la mesure où, aussi longtemps que la version électronique sera dérivée de la chaîne de traitement pour le papier, l'environnement électronique restera tributaire de celui de l'imprimé.

  • Cela a évidemment des conséquences techniques, mais surtout pose la question centrale de la capacité organisationnelle de mettre en place une chaîne de traitement en langage structuré (XML-intégré), fondamentalement basée sur un traitement électronique au début du processus de production dont les différents formats de diffusion découleraient. Les autres avenues sous-entendent un traitement préalable pour le papier, puis un traitement électronique. Dans ce cas, les distinctions se font sur la base du type de traitement électronique ; nous allons du traitement PDF-texte vers un traitement pour le Web, avec le HTML, ou encore en langage structuré, mais issu d'un traitement préalable sur logiciel de mise en page (d'où la mention Quark-XML).

  • Ces choix conditionnent pour une bonne part les formats de production et de préservation, de même que les logiciels avec lesquels le travail est effectué. De façon générale, il est plus approprié, moins contraignant et plus économique d'utiliser des formats ouverts et des logiciels libres ou gratuits (pour le milieu de l'éducation, tout au moins). De là, la distinction basée sur le caractère propriétaire et non-propriétaire des logiciels et formats.

  • De même, le mode de production des métadonnées — qui décrivent les attributs et le contenu des articles et qui servent au repérage, à la gestion, à la description, à l'accès et à la conservation de l'information — doit, au mieux, procéder par extraction automatique de l'information des articles eux-mêmes, sinon cela impose une procédure manuelle qui est fastidieuse et exigeante. D'où, la prise en compte de cette dimension.

Pour la diffusion, une série d'interrogations permet de qualifier les quatre options retenues.

  • Selon le format de production utilisé, comme format maître, différents formats pourront éventuellement être générés. Dans certains cas, comme avec le PDF, cette possibilité n'existe pas, alors qu'à l'autre bout du spectre, l'utilisation d'un format riche, comme le XML, permettra de générer plusieurs formats dans une période donnée.

  • Les formats ont aussi une incidence sur les capacités de recherche et les conditions pour améliorer l'efficacité des résultats, en termes de diminution du bruit et du silence. Sur ce plan, la possibilité de procéder à la recherche structurée constitue un avantage sur la seule recherche plein texte. Notons au passage que le PDF-image ne permet ni la recherche plein texte, ni la recherche structurée.

  • Les besoins pour la diffusion des documents évoluent et se diversifient dans le temps. Plus le format de production est riche, plus la gamme des possibles s'élargit, ce qui constitue un avantage. Nous avons utilisé une variable dichotomique pour la réutilisation des données, en termes de facile et difficile.

Tant et aussi longtemps qu'une procédure fiable d'archivage des documents ne sera pas établie publiquement, l'éditeur de revue conserve une responsabilité à cet égard. D'une façon plus modeste, l'éditeur de revue, dans le contexte de la diffusion électronique, doit s'assurer de la continuité et de la fiabilité du service de mise en ligne, ainsi que de la disponibilité des articles. Cela demande nécessairement la préservation des documents, en dépit et au-delà de l'obsolescence technologique, tant pour les logiciels que pour les supports. Il est, en ce sens, primordial de tenir compte d'un indice de pérennité lié aux différents formats.

Les ressources qui doivent être mobilisées varient selon la chaîne de traitement retenue. Les coûts de production sont d'abord et avant tout fonction de l'expertise nécessaire à la réalisation du projet, alors que les coûts en équipement (machines et logiciels) sont relativement semblables : les machines sont comparables et les logiciels compte relativement peu dans l'ensemble.

Les quatre voies de transitions ont été schématiquement caractérisées pour chaque indicateur, ce que livre le tableau suivant. Les principaux constats qu'il contient sont repris dans la section suivante et intégrés à la présentation des grandes données concernant chacune de ces quatre voies de transition.

Indicateurs des différents modèles

 
PDF-texte
HTML
Mise en page vers XML
XML-intégré
Production        
processus (électronique version première [1] ou dérivé le papier [2])
2
2
2
1
format (non-propriétaire [1] ou propriétaire [2])
2
1 et 2
1 et 2
1 et 2
logiciel (non-propriétaire [1] ou propriétaire [2])
2
1 et 2
1 et 2
1 et 2
métadonnées (productionautomatique [1] ou manuelle [2])
2
2
1
1
Diffusion
formats (génération automatique de plusieurs formats)
Non
Non
Oui
Oui
recherche (structurée [1] plein texte [2])
2
2
1 et 2
1 et 2
réutilisation des données (facile ou difficile)
Difficile
Difficile
Facile
Facile
Préservation
indice de pérennité
Faible
Moyen
Elevé
Elevé
Ressources
coûts production
Faible
Moyen
Elevé
Elevé
coûts équipement
Faible
Faible
Moyen
Moyen
expertise
Faible
Moyen
Elevé
Elevé

Mise à jour : vendredi 23 février 2001
Droits d'auteur réservés Guylaine Beaudry / Gérard Boismenu - février 2001

 

 
édition
économique
marketing
juridique
technique
  papier / électronique
infrastructure
version électronique
diffusion
archivage
glossaire
bibliographie
usages
services
étude de cas
débats

Accueil

   
   

Arborescence du site Crédits/contacts
Site optimisé
en 800X600
pour Netscape 4
et IE4

 

 

Toute reproduction à des fins autres que strictement personnelles et notamment toute reproduction destinée à une publication électronique, papier, ou audio, destinée à des tiers, est strictement prohibée et constitutive du délit de contrefaçon.