revues@enssib.fr
 
Expertise technique et organisationnelle

 

  Guylaine Beaudry,
Gérard Boismenu
La production d'une version électronique

Formats de production, de diffusion, et d'archivage
Les formats structurés (SGML et XML)
Le PDF et le Postscript
Les formats images
Chaînes de traitement : différentes options
Chaînes de production : modèles et enjeux
La numérisation retrospective
La production des formats de diffusion de l'information
Les métadonnées

Les formats de diffusion sont tous produits à partir d'une seule source, soit le document XML de référence.

La consultation à l'écran

La consultation des articles à l'écran n'est pas toujours d'un grand confort et, comparativement à l'imprimé, la vitesse de lecture est réduite et la capacité de rétention de l'information est plus faible (Grabmeier J., 2000). Mais il reste que l'ordinateur fournit des outils très utiles et performants pour l'exploitation des informations disponibles dans le Web. Cela est d'autant plus vrai lorsque l'environnement de consultation offre des aides à la lecture comme des annotations personnelles ou partagées ou encore des signets.

Le format de diffusion en ligne est indépendant de l'encodage initial du document en format XML. En effet, à partir d'articles de revues encodés en XML selon le même schéma, il est possible d'obtenir des présentations visuelles très variées pour les articles des différentes revues. Ainsi, il est facile de respecter les chartes graphiques des revues, et même de les mettre en valeur en utilisant les avantages de l'électronique.

Le format HTML - plus précisément le Dynamic HTML (DHTML) - constitue, encore pour quelques années au moins, le format de choix pour la diffusion d'information électronique. La conversion des documents XML vers un format DHTML se fait facilement et automatiquement, moyennant un effort initial de programmation.

Depuis novembre 1999, la norme XSLT, issue du W3C, est un langage de choix pour de telles transformations. Les processeurs XSLT sont particulièrement efficaces pour des documents de taille petite ou moyenne, ce qui est tout à fait approprié pour les articles de revues. Cette norme facilite, de plus, la création de feuilles de styles modulaires qui permettent de créer plusieurs variations d'une même transformation. Ce dernier aspect est important, car pour offrir un grand confort de navigation aux utilisateurs, il y a lieu de préconiser la production de plus d'une version DHTML des articles. De façon à respecter l'image graphique de chaque revue, cette partie de la chaîne de traitement implique la création d'un grand nombre de programmes de conversion légèrement différents, d'où l'importance d'une approche modulaire, ce que permet la norme XSLT.

Les conversions au format HTML peuvent être effectuées de façon dynamique, c'est-à-dire à chaque fois qu'un article est demandé sur le serveur de diffusion. Elles peuvent aussi être faites à l'avance et déposées sur le serveur. La première approche minimise les besoins en espace disque, mais demande une plus grande puissance du serveur. La deuxième approche inverse ces besoins. Puisque les articles, une fois publiés, ne sont pas modifiés, et que le coût de l'espace disque est peu élevé, le pré-traitement des articles semble l'avenue la plus appropriée. Toutefois, si on veut offrir aux utilisateurs une représentation HTML qui dépend de certains paramètres inconnus à l'avance, une approche dynamique est nécessaire. Par exemple, si le serveur offre des outils d'annotation publique et privée, la présentation des documents dépendra des annotations et des préférences d'affichage, ce qui exclut le pré-traitement des articles.

La diffusion des documents XML directement dans le Web se fait de deux façons. D'abord, on peut associer à ces documents une feuille de style CSS. Cette approche est peu recommandée en raison de ses limites : les feuilles de styles CSS permettent de créer une mise en page correcte d'un document XML, mais offrent peu d'intérêt en matière de dynamisme des pages ou de mise en contexte de l'information dans l'ensemble d'un site. L'autre approche consiste à associer une feuille de style XSLT au document et, dans ce cas, la transformation s'effectue sur le poste client. Pour l'instant, seul le navigateur Internet Explorer offre cette fonction. À moyen terme, il s'agit d'une stratégie intéressante, pour minimiser à la fois les traitements du côté du serveur et l'espace disque requis.

L'impression à distance

L'impression à distance consiste à fournir aux lecteurs, habituellement via Internet, un document mis en page et destiné à être imprimé sur leur imprimante personnelle. Cette approche évite la lourdeur de l'impression professionnelle et répond à une diversité de besoins. De plus, les lecteurs peuvent imprimer seulement les pages ou les articles dont ils ont besoin, ce qui évite une consommation démesurée de ressources.

Les logiciels de navigation Web permettent d'imprimer les documents consultés. Étant conçus pour la consultation en ligne, la mise en page de ces documents (le plus souvent HTML) n'est pas de bonne qualité, car les documents n'ont pas nécessairement été préparés pour l'impression. Le meilleur format d'impression à distance reste le format PDF d'Adobe. La production de ces documents implique les mêmes opérations que la production des documents Postscript. Puisque l'impression professionnelle est encore d'actualité, il est tout à fait logique d'utiliser le produit intermédiaire de l'impression professionnelle, soit le document Postscript, pour obtenir un document PDF. Cette conversion est automatique et ne pose pas de problème particulier.

Par conséquent, la production des versions pour l'impression professionnelle et pour l'impression à distance est semblable ; seule une étape automatique s'ajoute pour obtenir des documents PDF à partir des documents Postscript. Notons au passage, que lors de cette conversion, des ajustements peuvent être effectués pour, notamment, réduire la qualité des images, évitant ainsi de trop grands temps de téléchargement des articles.

L'impression professionnelle

L'impression professionnelle permet d'obtenir des articles sur support papier, avec une très bonne qualité d'impression et habituellement reliés en numéros. Cette impression demande une expertise et des équipements particuliers. Cette tâche est habituellement effectuée par des sociétés spécialisées : l'imprimeur reçoit les documents mis en page, le plus souvent en format Postscript1.

La technique la plus intéressante pour produire des documents Postscript à partir des documents XML est d'utiliser un logiciel de mise en page. Il s'agit d'importer l'information (les articles) dans un tel logiciel et de produire un document Postscript à la suite de la mise en page. En raison de la complexité de la mise en page pour l'impression, cette opération peut difficilement se réaliser de façon purement automatique, mais on peut s'en approcher. Par exemple, les logiciels Quark XPress2 et FrameMaker3 importent de l'information dans un langage balisé (XPress Tags pour XPress, MIF pour FrameMaker) que l'on peut obtenir assez facilement par conversion d'un document XML. Il existe également des solutions entièrement automatisées, avec par exemple 3B24 ou Adept Publisher5, mais les efforts de paramétrage et de programmation sont très grands. Il existe une version de FrameMaker (FrameMaker+SGML) qui importe directement des documents SGML, mais cette option n'est pas particulièrement intéressante pour notre chaîne de traitement basée sur XML, entre autres parce qu'il faut de toutes façons manipuler le XML pour le convertir en SGML et l'adapter aux exigences de l'impression.

Il est difficile de produire un document entièrement imprimé de façon automatique, sans vérification manuelle, mais la chaîne de traitement proposée permet de minimiser ces interventions humaines, si bien que les premières épreuves pour l'impression se font presque automatiquement, avec seulement quelques petits ajustements manuels. Éventuellement, il sera possible de créer les épreuves papier avec la version XML et une feuille de styles CSS appropriée mais, pour l'instant, le support CSS est trop peu développé dans les logiciels pour utiliser cette approche.

Mise à jour : vendredi 23 février 2001
Droits d'auteur réservés Guylaine Beaudry / Gérard Boismenu - février 2001

 

 
édition
économique
marketing
juridique
technique
  papier / électronique
infrastructure
version électronique
diffusion
archivage
glossaire
bibliographie
usages
services
étude de cas
débats

Accueil

   
   

Arborescence du site Crédits/contacts
Site optimisé
en 800X600
pour Netscape 4
et IE4

 

 

Toute reproduction à des fins autres que strictement personnelles et notamment toute reproduction destinée à une publication électronique, papier, ou audio, destinée à des tiers, est strictement prohibée et constitutive du délit de contrefaçon.