revues@enssib.fr

 

 

 

Etude de cas

 

 

Présentation de la bibliothèque électronique SciELO et de ses DTD

Marcilio de Brito
Docteur en science de l'information et de la communication
Professeur invité à l'ENSSIB


Module balisage

Ce module est composé par les programmes Markup et SGML Parser dont la finalité est de permettre le balisage des textes selon les DTD SciELO. Le programme Markup est une interface qui permet l'identification visuelle et le balisage manuel ou automatique des segments, groupes ou éléments individuels d'un texte.

Description du groupe de titre de la DTD SciELO
(Source : http://www.scielo.org/ [juin 2001])

_______________________________________________________

<!ELEMENT article - (front. body. Back?) + (%i.float;)>
<!ELEMENT front - (titlegrp, authgrp?, bibcom?)>
<!ELEMENT titlegrp - (%m.title;)+>
<!ENTITY %m.title "title, subtitle?">
<!ELEMENT title - CDATA>
<!ATTLIST title
.................language CDATA #REQUIERED>
<!ELEMENT subtitle - CDATA>

_______________________________________________________


Le programme Markup a été développé avec le langage Visual BasicTM et fonctionne sur le traitement de texte MS-WordTM, il se présente sous la forme d'une interface avec une barre d'outils contenant les balises destinées aux premiers niveaux de traitement du texte. Les étapes successives de balisage sont assistées par le programme tout au long de l'opération, elle vise à garantir l'intégrité du balisage avec la DTD respective.
Le processus de balisage commence par une identification visuelle de l'élément suivie de la sélection du texte et par la confirmation de la balise présentée dans la barre d'outils. Le balisage va ainsi se répéter jusqu'à la fin du texte par l'affectation successive des balises. Le texte est finalement sauvegardé sous forme d'un fichier HTML.
Quand les références bibliographiques suivent rigoureusement une des normes bibliographiques admises, le programme procède au marquage automatique des références bibliographiques. La bibliographie étant la partie la plus longue du balisage, cette procédure automatique réduit le temps total de préparation d'un article moyen de 84 minutes à 47minutes. Un numéro de revue ayant environ 15 articles peut ainsi être codé en 2 jours de travail à raison de 8 heures par jour.
Le Parser SGML de SciELO (SSP) est inspiré du programme du domaine public développé par James CLARK (SP1), il est utilisé pour valider le balisage effectué avec les DTD. Les textes ainsi validés sont aptes pour le module des convertisseurs.
Il était prescrit que les éditeurs assureraient eux-mêmes le balisage des textes par l'utilisation des modules d'assistance fournis par la coordination du système. A l'heure actuelle (octobre 2001) il semblerait que ces modules seraient devenus des produits, ou des outils vendus par la BIREME dans la gamme des logiciels d'automatisation pour les bibliothèques. Néanmoins, selon la documentation rendue publique par l'équipe SciELO, le travail de conversion et de balisage des textes serait à présent une activité réalisée par des techniciens au sein même de la coordination du portail.

Mise à jour : mercredi 5 décembre 2001
Droits d'auteur réservés Marcilio de Brito - décembre 2001

 

1 SP : an SGML system conforming to international standard ISO 8879 - Standard Generalized Markup Language. [cited Aug. 1998 http://www.jclark.com/sp/index.htm]

 

 
édition
économique
marketing
juridique
usages
technique
services
étude de cas
  interview
Marin Dacos
  DTD SciELO
  portail revues françaises SHS
débats

Accueil

   
   

Arborescence du site Crédits/contacts
Site optimisé
en 800X600
pour Netscape 4
et IE4

 

 

Toute reproduction à des fins autres que strictement personnelles et notamment toute reproduction destinée à une publication électronique, papier, ou audio, destinée à des tiers, est strictement prohibée et constitutive du délit de contrefaçon.