revues@enssib.fr

 

 

 

 

 

Etude de cas

 

 

La mise en ligne du BBF électronique au format XML


Emilie Romand-Monnier
Ingénieur en ressources électroniques à l'ENSSIB

 

Analyse du papier pour l'écriture de la DTD



De la maquette papier à la DTD
Structure globale de tout document extrait du BBF

De la maquette papier à la DTD

Le passage au "tout-XML", consistant à produire un document structuré au format XML, et par la suite dériver des produits d'information tant électroniques qu'imprimés, a été d'emblée écarté par la prépondérance de la version papier et l'attachement à sa maquette. À cette étape, cette même contrainte a orienté le choix de la DTD. Les documents du BBF auraient pu être décrits par une DTD appartenant au domaine public. Mais ces normes, comme tout standard, visent à décrire le plus grand nombre de documents appartenant aux domaines concernés. Elles ne décrivent que les éléments qui y sont fréquemment présents, les dénominateurs communs. Or, la DTD du BBF électronique doit parfaitement correspondre à la revue. Elle doit permettre d'identifier, de baliser et de restituer toutes les données qui étaient signifiées par la mise en page, la typographie (italique, couleur, etc.), soit de façon explicite (notes de bas de page, titre de rubrique, titre, etc.), soit de façon implicite (citation, etc.).

La première phase du projet "BBF électronique" a consisté à décortiquer la revue papier afin d'identifier tous les types d'information présents, ainsi que leur articulation, et ceci dans l'optique d'en faire ressortir la structure logique. Cette étude a été fondée sur des numéros de la période 98-2000, une liste des styles et des niveaux de structure repérables a été établie. Le nombre de ces "marques", qui correspondent à des métadonnées implicites, a évolué. Il est passé de 16 à 43 par numéro au cours de ces trois années1. Tous les éléments porteurs de sens pour la structure du BBF ont été retenus et ont permis d'établir le "patron" logique du BBF. L'étude du papier ayant révélé une complexité croissante des informations extratextuelles, il ne fallait en aucun cas aller vers une simplification, sachant que cette DTD doit être applicable à n'importe quel article, existant ou futur, du corpus. La DTD est "l'auto-description des données XML"2 . Elle définit la grammaire et la syntaxe qui structurent le document. Le langage XML, langage extensible de balisage, permet de définir autant de balises que d'éléments nécessaires. Elle permet aussi de les nommer explicitement en vue de leur utilisation future.

Mise à jour : lundi 25 mars 2002
Droits d'auteur réservés Emilie Romand-Monnier- mars 2002

 

1 Rapport de stage, DESSID 2000, annexe I.

2 "En XML, des DTD (Document Type Definition) peuvent accompagner un document. Elles définissent essentiellement les règles qui lui sont propres, telles que les éléments présents et la relation structurelle existant entre eux. Les DTD aident à valider les informations quand l'application réceptrice ne possède pas de description intégrée des données entrantes. En XML cependant, les DTD sont facultatives. On désigne les données transmises avec une DTD sous le nom de XML valide. Dans ce cas, un analyseur XML peut vérifier les données entrantes en examinant les règles définies dans la DTD pour s'assurer que les données sont correctement structurées. Les données transférées sans DTD sont considérées comme du XML bien formé. Avec le XML valide et le XML bien formé, les données codées en XML sont auto-descriptives puisque les balises de description sont mélangées aux données. Le format ouvert et souple utilisé par le XML permet son utilisation chaque fois qu'un besoin d'échange et de transfert d'informations se manifeste, ce qui le rend particulièrement puissant." Pourquoi XML ? [on line]. Microsoft MSDN-Microsoft France-Internet Explorer. [dernière mise à jour le 10/11/2000]. Available from : <URL : http://www.microsoft.com/FRANCE/formezvous/xml/info.asp?mar=/FRANCE/formezvous/xml/xml_3.html >

 
édition
économique
marketing
juridique
usages
technique
services
étude de cas
  interview
Marin Dacos
  DTD SciELO
  portail revues françaises SHS
  BBF au format XML
débats

Accueil

   
   

Arborescence du site Crédits/contacts
Site optimisé
en 800X600
pour Netscape 4
et IE4

 

 

Toute reproduction à des fins autres que strictement personnelles et notamment toute reproduction destinée à une publication électronique, papier, ou audio, destinée à des tiers, est strictement prohibée et constitutive du délit de contrefaçon.