revues@enssib.fr

 

 

 

Etude de cas

 

 

Présentation de la bibliothèque électronique SciELO et de ses DTD

Marcilio de Brito
Docteur en science de l'information et de la communication
Professeur invité à l'ENSSIB


DTD-SciELO Text

(Source http://www.scielo.org/ [juin 2001])

Structure des textes des revues électroniques (version 3.1)
Étant donné que les références bibliographiques sont traitées séparément, le corps du texte devient un ensemble structuré très simplement. Trois groupes de données sont définis: le groupe d'informations du titre, celui du ou des auteurs et enfin celui de certains éléments caractérisés "fluctuants" concernant les figures et les tableaux du texte.

Entités publiques
Structure Text

 

Entités publiques

<!ENTITY % ISOamsa PUBLIC "ISO 8879:1986//ENTITIES Added Math Symbols: Arrow Relations//EN" "ISOamsa.sgm"> %ISOamsa;
<!ENTITY % ISOamsb PUBLIC "ISO 8879:1986//ENTITIES Added Math Symbols: Binary Operators//EN" "ISOamsb.sgm"> %ISOamsb;
<!ENTITY % ISOamsc PUBLIC "ISO 8879:1986//ENTITIES Added Math Symbols: Delimiters//EN" "ISOamsc.sgm"> %ISOamsc;
<!ENTITY % ISOamsn PUBLIC "ISO 8879:1986//ENTITIES Added Math Symbols: Negated Relations//EN" "ISOamsn.sgm"> %ISOamsn;
<!ENTITY % ISOamso PUBLIC "ISO 8879:1986//ENTITIES Added Math Symbols: Ordinary//EN" "ISOamso.sgm"> %ISOamso;
<!ENTITY % ISOamsr PUBLIC "ISO 8879:1986//ENTITIES Added Math Symbols: Relations//EN" "ISOamsr.sgm"> %ISOamsr;
<!ENTITY % ISObox PUBLIC "ISO 8879:1986//ENTITIES Box and Line Drawing//EN" "ISObox.sgm"> %ISObox;
[…]
<!ENTITY % ISOnum PUBLIC "ISO 8879:1986//ENTITIES Numeric and Special Graphic//EN" "ISOnum.sgm"> %ISOnum;
<!ENTITY % ISOpub PUBLIC "ISO 8879:1986//ENTITIES Publishing//EN" "ISOpub.sgm"> %ISOpub;
<!ENTITY % ISOtech PUBLIC "ISO 8879:1986//ENTITIES General Technical//EN" "ISOtech.sgm"> %ISOtech;

 

Structure Text

Cette DTD définit la structure des textes des revues électroniques ayant les caractéristiques d'un article scientifique. Les textes ainsi balisés sont insérés et récupérés dans la base de données.


Figure 11 : Structure Text
(Source http://www.scielo.org/ [juin 2001])

L'élément [text] a les attributs suivants pour l'identification du texte dans le fascicule de la revue :

Publisher Item Identifier [pii] est utilisé pour identifier les parties d'un document (un numéro unique par élément). Il est formé par : un caractère identificateur du type de publication (S pour les périodiques et B pour les monographies); le ISSN ou ISBN de la publication; deux chiffres pour identifier l'année de la publication; cinq caractères pour identifier les numéros de la publication (ce numéro est séquentiel et annuel) et un caractère vérificateur. Cet attribut est obligatoire. Document Topic [doctopic], indique le type de publication en cours de balisage comme : article original, éditorial ou révision de littérature. Langue [language] indique la langue de l'article. Code du centre [ccode], indique le centre dans lequel l'article est traité. Statut [status] indique la disponibilité d'accès au document. Version [version] indique la version de la DTD SciELO utilisée pour le balisage de l'article. Type [type] indique les types d'illustrations contenues dans l'article. Ordre [order] indique l'ordre dans laquelle l'article apparaît dans le sommaire du fascicule. Code de section [seccode] c'est l'identificateur de la section de la revue dans laquelle apparaît l'article. Sponsor [sponsor] c'est l'institution qui a financé l'article ou la recherche. Titre abrégé [stitle] informe le titre abrégé de la revue. Volume [volid] indique le volume du fascicule. Supplément de volume [supplvol] indique le numéro du supplément du fascicule d'une revue. Date ISO [dateiso] informe la date dans le format ISO (YYYYMMDD). Pour les publications ayant deux mois ou plus c'est le dernier mois qui apparaîtra dans la date. Exemple : janvier/mars 1997, dateiso=19970300. International Standard Serial Number [issn], dans le cas d'une publication électronique avec ou sans version imprimée, c'est l'ISSN de la version électronique qui apparaîtra. Code de sommaire [toccode] indique si le titre qui doit apparaître dans le sommaire est le titre du texte ou celui de la section. Page initiale [fpage] et page finale [lpage] indiquent respectivement la première et la dernière page de l'article.

Exemple de balisage par texte [text]: [text pii=nd doctopic=le language=en ccode=br1.1 status=1 version=3.1 type=nd order=29 seccode=BJG080 stitle="Braz. J. Genet." volid=20 issueno=3 dateiso=19970900 issn=0100-8455 toccode=2 fpage=102 lpage=106]

<!ENTITY % common SYSTEM "common31.dtd">
...................%common;
<!ELEMENT text - - (titlegrp? & authgrp? & (#PCDATA)?) +(%i.float;)>
...................<!ATTLIST text pii CDATA #REQUIRED
................................................doctopic CDATA #REQUIRED
................................................language CDATA #REQUIRED
................................................ccode CDATA #REQUIRED
................................................status CDATA #REQUIRED
................................................version CDATA #REQUIRED
................................................type NAMES #REQUIRED
................................................order CDATA #REQUIRED
................................................seccode CDATA #REQUIRED
................................................sponsor CDATA #REQUIRED
................................................stitle CDATA #REQUIRED
................................................volid CDATA #IMPLIED
................................................supplvol CDATA #IMPLIED
................................................issueno CDATA #IMPLIED
................................................supplno CDATA #IMPLIED
................................................dateiso CDATA #REQUIRED
................................................fpage CDATA #REQUIRED
................................................lpage CDATA #REQUIRED
................................................issn CDATA #REQUIRED
................................................toccode CDATA #REQUIRED>

Le groupe d'auteur [authgrp] est composé par les éléments auteur individuel [author] et auteur corporatif [corpauth]. L'auteur individuel a comme attributs l'indication de responsabilité [role] et identificateur croisé [rid], [author] est formé par le modèle de nom [m.name] - nom [surname] et prénom [fname] - l'auteur corporatif est formé par le modèle organisationnel [m.org].

Exemple de balisage par le groupe titre [titlegrp]:
[titlegrp]
..............[title language=es] Determinantes del Voto Partidario en Sistemas Electorales Centrados en el Candidato[/title]:
..............[subtitle]Evidencias sobre Brasil[/subtitle]
[/titlegrp]

Exemple de balisage par le groupe auteur [authgrp]:
[authgrp]
..............[author role=nd rid="a01"][fname] J-M. [/fname][surname]Salaün[/surname][/author]1,
..............[author role=nd rid="a02"][fname] G. [/fname][surname] Chartron[/surname][/author]2,
..............[author role=nd rid="a03"][fname] M. [/fname][surname] Legentil[/surname][/author]3
..............[corpauth] [orgname] Ecole Nationale Supérieure de Sciences de l'Information et des Bibliothèques [/orgname],
.............. ..............[orgdiv]ISDN[/orgdiv]
..............[corpauth]
[/authgrp]


Figure 12 : modèle d'éléments fluctuants
(Source http://www.scielo.org/ [juin 2001])

Le dernier des éléments de Text est le modèle [i.float] composé par des éléments fluctuants. L'élément affiliation [aff] a cinq attributs : identificateur [id], nom de l'organisation [orgname], division d'organisation1 [orgdiv1], division d'organisation2 [orgdiv2], division d'organisation3 [orgdiv3] que servent à identifier hiérarchiquement les divisions des institutions commençant par la plus haute.

Exemple de balisage affiliation [aff] : [aff id="a01" orgname="Ecole Nationale Supérieure de Sciences de l'Information et des Bibliothèques " orgdiv1="Institut de Sciences du Document Numérique "]1Enssib-ISDN. 17-21 Bd du 11 novembre 1918. [zipcode]69623[/zipcode], [city]Villeurbanne[/city], [/aff]

Le deuxième élément de [i.float] est ignore [ign] qui signale les parties du texte qui n'ont pas de valeur bibliographique. Cet élément est inséré automatiquement par le programme SGML Parser.

Les autres éléments sont table [table] et le groupe d'images [figgrp]. La table contient l'attribut numéro [no] pour l'identification du numéro de la table dans le texte et contient les éléments modèle de titre [m.title] et légende [legend]. Le groupe d'illustrations [figgrp] contient l'attribut numéro [no] pour identifier l'image dans le texte et porte les éléments modèle de titre [m.title], référence de l'image [figref] et la légende [legend].

Mise à jour : mercredi 5 décembre 2001
Droits d'auteur réservés Marcilio de Brito - décembre 2001

 

 
édition
économique
marketing
juridique
usages
technique
services
étude de cas
  interview
Marin Dacos
  DTD SciELO
  portail revues françaises SHS
débats

Accueil

   
   

Arborescence du site Crédits/contacts
Site optimisé
en 800X600
pour Netscape 4
et IE4

 

 

Toute reproduction à des fins autres que strictement personnelles et notamment toute reproduction destinée à une publication électronique, papier, ou audio, destinée à des tiers, est strictement prohibée et constitutive du délit de contrefaçon.