EUCOR-Bibliotheksinformationen - Informations des bibliothèques: 17 (2001)

Premiers pas en XML à la B.N.U.S. : l'exemple de la veille documentaire

par Catherine Storne, conservateur


La Bibliothèque nationale et universitaire de Strasbourg (B.N.U.S.) propose désormais sur son site internet une application de veille documentaire (Cliquer ensuite sur l'onglet « Domaines ») dans les domaines des Etudes germaniques et des sciences religieuses.

Les ressources sont soigneusement sélectionnées par trois spécialistes des domaines concernés afin d’offrir une information de qualité et à jour ; elles couvrent les sites internet mais aussi les cédéroms, les colloques, les périodiques et les ouvrages.

Pour ce projet, la B.N.U.S. a choisi de structurer les données en XML. Ce choix ne s’imposait pas, pour une base qui reste de taille modeste, comparée notamment aux 2.500 ressources signalées par la Bibliothèque nationale de France sur son site. La B.N.U.S. a cependant considéré que la recherche des informations par l’internaute et la maintenance par les bibliothécaires était facilitée par l’utilisation d’une base de données relationnelles et que, avec XML, elle pourrait développer par la suite d’autres applications et a donc acquis auprès de la société Archimed le SIM, système d’information multimedia (SIMWebpack)

1. Présentation de l’application

Les responsables scientifiques assurent à la fois la sélection intellectuelle des ressources et leur saisie dans le SIMWebpack. La connaissance de XML n’est, heureusement, pas nécessaire à ce niveau puisqu’il suffit de créer des masques de saisie à partir desquels se fait l’entrée des données.

L’internaute accède aux données par ordre alphabétique, par thèmes (correspondant aux catégories, sous-catégories) ou par une recherche libre. La recherche libre a été paramétrée dans la base d’index pour être une recherche en texte intégral ; elle donne aussi accès à la liste des mots-clefs. Par défaut, la recherche se fait sur les sites internet, les cédéroms, les ouvrages, les périodiques mais il est possible de la restreindre au type d’information souhaitée. La requête aboutit à une liste de notices sommaires et, selon les cas, dans un deuxième temps, à des notices plus détaillées, comprenant une courte analyse intellectuelle.

 

2. Le développement d’Archimed

Sur la base d’un cahier des charges élaboré en collaboration avec la B.N.U.S., Archimed a créé une application pour les Etudes germaniques, une autre pour les Sciences religieuses. Chacune des applications s’appuie sur trois bases créées dans le serveur SQL : une base d’information (correspondant à l’ensemble des données entrées), une base d’indexation (pour la recherche et la définition des index) et une base de stockage (pour le stockage éventuels de documents multimedia). Pour l’application de la veille documentaire, la base de stockage est restée vide, mais elle peut stocker tous les types de documents multimedia ; ainsi, par exemple, si par la suite, il était décidé qu’à chaque colloque serait associé une photo du lieu, toutes les photos seraient stockées en format d’image(tif ou .gif) et, pour chacune, le SIMWebpack générerait une courte notice XML dans la base d’information.

La base d’information comprend plusieurs ensembles, en l’occurrence Cédéroms, Sites internet, Périodiques, Colloques mais aussi Mots-clefs, Catégories, Sous-catégories...

Chaque ensemble contient des notices, chacune définie par un identifiant unique, par un nom, par trois états (en création, utilisable, à supprimer), ainsi que par des champs.

Illustrons notre propos par l’ensemble Sites internet des sciences religieuses. Il contient la notice « Bible de Jérusalem ». Cette notice est structurée comme suit :

site internet sous-categories internet (0-1)

sous-categorie internet (1-n) lien vers [Texte biblique]

nom (1-1)
résumé (1-1)
urls (1-1)

url (1-n)

adresse (1-1)

mots clés (0-1)

mot clé (1-n) lien vers [Bible]

Elle appartient à la sous-catégorie « textes bibliques » et renvoie au mot-clef « Bible ». Les champs « sous-catégorie » et « mots-clefs » sont considérés comme des autorités et forment chacun un ensemble, contenant des notices de catégorie dans le premier cas, des notices de mots-clefs dans le second. Un lien est fait entre la notice du site internet et la notice mot-clef. Ceci permet de mutualiser la notice mots-clef et évite de la répéter à chaque fois intégralement, ce qui évite les erreurs dues à des saisies répétitives. De ce fait, les mises à jour de mots-clefs se font très rapidement car il suffit de modifier une fois la notice mot-clef concernée et la mise à jour se fait dans toutes les notices Sites internet liées à ce mot-clef.

Chaque champ est affecté de deux valeurs correspondant à son occurrence et à son caractère répétable soit quatre possibilités : le champ est obligatoire et non répétable, obligatoire et répétable, facultatif et non répétable, facultatif et répétable.

Pour chaque ensemble, un patron a été défini et la DTD a été faite sur les patrons. La DTD (définition de type de document) a permis, en quelque sorte, de définir l’usage de XML pour les ressources concernées. Enfin, XML ne donnant que la structure des données et non leur représentation, Archimed a accompagné les documents de feuilles de style XSL indiquant la mise en forme à adopter pour l’affichage Web et à développé les pages internet correspondant aux applications créées.

 

3. Les évolutions envisageables

Commencée dans deux domaines dont les fonds sont très riches à la B.N.U.S., la veille documentaire pourrait s’étendre à l’ensemble des domaines de la connaissance couverts par l’établissement.

Actuellement, l’application n’utilise pas la possibilité d’échanges de données. Il serait pourtant envisageable de faire des développement supplémentaires pour permettre à des partenaires autorisés (universitaires, bibliothécaires...) de proposer des références, pour opérer des échanges.

D’autre part, eu égard au caractère très sélectif des ouvrages signalés, les données bibliographiques sont saisies manuellement. Si le nombre des notices s’accroissait, il faudrait étudier la possibilité de convertir les notices bibliographiques du S.I.G.B. correspondant aux ouvrages signalés en BiblioML (DTD de XML définie pour les ouvrages) et des les importer directement dans la base de veille documentaire.

En prévision de l’augmentation du nombre de notices, et pour assurer une information toujours à jour, la vérification manuelle des liens pourra être abandonnée au profit d’une vérification automatique de leur validité

 

Conclusion

En l’état actuel, les potentialités de XML sont loin d’être entièrement exploitées à la B.N.U.S. D’autres applications sont en cours. L’une d’elle rendra disponibles des notices informatives de cédéroms (titre, périodicité, analyse, localisation...) ainsi que leurs modes d’emploi. Il pourrait aussi être envisagé de publier la Bibliographie alsacienne sur le site de la B.N.U.S. ou pour la gestion d’une bibliothèque numérique.

Le principal frein reste, pour l’instant, l’absence d’outils standards, facilement utilisables par des non-informaticiens, pour générer du code XML et des feuilles de style. D’autre part, pour des bibliothécaires habitués aux contraintes des formats bibliographiques, l’infinie souplesse de XML, avec les risques de multiplication de DTD particulières, est déroutante.



zum nächsten Beitrag - l'article suivant
zurück zum Inhaltsverzeichnis - retour à l'index