Groupe Paris ABF

Le blog du groupe Paris de l'Association des Bibliothécaires de France

#ateliersnum Atelier data et web sémantique #6

Poster un commentaire

Présentation de data.bnf.fr

Quels sont les objectifs du projet?

L’objectif de data.bnf.fr est la visibilité des données bibliographiques de la BnF sur le web. Il s’agit d’être présent là où les internautes et les usagers sont et de permettre une remontée des ressources dans les résultats des moteurs de recherche. Cela va permettre aux lecteurs d’avoir un point de départ pour interroger les catalogues et accéder à l’ensemble des documents. Par exemple, si un usager utilise un moteur de recherche pour avoir des informations sur un auteur ou une œuvre, l’usager va trouver dans les résultats de sa recherche, la page de l’œuvre dans data.bnf.fr. A partir de là, il va pouvoir accéder aux ressources de la BnF et à une sélection de ressources externes.

Des données réutilisables et récupérables

Les données sont réutilisables sur le plan technique avec le web sémantique et sur le plan juridique grâce à l’emploi des licences ouvertes.

Data permet la récupération de données et la création de services en s’appuyant sur les données du catalogue. On trouve plusieurs regroupements : par auteur, thème, œuvre, sujet et même date et lieu. C’est une tentative de FRBrisation des éditions d’une œuvre. Actuellement, on trouve 60 % des catalogues de la BnF dans data.bnf.fr mais c’est un chantier encore en cours afin d’améliorer la fraicheur des données, leur couverture et créer plus de liens.

La récupération des données se fait en RDF (Resource description framework). Elle est justement plus facile grâce aux standards du web sémantique. Il y a plusieurs manières de récupérer les données de data :

  • en téléchargeant toutes les données d’un coup (ce qu’on appelle un dump) ou par paquet de données.

  • en récupérant les pages qui nous intéressent, page par page (voir le lien de téléchargement en bas de page)

  • en effectuant des requêtes : toutes les œuvres en breton, les 100 auteurs les plus étudiés, etc.

Le site propose un guide pour créer des requêtes SPARQL.

Et pour mon catalogue?

Pour récupérer les données, il faut néanmoins s’interroger sur la compatibilité des SIGB. Les prestataires peuvent-ils mettre en place un outil SPARQL? Techniquement, il n’y aurait pas de problème, mais il faut établir un point de contact entre les données de la bibliothèque et celle de data.bnf.fr. Cela peut-être l’ISBN du livre ou le numéro FRBNF (pour le cas où les notices bibliographiques sont récupérées depuis le catalogue de la BnF).

L’idée c’est de permettre le lien avec des ressources de bibliothèques comme les documents numérisés de Gallica, les expositions de la BnF ou les critiques du CNLJ, mais également avec d’autres ressources comme Wikipédia, Canal-U, MusicBrainz, Geonames, DBpedia, Flickr, Freebase…

Présentation du prototype Opencat

Opencat est un projet issu d’un appel à projet “services numériques culturels innovants” du Ministère de la culture et de la communication. Il est financé par la BnF et le Ministère de la culture. L’objectif du prototype est d’utiliser les regroupements par œuvres de data.bnf.fr et d’apporter des compléments bibliographiques provenant d’autres sources et de créer des liens vers d’autres types de contenus.

opencat

Avec quel plus pour les usagers ? Obtenir dans les résultats d’une recherche les données locales, les données de la BnF et les données du web. Il faut considérer le catalogue comme une plateforme vers d’autres ressources.

Les bibliothèques ont des données structurées, stables, mais tant que l’information est dans le catalogue, elle est dans un silo, elle n’est pas visible sur le web. Pour ouvrir les catalogues sur le web, il faut des données structurées, des identifiants pérennes pour nos données et des référentiels communs.

Pour que les données soient visibles, il faut les extraire du SIGB en construisant des pages HTML, et en ajoutant des balises (Schema.org). Peu importe le format utilisé car il y a un format commun au reste du web sémantique, le RDF. On peut tous garder nos formats, l’essentiel étant qu’ils se rencontrent.

Advertisements

Auteur : Groupe Paris Abf

Blog du groupe Paris de l'ABF

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s