Données

by  

Bienvenue sur Données, plateforme de stockage, structuration et visualisation des données de la recherche.

Vous êtes producteurs de données ou curieux de découvrir les résultats des études menées sur les patrimoines, la plateforme Données vous donne accès à différents services de dépôt, d’exploration, de manipulation et d’édition des données issues de la recherche en région Centre-Val de Loire.

Afin de préserver la propriété intellectuelle des jeux de données déposés et valoriser leur publication au sein de Données, une chaîne de traitement normalisée et transparente des données a été développée. Nous vous invitons à en prendre connaissance ici .

Que deviennent les données déposées dans Heritage(s)?

Du dépôt de vos données à leur publication sur le web, une chaîne de traitement complète de la donnée a été établie afin de répondre à deux objectifs, des jeux de données normalisés et un processus transparent.

Introduction

Le bon déroulement de cette chaîne de traitement repose sur les informations descriptives qui accompagnent les jeux de données déposés : les métadonnées.

Les métadonnées facilitent le travail des moteurs de recherche et d’indexation. Elles permettent d’extraire automatiquement de nombreuses informations sur le document, et de reconstituer les relations entre documents. Elles participent à rendre les données interopérables et à leur donner plus de visibilité lorsqu’elles sont publiées.

Pour ce faire, une définition et une nomenclature communes des métadonnées pour tous les acteurs de la chaîne de traitement est nécessaire.

Au sein de la plateforme Données, la chaîne de traitement des données de recherche comporte 5 étapes :

  1. Définition du plan de gestion des données

  2. Dépôt des jeux de données

  3. Extraction automatique des métadonnées pour indexation

  4. Publication sur le Web

  5. Enrichissement manuel des métadonnées

 

1. Définition du Plan de Gestion des Données

La définition d’un Plan de Gestion des Données (PGD) est la première étape de la chaîne de traitement des données. Elle permet au contributeur de renseigner les métadonnées administratives et juridiques du projet, nécessaires au respect de la propriété intellectuelle, dès leur dépôt et jusqu’à leur publication en ligne sur la plateforme Données.

2. Dépôt des Jeux de Données

Une fois le Plan de Gestion des Données défini, un formulaire invite le contributeur à charger les jeux de données définis dans ce plan et à saisir les métadonnées génériques permettant de les décrire.

Pour plus d’informations sur la procédure de dépôt de données, rendez-vous à la rubrique “Contribuer”

3. Extraction automatique des métadonnées pour indexation

Les métadonnées renseignées vont permettre une extraction, une normalisation et une indexation automatique des jeux de données selon leur nature :

  • les métadonnées des notices : informations génériques issues du Plan de Gestion des Données et du formulaire de dépôt. Les modèles de métadonnées standard utilisés sont Dublin Core, DCAT, Data Cite, FOAF et BNF.

  • les métadonnées multimédia : informations multimédia natives extraites des ressources multimédia des jeux de données. Les modèles de métadonnées utilisés sont des formats multimédia compatibles avec le logiciel Exiftool.

  • les métadonnées spatio-temporelles : informations spatiales et temporelles extraites à la fois du formulaire de dépôt et des données natives des ressources multimédia. Les modèles utilisés sont Geonames ontology et GeoSparql.

L’indexation des jeux de données grâce à leurs métadonnées facilite leurs recherches et alimente leurs descriptions.

Pour plus d’informations sur les modèles de données, rendez-vous à la rubrique “Développer”

4. Publication sur le Web

Une fois les jeux de données indexés, ceux-ci sont publiés dans les différents catalogues de données disponibles sur la plateforme Données :

  • Catalogue de notices : Ce catalogue permet d'accéder aux notices des jeux de données. Chaque jeu de données est décrit au sein d’une notice qui compile ses métadonnées génériques, administratives et juridiques, accompagnées, si le Plan de Gestion des Données le permet, d’un lien de téléchargement ou d’une référence vers la page web du projet. Si le jeu de données contient des ressources multimédia, la notice comprend un lien vers les ressources associées dans le catalogue multimédia.

  • Catalogue de données multimédia : decrire - chaque ressource multimédia (de type image, audio, video, ou modèle 3D) présente dans un jeu de données donne lieu à la création d’une entrée dans le catalogue de données multimédia. La ressource y est décrite avec ses métadonnées multimédia, et génère un lien vers la notice du jeu de données d’où elle provient, un aperçu en ligne à partir d’une conversion standard de la ressource (Jpeg, MP3, MP4 ou GLTF) et, si le Plan de Gestion des Données le permet, un lien de téléchargement de la version originale.

  • Catalogue de données géographiques : décrire - chaque jeu de données nativement spatialisé et diffusable est référencé dans ce catalogue. Ces informations peuvent être affichées sur différent fonds de carte (dynamiques ou statiques). Lorsque les données (points, lignes ou vecteurs) possèdent des attributs, il est possible de les afficher dans une infobulle. Ces infobulles permettent, lorsque c'est pertinent, de faire la passerelle vers les catalogues de notice et multimédia.

Pour plus d’informations sur les catalogues de données, rendez-vous à la rubrique “Consulter”

 

La publication des métadonnées se fait aussi sur le Web des données grâce à la génération des métadonnées en triplets RDF qui viennent alimenter le triplestore de la plateforme dont le point d’entrée SPARQL est accessible depuis la toile.

Pour plus d’informations sur le service d’interrogation des métadonnées, rendez-vous à la rubrique "Manipuler"

5. Enrichissement manuel des métadonnées

Afin de compléter le traitement automatique des jeux de données, une étape d’enrichissement manuel des métadonnées est proposée au contributeur. Elle concerne les schémas des ressources textuelles des jeux de données (XML, CSV, TSV, SQL, Excel etc.) et consiste en deux activités :

  • alignement des termes des schémas vers des termes issues de thésaurii standards : cette activité permet de créer des mots-clés qui s’ajouteront aux métadonnées du jeu de données et ainsi lui donnera plus de visibilité lors d’une recherche ou d’un filtrage des jeux de données par mot-clé. Elle génère également des annotations sémantiques au format RDF qui alimenteront le triplestore et donnera plus de visibilité au jeu de données sur le Web des données.

  • mapping des schémas vers l’ontologie de la plateforme Données : cette activité permet de générer des triplets RDF décrivant les ressources textuelles des jeux de données qui alimenteront le triplestore de la plateforme et donnera ainsi plus de précision aux jeux de données sur le Web des données

Pour plus d’informations sur les services d’enrichissement de métadonnées, rendez-vous à la rubrique “Manipuler”

Tutoriel : Plateforme Données

Afin d’accompagner votre exploration et de démarrer sur de bonnes bases, nous avons mis en place ce tutoriel ainsi qu’une série de vidéos pour vous expliquer précisément en quoi consiste la plateforme Données et ce qu’il est possible d’y faire exactement. À tout moment, lorsqu’elle est proposée, vous pouvez lancer la vidéo en cliquant sur le bouton “play” en bas à droite de l’écran.

Etape 1 : Qu’est-ce-que la plateforme Données ?

La plateforme Données vous propose plusieurs services regroupés en différentes rubriques consultables dans le menu central situé en haut de votre fenêtre de navigation. Voyons à quoi correspondent chacune d’entre-elles :

 

  • Consulter

    Dans cette rubrique vous pourrez explorer les jeux de données déposés par la communauté Données. Afin d’optimiser l’expérience d’exploration des données, nous proposons trois types de catalogues de données pour une approche et une expérience différentes :

    • Catalogue de Notices : permet de consulter l’ensemble les notices générales de l’ensemble des jeux de données déposés ;

    • Catalogue de données Géographiques : permet d’explorer des jeux de données déposés via la dimension spatio-temporelle en les visualisant sur une carte ;

    • Catalogue de données Multimédia : permet d’explorer les jeux de données contenant des ressources multimédia, et leurs métadonnées, au sein de galeries permettant de les prévisualiser.

  •  

  • Contribuer

    C’est dans cette rubrique que vous allez pouvoir participer au projet de la plateforme Données en y déposant vous aussi vos jeux de données.

    Pour y accéder vous devrez être un membre contributeur et être connecté à votre espace personnel. On vous en dit plus sur les modalités de connexion à l’étape 2 de ce tutoriel.

    Ainsi depuis cette page vous aurez la possibilité :

    • D’accéder au formulaire de données

    • De remplir un Plan de Gestion des Données

    • De déposer vos données

  •  

  • Manipuler

    Si vous êtes contributeur, cette rubrique vous permettra de manipuler les jeux de données que vous avez déposés. Pour ce faire vous aurez la possibilité d’interroger les métadonnées des jeux de données correspondants ou encore de les enrichir en utilisant des outils de traitement adaptés. Cette seconde action permet d'accroître la visibilité et l'interopérabilité de vos données au sein de l’Écosystème Numérique et sur le Web des données.

    Cette rubrique vous donne donc accès à deux types de services prévus pour la manipulation :

    • Services d'interrogation : qui permettent de tester l’interrogation des métadonnées des jeux de données déposés

    • Service d’édition numérique : qui permettent d’éditer les jeux de données, leurs ressources ainsi que leurs métadonnées

  •  

  • Développer

    Cette rubrique s’adresse à vous si vous travaillez sur la conception et le développement de services et d’applications numériques autour des données patrimoniales. Ici vous retrouverez l’ensemble des ressources de développement utilisées dans le cadre du projet d’écosystème numériques(s) dans son entièreté. Nous mettons à disposition :

    • Code Ouvert : accès aux entrepôts GIT des différentes applications et services du portail

    • Modèles de données : ontologie, thésaurii et schémas de métadonnées servant de référentiels au sein de l’écosystème numérique

    • APIs : interfaces de programmation permettant à vos applications de requêter à distance les métadonnées des jeux de données déposés mais aussi leurs ressources.

   

Etape 2 : Comment vous connecter à la plateforme Données ?

Si vous ne vous êtes pas connecté directement depuis le Portail Heritage(s) nous vous rappelons les modalités de connexion ci-dessous.

Le système d’authentification unifié de la plateforme requiert, pour des raisons de sécurité, de disposer d’un compte utilisateur institutionnel ou de créer un compte universel (associé à votre adresse mail personnelle) reconnu et validé par le système d’authentification.

  • Si vous êtes affilié à un organisme de recherche du réseau Intelligence des Patrimoines, vous possédez normalement un compte utilisateur institutionnel (université, CNRS, etc.). Vous n’avez donc pas besoin de créer de compte pour vous connecter. Votre compte a par défaut le statut contributeur, ce qui vous donne accès à tous les services de l’Écosystème Numérique, dont ceux propres à la plateforme Données

  • Si vous ne possédez pas de compte utilisateur institutionnel, vous pouvez créer un compte utilisateur universel avec votre adresse mail personnelle. Ce compte n’a pas le statut contributeur par défaut et ne vous donne pas accès aux services de dépôt de données de recherche. Cependant, si vous êtes chercheur associé ou étudiant en master ou doctorat, vous pouvez demander le statut de contributeur en vous faisant parrainer par un autre compte qui a le statut contributeur.

En savoir plus sur l'authentification et les comptes utilisateurs

   

Etape 3 : Vous êtes membre d’un organisme de recherche ?

Comme nous vous l’avons précisé précédemment, les services accessibles par notre plateforme peuvent varier en fonction de votre statut et de votre état de connexion.

Si vous êtes un utilisateur dépendant d’un organisme de recherche, disposant d’un compte institutionnel ou un compte universel au statut contributeur, vous avez accès à l’ensemble des rubriques présentées précédemment, pour cela il vous suffit de vous connecter.

   

Etape 4 : Vous n’êtes pas membre d’un organisme de recherche ?

Si vous ne dépendez pas d’un organisme de recherche, la plateforme Données vous donne tout de même accès aux services des rubriques suivantes :

  • Consulter

    • Catalogue de notices

    • Catalogue de données multimedia

    • Catalogue de données géographiques

  • Développer

    • Code ouvert

    • Modèle de données

    • APIs

   

Consulter

Retrouvez ici l’ensemble des jeux de données déposés sur la plateforme. Ils sont publiés dans trois catalogues de données, classés selon 3 points d’entrées : les notices de projets, les données multimédias et les données géographiques.

Catalogue de notices
Card image cap
Catalogue de données géographiques
Card image cap
Catalogue de données multimedia
Card image cap

Contribuer

Contribuez à la plateforme Données en déposant vos jeux de données. Pour vous accompagner dans votre démarche, un tutoriel est accessible à chaque étape de ce dépôt.

* Pour accéder à ce service, vous devez posséder un statut de contributeur et travailler au sein d’un organisme de recherche membre fondateur du programme ARD Intelligence des Patrimoines.

Que deviennent
vos données?

Du dépôt de vos données à leur publication sur le web, une chaîne de traitement complète de la donnée a été établie afin de répondre à deux objectifs : des jeux de données interopérables et un processus transparent.

Le bon déroulement de cette chaîne de traitement repose sur les informations descriptives qui accompagnent les jeux de données déposés : les métadonnées.

Les métadonnées facilitent le travail des moteurs de recherche et d'indexation, permettant d'extraire automatiquement de nombreuses informations sur le document, ainsi que de reconstituer les relations entre documents. Elles participent à rendre les données interopérables et à leur donner plus de visibilité lorsqu'elles sont publiées.

Pour ce faire, une définition et une nomenclature communes des métadonnées pour tous les acteurs de la chaîne de traitement est nécessaire.

Au sein de la plateforme Données, la chaîne de traitement des données de recherche comporte 5 étapes :

picto-definition

La définition d'un Plan de Gestion des Données (PGD) est la première étape de la chaîne de traitement des données. Elle permet au contributeur de renseigner les métadonnées administratives et juridiques du projet, nécessaires au respect de la propriété intellectuelle, dès leur dépôt et jusqu'à leur publication en ligne sur la plateforme Données.

picto-depot

Une fois le Plan de Gestion des Données défini, un formulaire invite le contributeur à charger les jeux de données définis dans ce plan et à saisir les métadonnées génériques permettant de les décrire.

> Pour plus d'informations sur la procédure de dépôt de données, rendez-vous à la rubrique "Contribuer"

picto-extraction

Les métadonnées renseignées vont permettre une extraction, une normalisation et une indexation automatique des jeux de données selon leur nature :

  • les métadonnées des notices : informations génériques issues du Plan de Gestion des Données et du formulaire de dépôt. Les modèles de métadonnées standard utilisés sont Dublin Core, DCAT, Data Cite, FOAF et BNF.
  • les métadonnées multimedia : informations multimedia natives extraites des ressources multimedia des jeux de données. Les modèles de métadonnées utilisés sont des formats multimedia compatibles avec le logiciel Exiftool.
  • les métadonnées spatio-temporelles : informations spatiales et temporelles extraites à la fois du formulaire de dépôt et des données natives des ressources multimedia. Les modèles utilisés sont Geonames ontology et GeoSparql.

L'indexation des jeux de données grâce à leurs métadonnées facilite leurs recherches et alimente leurs descriptions.

> Pour plus d'informations sur les modèles de données, rendez-vous à la rubrique "Développer"

picto-publication

Une fois les jeux de données indexés, ceux-ci sont publiés dans les différents catalogues de données disponibles sur la plateforme Données :

  • Catalogue de notices : Ce catalogue permet d'accéder aux notices des jeux de données. Chaque jeu de données est décrit au sein d'une notice qui compile ses métadonnées génériques, administratives et juridiques, accompagnées, si le Plan de Gestion des Données le permet, d'un lien de téléchargement ou d'une référence vers la page web du projet. Si le jeu de données contient des ressources multimedia, la notice comprend un lien vers les ressources associées dans le catalogue multimedia.
  • Catalogue de données mutlimedia : décrire - chaque ressource multimedia (de type image, audio, vidéo, ou modèle 3D) présente dans un jeu de données donne lieu à la création d'une entrée dans le catalogue de données multimedia. La ressource y est décrite avec ses métadonnées multimedia, et génère un lien vers la notice du jeu de données d'où elle provient, un aperçu en ligne à partir d'une conversion standard de la ressource (JPEG, MP3, MP4 ou GLTF) et, si le Plan de Gestion des Données le permet, un lien de téléchargement de la version originale.
  • Catalogue de données géographiques : décrire - chaque jeu de données nativement spatialisé et diffusable est référencé dans ce catalogue. Ces informations peuvent être affichées sur différents fonds de carte (dynamiques ou statiques). Lorsque les données (points, lignes ou vecteurs) possèdent des attributs, il est possible de les afficher dans une infobulle. Ces infobulles permettent, lorsque c'est pertinent, de faire la passerelle vers les catalogues de notices et multimedia.

>Pour plus d'informations sur les catalogues de données, rendez-vous à la rubrique Consulter

La publication des métadonnées se fait aussi sur le Web des donées grâce à la génération des métadonnées en triplets RDF qui viennent alimenter le triplestore de la plateforme dont le point d'entrée SPARQL est accessible depuis la toile.

>Pour plus d'informations sur le service d'interrogation des données, rendez-vous à la rubrique "Manipuler > Interrogation des métadonnées"

picto-enrichissement

Afin de compléter le traitement automatique des jeux de données, une étape d'enrichissement manuel des métadonnées est proposée au contributeur. Elle concerne les schémas des ressources textuelles des jeux de données (XML, CSV, TSV, SQL, Excel etc.) et consiste en deux activités :

  • alignement des termes des schémas vers des termes issus de thesaurii standards : cette activité permet de créer des mots-clés qui s'ajouteront aux métadonnées du jeu de données et ainsi lui donneront plus de visibilité lors d'une recherche ou d'un filtrage de jeux de données par mot-clé. Elle génère également des annotations sémantiques au format RDF qui alimenteront le triplestore et donneront plus de visibilité au jeu de données sur le Web des données.
  • mapping des schémas vers l'ontologie de la plateforme Données : cette activité permet de générer des triplets RDF décrivant les ressources textuelles des jeux de données qui alimenteront le triplestore de la plateforme et donnera ainsi plus de précision aux jeux de données sur le Web des données.

>Pour plus d'informations sur les services d'enrichissement de métadonnées, rendez-vous à la rubrique "Manipuler > édition de métadonnées"

Tutoriel : Comment déposer vos données ?

Pour vous accompagner dans votre démarche de dépôt de données nous vous proposons un tutoriel accessible en cliquant sur le bouton “Tutoriel” ou en lançant la vidéo.

Etape 1 : Comment effectuer une demande de dépôt ?

Si vous souhaitez déposer vos données sachez que vous devez au préalable être connecté avec votre adresse de messagerie institutionnelle grâce à la Fédération Éducation-Recherche (FER) Renater.

Deux types de dépôt sont possibles :

  1. Un dépôt lié à l’emprunt d’un équipement via la plateforme Équipement de l’Écosystème Numérique Heritage(s) ;

  2. Un dépôt dans le contexte d’un projet de recherche, quel que soit le stade d’avancée du projet.

Dans le premier cas, il n’est pas nécessaire que vous réalisez un Plan de Gestion des Données (PGD). Il vous suffira simplement de remplir un formulaire de dépôt [Lien].

Dans le second cas, vous devrez obligatoirement créer un Plan de Gestion des Données (PGD).

Notez qu’il est préférable que la demande émane d’un porteur du projet. Toutefois, si vous êtes un chercheur actif sur le projet, vous pouvez l’effectuer vous-même au nom du collectif avec l’accord du ou des porteurs du projet. La personne qui effectue la demande devra assurer le suivi complet de celle-ci jusqu’à son aboutissement au moment du dépôt des données.

 

Une fois la demande effectuée, vous recevrez un email récapitulatif contenant :

  1. Des explications synthétiques sur la manière de rédiger un Plan de Gestion des Données (PGD) et un lien vers la documentation ;

  2. Un lien pour accéder au formulaire de dépôt dédié qui ne doit être renseigné qu’une fois le Plan de Gestion des Données (PGD) finalisé.

Etape 2 : Rédiger et télécharger votre Plan de Gestion des Données (PGD) ?

La rédaction et le téléchargement du Plan de Gestion des Données (PGD) est une étape importante d’un projet de recherche.

Le Data Management Plan (DMP) ou Plan de gestion des Données (PGD) en français est un document synthétique qui aide à organiser et anticiper toutes les étapes du cycle de vie de la donnée. Il explique pour chaque jeu de données comment seront gérées les données d’un projet, depuis leur création jusqu’à leur partage et leur archivage.

La création du Plan de gestion des Données (PGD) s’appuie sur l’outil DMP-OPIDoR développé par le CNRS. Une description complète et un accompagnement au processus de rédaction sont disponibles dans la documentation [lien].

Par souci de cohérence scientifique et technique, nous ne prenons en considération que les Plan de Gestion des Données (PGD) réalisés avec DMP-OPIDoR et avec le modèle préconisé dans la documentation (INRAE - Trame générique projet [PDF] ou INRAE - General project template [PDF]).

 

Pour rédiger votre PGD cliquez ici [Lien]

 

Une fois votre Plan de Gestion des Données (PGD) rédigé, vous devrez le télécharger via le DMP-OPIDoR en prenant soin de saisir les bonnes options de téléchargement :

  • Sélectionner “Tous” les produits de recherche ;

  • Choisir d’exporter les “Produits de recherche par section” ;

  • Cocher tous les éléments optionnels du plan ;

  • Choisir l’export au format “html”.

    C’est cet export au format “html” qu’il faudra joindre au formulaire afin de générer des métadonnées automatiques pour le projet et les différents produits de recherche (en général, des jeux de données).

Etape 3 : Soumettre votre PGD et remplir le formulaire de dépôt

Une fois que vous avez téléchargé votre PGD, vous pouvez le soumettre et remplir le formulaire en cliquant ici [Lien vers le formulaire]

Cette étape se réalise en trois temps :

  1. Vous devrez soumettre votre PGD en téléversant le fichier html téléchargé via OPIDor. De notre côté nous opérerons une validation technique ;

  2. Ensuite vous devrez donc remplir le formulaire de manière à fournir les informations nécessaires à la génération des métadonnées de votre projet et des jeux de données afin que :

    • l’équipe de la plateforme Données puisse effectuer une demande de Digital Object Identifier (DOI) pour chacun de vos jeux de données déposés

    • permettre un premier niveau d'interopérabilité des données afin de faciliter la recherche, le croisement et le moissonnage ;

  3. Enfin, une fois le formulaire rempli, un dernier écran s’affichera afin que vous puissiez finaliser votre démarche avant d’enclencher le processus de validation de votre PGD.

Etape 4 : Processus de validation de mon PGD

Votre Plan de Gestion des Données doit être validé par un des différents services de valorisation de référence pour les différents établissements et/ou unités de recherche. Normalement vous avez dû effectuer le choix du service de valorisation au moment de la finalisation du formulaire.

En amont de ce processus, il peut être utile d’entrer en contact avec le service de valorisation choisi afin d’anticiper cette étape de validation.

Ensuite, deux cas s’offrent à vous :

  1. si votre Plan de Gestion des Données est validé, un email vous sera envoyé indiquant alors la procédure à suivre pour déposer vos données accompagné d’un lieu unique qui correspond à votre espace de stockage ;

  2. si votre PGD n’est pas validé, un email vous sera envoyé indiquant pourquoi le validateur considère que le contenu de votre Plan de Gestion des Données ne correspond pas aux attentes du service de valorisation. Vous serez alors invité à entrer directement en contact avec le service de valorisation afin d’établir les points d'amélioration possibles qui permettront la future validation de votre Plan de Gestion des Données.

Etape 5 : Préparation et mise en ligne de vos données

Une fois votre PGD validé, vous devrez obligatoirement organiser les données que vous souhaitez déposer sur la plateforme Données.

Vous devrez organiser l'ensemble des données décrites et listées dans votre PGD sous forme d’arborescence. Elle permettra de rendre automatique l'intégration de vos données et la génération de leurs métadonnées. Pour cela il est nécessaire que vous respectiez les étapes d’organisation suivantes :

  1. L’organisation des dossiers :

    • Un dossier racine : il doit porter le nom du projet renseigné dans votre PDG

    • Ce dossier racine doit comporter obligatoirement deux dossiers :

      • Un dossier nommé “D”, pour Diffusable. Le dossier “D” doit contenir l’ensemble des jeux de données amenés à être intégrés et dont les contenus seront diffusés sur les différents catalogues et applications de la plateforme Données

      • Un dossier nommé “ND”, pour Non-Diffusable. Le dossier “ND” doit contenir l’ensemble des jeux de données dont les contenus ne seront pas diffusés sur les différents catalogues et applications de la plateforme Données. Seules les métadonnées de ces jeux de données seront publiées.

    • Les dossiers “D” et “ND” doivent contenir un dossier par jeu de données dont le nom du dossier doit correspondre au nom attribué au jeu de données dans le PGD

  2. La compression des données :

    Vous devrez produire une archive au format .ZIP qui contiendra l’ensemble des données selon l’organisation précisée précédemment. Cette archive devra porter le nom du projet.

  3. Dépôt de l’archive :

    Une fois les données compressées dans l’archive au format ZIP, vous pouvez enfin les déposer via l’interface de dépôt de la plateforme Données accessible :

    • soit par le lien indiqué dans l’email qui fait suite à la validation du Plan de Gestion des Données ;

    • soit directement depuis la page Contribuer en cliquant ici [lien] soit en cliquant sur le bouton “Déposez vos données”ci-dessous.

Manipuler

Manipulez vos données, en interrogeant et enrichissant leurs métadonnées afin d’améliorer leur visibilité.

  • 1. Interrogez les métadonnées :

    • SparNatural : Développé par Sparna, cet outil permet de construire intuitivement - sans une connaissance approfondie du langage - vos requêtes SPARQL à partir d’une interface graphique dédiée. Afin de guider vos premiers pas avec SparNatural, un tutoriel et des requêtes utiles vous sont proposés. [lien à venir]

  • 2. Enrichissez les métadonnées :

    • OnaGUI (version Web) : Outil d’alignement des termes des schémas vers des termes issues de thésaurii standards - il vous permet de créer des mots-clés qui s’ajouteront aux métadonnées du jeu de données pour leur donner plus de visibilité lors d’une recherche ou d’un filtrage des jeux de données. OnaGUI génère également des annotations sémantiques au format RDF qui alimenteront le triplestore et donnera plus de visibilité au jeu de données sur le Web des données. [lien à venir]

    • 3M : Outil de mapping des schémas vers l’ontologie de la plateforme Données - il permet de générer des triplets RDF décrivant les ressources textuelles des jeux de données qui alimenteront le triplestore de la plateforme et donneront ainsi plus de précisions aux jeux de données sur le Web des données [lien à venir]

Développer

Vous souhaitez concevoir des services et applications numériques autour des données patrimoniales ?

Retrouvez ici l'ensemble des ressources utilisées et/ou produites dans le cadre du développement de l'écosystème numérique Heritage(s).
N'hésitez pas à réutiliser ces ressources ouvertes et/ou libres de droit, à vous les réapproprier et à les redistribuer à votre tour.

Code ouvert
code-ouvert
Modèles de données
modeles-donnees
APIs
apis

Code ouvert

Retrouvez ici les ressources de code qui ont servi à développer nos différents services ainsi que les liens GitHub vers le code de nos applications.

Selon les sources, les licences sont susceptibles de varier. Vous êtes systématiquement invités à vérifier les conditions de réutilisation et de diffusion des licences. Elles sont répertoriées dans la documentation.

Modèle de données

Les jeux de données déposés dans la Plateforme Données sont indexés au sein de son entrepôt grâce à des modèles de données qui leur servent de référentiels d'interopérabilité.

Ces modèles de données sont libres, téléchargeables et réutilisables selon vos besoins.

Les modèles dits "maison" permettent une interopérabilité des jeux de données au sein de l'entrepôt.

  • ONTOLOGIE IPATO

    Ontologie permettant de décrire les connaissances relatives aux jeux de données patrimoniales déposés au sein de la plateforme Données. Cette ontologie construite à partir du modèle de référence CIDOC CRM réutilise d'autres vocabulaires afin de compléter le domaine de connaissance du patrimoine culturel avec des connaissances sur des sous-domaines de celui-ci, sur le patrimoine naturel, sur les aspects socio-juridiques de la gestion des données et les dimensions spatio-temporelles.

    Documentation officielle Lien de téléchargement de l’implémentation en XML

Les modèles standards permettent aux jeux de données d'être moissonnables par les plateformes institutionnelles.

Les ontologies sont des modèles de données exploitables par la machine permettant de représenter les connaissances partagées d'un domaine par le biais de concepts et de relations spécifiées dans un langage formel (standard OWL).

Les schémas de métadonnées sont des modèles de données exploitables par la machine qui définissent la structure et la syntaxe des spécifications de métadonnées dans un langage de schéma formel(standard XML).

  • DATA CITE METADATA INITIATIVE :

    Liste de propriétés de métadonnées principales choisies pour une identification précise et cohérente d'une ressource à des fins de citation et de récupération, ainsi que des instructions d'utilisation recommandées.

    Documentation officielle
  • DUBLIN CORE METADATA INITIATIVE (DCMI) :

    Les métadonnées du Dublin Core permettent de donner des informations génériques à propos de pages Web. L’ensemble comprend plusieurs dizaines de termes, mais 15 d'entre elles, plus fondamentales, ont été normalisées (ISO 15836-2003, RFC 5013).

  • METADATA ENCODING AND TRANSMISSION STANDARD (METS) :

    Schéma développé à l'initiative de la Digital Library Federation (DLF), et autorisant la création et la description intégrale (données descriptives, administratives et structurelles) d'objets numériques textuels ou graphiques. Destiné particulièrement aux échanges entre institutions patrimoniales.

    Documentation officielle Lien de téléchargement de l’implémentation en XML

Un thésaurus est une liste organisée de termes contrôlés et normalisés représentant les concepts d'un domaine de la connaissance. C'est un langage contrôlé utilisé pour l'indexation de documents et la recherche de ressources documentaires dans des applications informatiques spécialisées.

  • EUROVOC :

    EuroVoc est le thésaurus multilingue et multidisciplinaire de l'Union européenne. Il contient des mots-clés, répartis dans 21 domaines et 127 sous-domaines, qui servent à décrire le contenu des documents disponibles dans EUR-Lex.

    Documentation officielle Lien de téléchargement de l’implémentation en SKOS
  • PACTOLS :

    Le Thesaurus PACTOLS a été créé à l’initiative de la Fédération et Ressources sur l’Antiquité (FRANTIQ), d’abord pour organiser le vocabulaire d’indexation du Catalogue collectif indexé (CCI) et depuis quelques années, comme réservoir de métadonnées thématiques pour la qualification de ressources éditoriales, archivistiques ou produites par la recherche archéologique.

    Documentation officielle Lien GitHub vers l’implémentation en SKOS

APIs

Les jeux de données et leurs métadonnées sont requêtables à distance par l'intermédiaire d'interfaces de programmation applicatives (API).

API se traduit ici par un ensemble normalisé de fonctionnalités, utilisables par des programmes tiers via un service web. Chacune des APIs est accompagnée d'une documentaiton qui spécifie comment les programmes tiers peuvent se servir des fonctionnalités. Afin de couvrir les besoins d'interrogation spécifiques à notre entrepôt, 3 APIs différentes ont été déployées.

API METADONNEES
code-ouvert
API MULTIMEDIA
modeles-donnees
API GEOGRAPHIQUE
apis