• 13déc

    L’évolution par les données liées du Web sémantique

    En incorporant une couche d’abstraction et de représentation des données au-dessus de la couche de stockage proprement dite, on peut s’abstraire des différents systèmes de stockage et même des interfaces de représentation pour arriver à utiliser et analyser aussi bien des données structurées que des données non structurées. Il s’agit simplement d’utiliser pleinement des metadonnées, données décrivant les données,lodcloud par exemple préciser le titre d’une image, dire qu’elle représente un détail d’une sculpture, donner le nom de l’artiste, ou préciser qu’une présentation traite du BIG DATA du point de vue sociétal et qui en est l’auteur … Du coup, on arrive à dégager progressivement une nouvelle logique d’intégration des flux d’informations manipulées par des applications. Il ne s’agira plus d’échanger des données brutes via des programmes ou des services, mais d’aller rechercher l’information par la façon dont les données elles-mêmes sont liées les unes aux autres et le sens qu’on y attache dans un domaine de représentation des connaissances. Dès lors on peut voir qu’avec des langages tels que RDF (Resource Description Framework), OWL (Web Ontology Language) et un langage de requête tel que SPARQL, poussé par le W3C dans les standards du Web sémantique, on peut arriver à une nouvelle forme d’intégration par les données. Cette dernière permettrait très rapidement de lier des sources hétérogènes ensemble, de façon pertinente pour leur analyse et leur exploitation, selon les besoins et les métiers.

    Mais pour que cela fonctionne, il faut que les données soient publiées en RDF, qu’elles soient référencées et accessibles. Nous arrivons dès lors à la bataille des données «ouvertes». Celle qui est derrière le Web 3.0 et que le «BIG DATA» cache. Si aujourd’hui on médiatise relativement l’aspect données ouvertes avec les initiatives de type «open data» des gouvernements, ces dernières ne sont qu’un aspect, certes non négligeable, du LOD, Linked Open Data, le nuage de données liées sur le Web. Ce nuage est le visage du Web 3.0.

    La bataille pour les données « ouvertes »

    «Le Web va devenir de mieux en mieux capable de nous aider à gérer, intégrer et analyser les données []. Le web sémantique est une extension du web actuel dans laquelle on donne un sens bien défini aux informations améliorant ainsi le travail coopératif entre ordinateurs et personnes. Le Web sémantique désigne un ensemble de technologies visant à rendre le contenu des ressources du World Wide Web accessible et utilisable par les programmes et agents logiciels, grâce à un système de métadonnées formelles, utilisant notamment la famille de langages développés par le W3C. [RDF, OWL, ..] »

    Ainsi Sir Tim Berners-Lee définissait initialement le Web 3.0 avant de lui préférer au terme «Web Sémantique» le terme « web des données liées » pour éviter trop de confusions avec l’intelligence artificielle. Le vrai enjeu pour lui est une « interopérabilité inégalée, c’est-à-dire une capacité à faire partager l’accès aux données qui n’existe pas aujourd’hui. []. Si quelqu’un cherche des photos sur un sujet et qu’il a besoin de récupérer le nom du photographe, les droits à payer, la définition de l’image etc., il accédera en une seule recherche aux photos et à ces informations, alors qu’avec le Web actuel il doit les chercher successivement dans plusieurs sites d’images.« 

    5StarsLinkedDataTim Berners Lee a défini 5 étoiles pour les données liées, qui sont en fait les règles reprises pour ce qu’on appelle les données ouvertes.

    1. Rendre vos données accessibles (quel que soit le format) sous une license ouverte (elles sont libres d’être exploitées juridiquement)
    2. Les rendre disponibles sous forme structurées (Excel à la place d’une image de table par exemple)
    3. Utiliser des formats non propriétaires (e.g., CSV à la place d’Excel)
    4. Utiliser des URIs pour identifier vos données, de sorte qu’on puisse pointer dessus
    5. Lier vos données à d’autres afin de fournir un contexte

    Quelle est la différence entre les données liées de Tim Berners Lee et les données “ouvertes”?

    Article entier :« Page précédente Page suivante »

Laisser un commentaire

Avertissement: Les commentaires sont soumis au modérateur ce qui peut retarder leur publication. Il n'est pas utile de les renvoyer dans l'intervalle, merci.