Ensimag, année 2008/2009
 

PROPOSITION DE TER

 
 

RESPONSABLE : Jérôme Euzenat (associé à Jérôme David)

LABORATOIRE ET ÉQUIPE : Exmo, INRIA Rhône-Alpes et LIG

ADRESSE ÉLECTRONIQUE : Jerome . Euzenat # inrialpes . fr

Exploiter DBPedia pour aligner des ontologies

Thème général

Web sémantique, ontologies, alignement d'ontologies, connaissance de contexte.

Compétences attendues

Aptitude à la conception modulaire, goût d'expérimentation.

Contexte du travail

Le web sémantique est une évolution du web mettant en jeu de la connaissance formalisée. Celle-ci est décrite à l'aide d'ontologies spécifiant le vocabulaire et les contraintes pesants sur cette connaissance. Dans différents contextes, différents acteurs utiliseront des ontologies différentes. C'est pourquoi, afin de pouvoir appréhender des sources d'informations annotées par, ou exprimées dans, des ontologies différentes, il est nécessaire de faire le lien entre diverses ontologies.

Une des manières de lier ces ontologies est de trouver les correspondances existant entre les entités de ces deux ontologies. Cette activité est nommée alignement d'ontologies [1]. L'alignement d'ontologies prend en entrée deux ontologies et produit en sortie un ensemble de correspondances entre les entités de chacune des ontologies. Une correspondance est définie par les deux entités reliées (qui peuvent être des classes, des instances, des propriétés, des termes, mais aussi des combinaisons complexes de ceux-ci), la relation liant ces entités (équivalence, subsomption, incompatibilité, etc.) et si possible une mesure de confiance dans cette correspondance.

L'équipe-projet Exmo est spécialisée dans les technologies du web sémantique et particulièrement dans les techniques de mise en correspondance d'ontologies et dans leur exploitation.

Sujet

L'une des approches développées récement et dont les résultats sont prometteurs est l'alignement basé sur le contexte dans lequel on resitue les concepts des ontologies à aligner par rapport à un contexte commun (qui peut-être une ontologie ou une autre ressource) et à extraire de ce contexte les relations entre ces concepts.

Cette approche a été testée avec des ontologies spécialisées (à la médecine), avec le web [2] ou avec toutes les ontologies du web sémantique [3]. On se propose d'évaluer l'opportunité d'utiliser cette approche à l'aide de DBPedia [4]. DBPedia peut être simplement considéré comme la "RDFication" de wikipedia, c'est-à-dire qu'elle expose toute l'information contenue dans wikipedia sous forme de graphes RDF, donc facilement manipulable par un programme. De surcroît, DBPedia introduit des liens avec d'autres ressources disponibles sur le web comme geonames, umbel (une ontologie fondée sur Cyc) et WordNet. Mais l'un des autres traits intéressant est que DBPedia contient toutes les langues disponibles dans wikipedia.

Utiliser DBPedia comme une ressource de contexte pour aligner les ontologies ouvrirait la possibilité de:

On se propose donc d'étudier la possibilité d'exploiter les informations disponibles dans DBPedia dans le processus d'alignement d'ontologies. Idéalement, il faudrait proposer un schéma d'algorithme exploitant certaines informations en fonction des caractéristiques des ontologies à mettre en correspondance.

Résultats attendus

Le but du TER est de proposer un algorithme d'alignment sur la base de DBPedia. Pour ce faire, on s'appuiera sur la connaissance des techniques existantes et en particulier des techniques fondées sur le contexte. On se basera sur un exemple d'ontologies à aligner pour mettre en évidence le bien fondé des choix opérés. Il sera aussi nécessaire d'identifier d'autres ressources nécessaires (exploiter WordNet ou utiliser un détermineur de langue indépendant).

Plus précisément, le travail demandé pourra se décomposer en:

Références

[1] Jérôme Euzenat, Pavel Shvaiko, Ontology matching, Springer, Berlin (DE), 2007
[2] Zharko Aleksovski, Using background knowledge in ontology matching, PhD thesis, Vrije Universiteit Amsterdam, 2008
[3] Marta Sabou, Mathieu d'Aquin, Enrico Motta, Using the semantic web as background knowledge for ontology mapping, Proc. 1st ISWC Ontology Matching workshop, Athens (GA US), 2006
[4] Soren Auer, Chris Bizer, Jens Lehmann, Georgi Kobilarov, Richard Cyganiak, Zak Ives, DocumentDBpedia: A Nucleus for a Web of Open Data, Proc. 6th ISWC, Busan (KR), LNCS 4825, 2007