PhD position / Sujet de thèse

Heterogeneous data modelling and exploitation for SmartCities

Machine-to-machine applications for smartcities are currently mostly developed in an ad hoc and vertical manner. Each actor deploying applications concerning the domain they master (energy provider, water supplier, transportation operator, municipality, etc.). These applications barely share infrastructure (sensors, networks) nor data.

Many of these vertical applications may benefit from using information sources from different origins to enhance their own services. For instance, energy and transportation management may be associated for better dealing with electric vehicles. For this reason, it seems worth developing a data aggregation and interchange platform as part of the (communication) infrastructure instead of specific services pertaining to each vertical application.

The main use case of this thesis is the smartcity domain: the intelligent use of information originating from heterogeneous sources such as transportation system, meteorological forecast, for developing vertical applications, such as energy management.

The research objective will be the modelling and exploitation of these data in the context of an intermediation platform for such smartcity applications. Semantic mediation will be used to correlate, aggregate and dispatch data. The use of semantic (web) technologies, e.g., RDF, OWL, SPARQL, Alignments, should contribute to the reusability, interoperability and evolutivity of data and their description. The platform will allow stakeholders to express, ahead of use, their constraints with respect to the control that they want to enforce on data they produce or consume. These constraints will be used for opportunistically negociate data exchange on the platform.

Expected results are an experimental intermediation platform based on these principles which should allow for evaluating the adequacy of proposed servives to the need of stakeholders in such a complex ecosystem. This would require solving problems such as:

The main challenges are related to the semantic reconciliation due to the diverse data origin, the scalability of the proposed platform and the online aspect of data treatment and interchange.


French version

Modélisation et exploitation de données hétérogènes pour les SmartCities

Les applications machine-to-machine (M2M) pour la ville intelligente se développent actuellement tout en fonctionnant encore majoritairement d'une manière ad hoc et verticalisée, déployées séparément par chacun des acteurs qui les maitrisent (opérateurs d'énergie, d'eau, de transport, municipalités, etc.) Ces applications partagent rarement les éléments de leur infrastructure (capteurs, réseaux capillaires) et les données correspondantes avec les autres applications opérant dans le même environnement.

Beaucoup de ces applications « horizontales » peuvent profiter et utiliser les sources d'informations de différentes origines pour enrichir leurs propres services - par exemple associer la gestion du transport et de l'énergie dans le contexte des voitures électriques. Pour cette raison il semble utile de développer une plateforme d'échange et d'aggrégation de données faisant partie de l'infrastructure (de communication) plutôt que spécifique à ces applications verticales.

Cette thèse aura pour cas d'usage le domaine des Smart Cities: par exemple la gestion de l'énergie dans le contexte des voitures, avec un usage intelligent des informations provenant d'autres sources comme les systèmes de transport ou les facteurs météorologiques. La médiation sémantique sera utilisée afin de corréler et agréger les données.

L'objectif de cette thèse est de modéliser et d'exploiter des données de diverses origines dans le cadre d'une plate-forme d'intermédiation pour les applications Smart Cities. Elle devra permettre pour les différents acteurs d'exprimer, en avance de phase, leurs contraintes vis-à-vis du contrôle qu'ils souhaitent exercer sur les données qu'ils produisent ou consomment et de négocier de gré à gré l'échange de données en accord avec ces contraintes et requêtes.

Afin de permettre la réutilisabilité, l'interoperabilité et l'évolutivité, on explorera l'utilisation des technologies du web sémantique (RDF, OWL, SPARQL, Alignments) dans la mise à disposition des données et dans leur description.

Le résultat attendu de cette thèse est une plateforme expérimentale d'intermédiation basée sur le modèle cité ci-dessus qui permet de valider l'adéquation de services proposés aux besoins des acteurs dans cet écosystème complexe. Cela nécessitera de résoudre certains problèmes:

Les défis à relever sont d'ordre sémantique vu la diversité d'origines des données, passage à l'échelle de la solution proposée, traitement au fil de l'eau des données.


Qualification: Master or equivalent in computer science.

Researched skills:

Environnement: The doctoral work is to be carried out within Orange Labs (Meylan) in collaboration with the Exmo team at INRIA (Montbonnot). Orange Lab is the main source of innovation of the worldwide telecommunication provider Orange contributing to new generations of innovative, integrated and simple communication services. Exmo is a reputed team within the semantic web research area and particularly on ontology matching. Exmo is also participating in a European support action (Ready4SmartCities) on data interchange in SmartCities involving many European actors.

Doctoral school: Doctoral school MSTII, Université de Grenoble.

Advisor: Jérôme David (Jerome:David#inria:fr) or Jérôme Euzenat (Jerome:Euzenat#inria:fr) & MADHUSUDAN Giyyarpuram (giyyarpuram:madhusudan#orange:com)

Group: Exmo, INRIA & LIG

Hiring date: Fourth quarter 2013.

Place of work: The position is located at Centre Norbert Segard, Orange Labs in Meylan, a main center for Orange telecommunication and software research. Secondarily it will be held at INRIA Grenoble Rhône-Alpes, Montbonnot a main computer science research lab, in a stimulating research environment. Both places are near Grenoble (France) and separated by roughly one kilometer.

Duration: 36 months

Salary: According to Orange practices. The modalities will be under a CIFRE contract (between Orange, INRIA, the candidate and ANRT).

Contact: For further information, contact Jerome:Euzenat#inria:fr and giyyarpuram:madhusudan#orange:com.

Procedure: Contact us.

File: Provide Vitæ, motivation letter and references. It is very good if you can provide a Master report and we will certainly as for your marks in Master, so if you have them, you can join them.

See Also: http://orange.jobs/jobs/offer.do?joid=32885&lang=fr&wmode=light.


http://exmo.inria.fr/training/Th-2013-smartcity.html

$Id: Th-2013-smartcity.html,v 1.7 2017/01/13 19:59:25 euzenat Exp $