Bibliography on INRIA-Escrire (2017-06-06)
Jérôme Euzenat, L'annotation formelle de documents en (8) questions, in: Régine Teulier, Jean Charlet, Pierre Tchounikine (éds), Ingénierie des connaissances, L'Harmattan, Paris (FR), 2005, pp251-271
Annoter un ensemble de documents informels à l'aide de représentations formelles appelle plusieurs questions qui doivent trouver une réponse si l'on veut développer un système cohérent. Ces questions sont liées à la forme et à l'objet des représentations retenues, à la nécessité d'utiliser de la connaissance indépendante du contenu des documents (ontologies, connaissance de contexte) et au statut du système résultant (grande base de connaissance ou éléments de connaissance distribués). Ces questions sont décrites et illustrées par l'annotation de résumés d'articles en génétique moléculaire.
Web sémantique, recherche de documents par le contenu, annotation formelle, représentation du contenu, ontologie, connaissance de contexte
Rim Al-Hulou, Olivier Corby, Rose Dieng-Kuntz, Jérôme Euzenat, Carolina Medina Ramirez, Amedeo Napoli, Raphaël Troncy, Three knowledge representation formalisms for content-based representation of documents, in: Proc. KR workshop on Formal ontology, knowledge representation and intelligent systems for the world wide web (SemWeb), Toulouse (FR), 2002
Documents accessible from the web or from any document base constitute a significant source of knowledge as soon as the document contents can be represented in an appropriate form. This paper presents the ESCRIRE project, whose objective is to compare three knowledge representation (KR) formalisms, namely conceptual graphs, description logics and objects, for representing and manipulating document contents. The comparison relies on the definition of a pivot language based on XML, allowing the design of a domain ontology, document annotations and queries. Each element has a corresponding translation in each KR formalism, that is used for inferencing and answering queries. In this paper, the principles on which relies the ESCRIRE project and the first results from this original experiment are described. An analysis of problems encountered, advantages and drawbacks of each formalism are studied with the emphasis put on the ontology-based annotations of document contents and on the query answering capabilities.
Jérôme Euzenat, Eight questions about semantic web annotations, IEEE Intelligent systems 17(2):55-62, 2002
Improving information retrieval is annotation¹s central goal. However, without sufficient planning, annotation - especially when running a robot and attaching automatically extracted content - risks producing incoherent information. The author recommends answering eight questions before you annotate. He provides a practical application of this approach, and discusses applying the questions to other systems.
Semantic web, Search by content, Content representation, Ontology, Background knowledge
Jérôme Euzenat, L'annotation formelle de documents en huit (8) questions, in: Jean Charlet (éd), Actes 6e journées sur ingénierie des connaissances (IC), Grenoble (FR), pp95-110, 2001
Annoter un ensemble de documents informels à l'aide de représentations formelles appelle plusieurs questions qui doivent trouver une réponse si l'on veut développer un système cohérent. Ces questions sont liées à la forme et à l'objet des représentations retenues, à la nécessité d'utiliser de la connaissance indépendante du contenu des documents (ontologies, connaissance de contexte) et au statut du système résultant (grande base de connaissance ou éléments de connaissance distribués). Ces questions sont décrites et illustrées par la tentative d'annotation de résumés d'articles en génétique moléculaire.
Web sémantique, recherche par le contenu, annotation formelle, représentation du contenu, ontologie, connaissance de contexte
Jérôme Euzenat, XML est-il le langage de représentation de connaissance de l'an 2000?, in: Actes 6e journées sur langages et modèles à objets (LMO), Mont Saint-Hilaire (CA), pp59-74, 2000
De nombreuses applications (représentation du contenu, définition de vocabulaire) utilisent XML pour transcrire la connaissance et la communiquer telle quelle ou dans des contextes plus larges. Le langage XML est considéré comme un langage universel et sa similarité avec les systèmes à objets a été remarquée. XML va-t-il donc remplacer les langages de représentation de connaissance? Un exemple concret permet de présenter quelques questions et problèmes posés par la transcription d'un formalisme de représentation de connaissance par objets en XML. Les solutions possibles de ces problèmes sont comparées. L'avantage et la lacune principale d'XML étant son absence de sémantique, une solution à ce problème est ébauchée.
Jérôme Euzenat, Problèmes d'intelligibilité et solutions autour de XML, in: Paul Kopp (éd), Actes séminaireCNES sur Valorisation des données, Labège (FR), 2000
Les problèmes d'intelligibilité et d'interopérabilité que pose et que résout le langage XML sont examinés en explorant progressivement les travaux destinés à les résoudre: XML en tant que langage universel, permet théoriquement l'interopérabilité. Mais XML, métalangage sans sémantique, n'offre aucune possibilité d'intelligibilité pour qui (humain ou programme) ne connaît pas le contenu. XML-Schéma n'améliore que l'interopérabilité en définissant très précisément les types de données (et parfois leurs unités). RDF, langage de description de ressources, est destiné à "ajouter de la sémantique" mais n'en dispose pas lui-même. Il sera donc très difficile (lire impossible) pour un programme de l'interpréter. Plusieurs initiatives indépendantes du W3C s'attachent à produire des langages de descriptions de contenu cette fois-ci dotés d'une sémantique rigoureuse. Ce faisant, ces langages réduisent drastiquement leurs champs d'utilisation et par conséquent les possibilités d'interopérabilité des documents les utilisant. Si le temps est suffisant, on pourra présenter brièvement (a) une proposition de langage de description de la sémantique destiné à préserver l'interopérabilité en améliorant l'intelligibilité ainsi que (b) un projet, actuellement en cours, de comparaison de plusieurs formalismes de représentation de connaissance pour la représentation du contenu.
XML, RDF, Schéma, DSD, Représentation de connaissance par objets, Sémantique
Raphaël Troncy, Intégration texte-représentation formelle pour la gestion de documents XML, DEA d'informatique, Université Joseph Fourier-INPG, Grenoble (FR), 2000
Actuellement, le Web contient d'importantes quantités d'informations couvrant tous les sujets imaginables. Le problème qui était avant de savoir si une information, même très spécifique, était disponible sur le Web, est mainte nant devenu comment retrouver cette information. Apporter du sens intelligible et exploitable par des machines aux documents devrait leur permettre d'utiliser l'information présente, d'améliorer les techniques de recherche, et donc de faire du Web une gigantesque base de connaissance. Les langages de représentation de connaissance sont de bons candidats si l'on souhaite décrire le contenu de documents. L'action Escrire a d'ailleurs pour objectif d'en comparer trois. Parmi eux, la représentation de connaissances à objets apparaît particulièrement adaptée lorsqu'il s'agit de représenter des connaissances complexes sur un domaine en cours d'étude. On pourra alors manipuler plus efficacement une base de documents en les indexant par leur contenu (ou leur sens). Les documents pertinents seront ramenés à partir de requêtes structurées tirant parti du formalisme de représentation de connaissance (hiérarchie de classes, mécanismes de classification...). Nous avons d'abord observé le lien étroit existant entre la nature de la connaissance à représenter et le type du document. Nous avons aussi pu voir que plus que le contenu, c'est l'application résultante qui va décider des éléments à représenter. Nous avons donc essayé d'imaginer quels types de requêtes un utilisateur est susceptible de poser, ce qui nous a conduit à proposer un langage de requêtes. Un corpus de travail a été utilisé pour mettre en oeuvre les choix effectués. Il concerne les interactions géniques chez la drosophile pendant son processus de segmentation. Le système de représentation de connaissances à objets Troeps gère les connaissances contenues dans les documents. Un évaluateur de requêtes a été intégré à ce système pour permettre de l'interroger.
Représentation de connaissance, Représentation du contenu, Sémantique, XML, Recherche d'information, Annotations, Ontologies, Objets
Raphaël Troncy, Intégration texte-représentation formelle pour la gestion de documents XML, Magistère d'informatique, Université Joseph Fourier-INPG, Grenoble (FR), 2000
Représentation de connaissance, Représentation du contenu, Sémantique, XML, Recherche d'information, Annotations, Ontologies, Objets