Papers by Christophe Roche

Knowledge Integration

SpringerReference

Cet article s'intéresse à la faisabilité d'une mise en oeuvre informatique des principes terminol... more Cet article s'intéresse à la faisabilité d'une mise en oeuvre informatique des principes terminologiques tels qu'ils sont définis par les normes ISO 1087 et 704.

Dynamic Modelling and Simulation of Information Systems using Multi-Agent Systems

International audienc

Résumé/Abstract LRO et EAQUE constituent un environnement pour générer des systèmes experts. Un n... more Résumé/Abstract LRO et EAQUE constituent un environnement pour générer des systèmes experts. Un noyau important existe, à la fois pour définir une certaine représentation des connaissances (LRO, langage orienté objet), et pour définir une structure de contrôle ...

Research paper thumbnail of Weighted Co-Occurrence Bio-Term Graph for Unsupervised Word Sense Disambiguation in the Biomedical Domain

IEEE Access

Word Sense Disambiguation (WSD) is a significant and challenging task for text understanding and ... more Word Sense Disambiguation (WSD) is a significant and challenging task for text understanding and processing. This paper presents an unsupervised approach based on Weighted Co-occurrence bio-Term Graph (WCOTG) for performing WSD in the biomedical domain. The graph is automatically created from biomedical terms that are extracted from a corpus of downloaded scientific abstracts. Two kinds of weights are introduced on the links of the built bio-term graph and are taken as important factors in the process of disambiguation. The modified Personalised PageRank (PPR) algorithm is used for performing WSD. When evaluated on the NLM-WSD and MSH-WSD test datasets, and an acronym test set, the method outperforms the widely used unsupervised ones addressing the same problem, and the average result is almost equal to that of the BlueBERT_LE-based method. In contrast, our method has no additional enhancement or training for BERT-based models. Comparative experiments validate the positive effect of links' weight on disambiguation efficiency. Last, the statistical experiments on the relation among system accuracy, the numbers of medical abstracts in the corpus, and the corresponding extracted terms suggest an excellent minimum corpus scale, when resources are limited. INDEX TERMS Biomedical informatics, biomedical natural language processing, word sense disambiguation, unified medical language system, personalised PageRank algorithm.

HAL (Le Centre pour la Communication Scientifique Directe), Jun 3, 2010

In this paper, we examine the limitations of the traditional semiotic triangle from the point of ... more In this paper, we examine the limitations of the traditional semiotic triangle from the point of view of ontology-based, multipurpose terminology management and suggest an alternative model based on the concept of terminological lexeme. The new model is being tested in the TermFactory project aimed at creating a platform and a workflow for distributed collaborative ontology-based terminology work.

Terminologie et Ontologie pour l’Héritage Culturel : Le projet TAO CI

HAL (Le Centre pour la Communication Scientifique Directe), Nov 24, 2020

International audienc

Ontoreverse : mieux comprendre les logiciels pour réduire leurs coûts de maintenance

HAL (Le Centre pour la Communication Scientifique Directe), Apr 1, 2015

Transparency of Chinese Acupuncture and Moxibustion Terms: A Resource for Scientific Research and Collaboration

HAL (Le Centre pour la Communication Scientifique Directe), Jun 7, 2018

International audienc

Proposition d'un modèle computationnel du concept pour la Terminologie

HAL (Le Centre pour la Communication Scientifique Directe), Jun 7, 2018

International audienc

RIO: a framework for ontological knowledge representation

HAL (Le Centre pour la Communication Scientifique Directe), Nov 1, 1995

International audienc

HAL (Le Centre pour la Communication Scientifique Directe), Nov 1, 2017

In this paper, we examine the limitations of the traditional semiotic triangle from the point of ... more In this paper, we examine the limitations of the traditional semiotic triangle from the point of view of ontology-based, multipurpose terminology management and suggest an alternative model based on the concept of terminological lexeme. The new model is being tested in the TermFactory project aimed at creating a platform and a workflow for distributed collaborative ontology-based terminology work.

BAAL: an agent-oriented language for modelling and simulation

HAL (Le Centre pour la Communication Scientifique Directe), Oct 1, 1996

International audienc

Nous souhaitons, avec cette première Disputatio TOTh, renouer avec une forme d'enseignement et de... more Nous souhaitons, avec cette première Disputatio TOTh, renouer avec une forme d'enseignement et de recherche héritée de la scolastique. Notre objectif est ici de donner accès à des textes jugés fondateurs pour notre discipline, trop souvent délaissés voire ignorés. Sans reprendre la structure codifiée de la disputatio, ni tendre vers des travaux d'exégète ou de philologue, notre démarche repose sur l'étude d'un texte interprété sous l'angle de la terminologie et de l'ontologie. Cet article est un résumé de la disputatio présentée à TOTh 2011. Structurée en 3 temps, l'auteur et son oeuvre, la lecture commentée et les débats, nous ne retiendrons ici que les deux premières parties.

Conception d'une plateforme de gestion collective des idées innovantes: IM-Station

HAL (Le Centre pour la Communication Scientifique Directe), Dec 1, 2003

International audienc

Research paper thumbnail of Weighted Co-Occurrence Bio-Term Graph for Unsupervised Word Sense Disambiguation in the Biomedical Domain

IEEE Access, 2023

Word Sense Disambiguation (WSD) is a significant and challenging task for text understanding and ... more Word Sense Disambiguation (WSD) is a significant and challenging task for text understanding and processing. This paper presents an unsupervised approach based on Weighted Co-occurrence bio-Term Graph (WCOTG) for performing WSD in the biomedical domain. The graph is automatically created from biomedical terms that are extracted from a corpus of downloaded scientific abstracts. Two kinds of weights are introduced on the links of the built bio-term graph and are taken as important factors in the process of disambiguation. The modified Personalised PageRank (PPR) algorithm is used for performing WSD. When evaluated on the NLM-WSD and MSH-WSD test datasets, and an acronym test set, the method outperforms the widely used unsupervised ones addressing the same problem, and the average result is almost equal to that of the BlueBERT_LE-based method. In contrast, our method has no additional enhancement or training for BERT-based models. Comparative experiments validate the positive effect of links' weight on disambiguation efficiency. Last, the statistical experiments on the relation among system accuracy, the numbers of medical abstracts in the corpus, and the corresponding extracted terms suggest an excellent minimum corpus scale, when resources are limited. INDEX TERMS Biomedical informatics, biomedical natural language processing, word sense disambiguation, unified medical language system, personalised PageRank algorithm.

Research paper thumbnail of Préservation des mémoires numériques : Apports du terme et du concept

Préservation des mémoires numériques : Apports du terme et du concept

HAL (Le Centre pour la Communication Scientifique Directe), Jun 1, 2016

Au dela de la dimension materielle (support, format d’encodage, systeme de lecture), notre patrim... more Au dela de la dimension materielle (support, format d’encodage, systeme de lecture), notre patrimoine numerique est preserve dans la mesure ou nous sommes capables d’y acceder. Dans le monde informationnel qui est aujourd’hui le notre, exister, c’est etre accessible, visible. Comment representer et decrire dans un format lisible, mais aussi organiser et classer une information de telle sorte qu’elle demeure accessible ? Comment ensuite la retrouver ? Mais aussi comment et quoi chercher ? Des questions d’autant plus pregnantes que les donnees, a travers le reseau internet et au-dela de la barriere des langues et des cultures, s’ouvrent et se lient par de multiples relations en une toile encore plus inextricable (donnees ouvertes et liees). Face a ces interrogations, les « connaissances » du domaine, qu’elles soient linguistiques, a travers les termes employes pour decrire le patrimoine, ou conceptuelles, a travers les idees que nous nous en faisons, apparaissent comme une panacee. Parfois qualifiees de « metadonnees » ou de « semantiques », on espere, grâce a ces connaissances, organiser et structurer nos memoires, identifier les termes qui en parlent le mieux, et ainsi les preserver puisqu’on saura comment y acceder. La demarche releve des Sciences de l’information – des thesaurus pour etre plus precis – de la Terminologie, de la Linguistique dans une certaine mesure, et surtout de la Modelisation des connaissances. Autant de disciplines fortement impactees par les dernieres avancees du numerique. Le web est devenu semantique, les bases de connaissances se font ontologies, une notion qui envahit egalement la Terminologie et les thesaurus – les normes internationales ISO (International Organization for Standardization), censees regimenter tout cela, qu’elles portent sur la Terminologie (TC 37) ou la Gestion de l’information (TC 46), n’y echappent pas. Nous verrons, dans le cadre de cette contribution, les notions de Terminologie, d’Ontologie et de Thesaurus etudiees sous l’angle du terme et du concept. Nous verrons ainsi ce que ces approches ont de commun qui justifie qu’on puisse ici les convoquer, mais aussi en quoi elles different. En effet, si une terminologie, tout comme une ontologie, peuvent etre mobilisees a des fins de gestion de l’information, elles ne se confondent pas et ne sont pas davantage des thesaurus ; et reciproquement. Par contre, les associer en un nouveau paradigme qui reste a preciser ouvre des perspectives des plus interessantes, comme le laisse a penser le theme « thesaurus et ontologies » de la conference. Cela nous amenera au dernier chapitre consacre a la notion d’ontoterminologie, terminologie dont le systeme notionnel est une ontologie formelle. Nous verrons comment cette demarche permet la gestion de l’information prenant en compte le multilinguisme et le multiculturalisme. Elle offre egalement, nous l’illustrerons a travers un premier exemple dedie a la gestion de contenus, de nouveaux paradigmes de navigation interactive et de recherche semantique. Une application aux thesaurus multilingues realisee dans le cadre d’un projet europeen dedie a la gestion de biens culturels (Projet FP7 AthenaPlus) cloturera l’article.

From objets to agents: the K/1 agent-based language

HAL (Le Centre pour la Communication Scientifique Directe), Jun 1, 1994

International audienc

Research paper thumbnail of Dire n'est pas concevoir

HAL (Le Centre pour la Communication Scientifique Directe), Jul 4, 2007

http://www.ontology.univ-savoie.fr Résumé : Nous verrons dans le cadre de cet article que l'extra... more http://www.ontology.univ-savoie.fr Résumé : Nous verrons dans le cadre de cet article que l'extraction de connaissances à partir de textes relève avant tout de la linguistique textuelle dont un des principes est l'incomplétude des textes ; et qu'il est difficile de prendre en considération les connaissances extralinguistiques nécessaires à leur compréhension. L'utilisation de figures de style, telles que la métonymie et la synecdoque, modifie profondément la perception que nous pouvons avoir des concepts du domaine. La structure conceptuelle extraite à partir de textes n'est pas une ontologie, comprise comme connaissance consensuelle et générale (non contingente) partagée par une communauté d'acteurs, mais est du ressort de la sémantique lexicale : structure conceptuelle du domaine et structure lexicale ne se superposent pas. Si le langage naturel n'est pas un mode d'expression adapté à la description d'ontologies, nous verrons également que les langages formels posent un certain nombre de problèmes qui leur sont propres. La modélisation d'ontologies reste avant tout un problème épistémologique.