You are on page 1of 3

Compte rendu de la runion de lancement du projet GeOnto

~
Vendredi 18 janvier 2008
Lieu de la runion : INRIA Saclay Ile de France - Parc Orsay-Universit, 4 rue Jacques
Monod, Orsay Salle G008 ~ 10h 16h30
Prsents :
LRI/IASI : Nathalie Pernelle, Brigitte Safar, Chantal Reynaud, Hafa Zargayouna
COGIT : Nathalie Abadie, Sbastien Mustire
IRIT : Mouna Kamel, Ollivier Haemmerl
LIUPPA : Mauro Gaio, Pierre Loustau, Christian Sallaberry
Excuss :
Nathalie Aussenac (IRIT), Franoise Angrand (ANR)
1. Introduction la journe (Chantal Reynaud)
Prsentation de lordre du jour. Rappel des objectifs gnraux du projet, du contexte, du
domaine dapplication retenu et prsentation synthtique des diffrents lots.
2. Prsentations des diffrents partenaires
Chaque partenaire a brivement prsent son quipe de recherche (cf. photocopies de
transparents jointes) et les ressources, techniques ou approches apportes dans le projet.
COGIT/IGN : Sbastien Mustire
- Illustration des difficults de lappariement des schmas des bases de donnes TOPO et
CARTO du fait de linsuffisance de smantique et du besoin dexploiter les spcifications
associes aux schmas de ces bases qui, elles, sont riches en information.
- Prsentation des spcifications associes aux schmas des bases : des documents
volumineux, trs riches, structurs (structure parfois diffrente dun schma un autre)
mais comportant quand mme du texte libre.
- Prsentation des approches de construction dontologies partir de spcifications et
dalignement dj exprimentes au COGIT et des problmes associs : les ontologies
obtenues ne sont pas exhaustives et contiennent des erreurs (relations entre concepts
parfois mal types).
- Bilan sur les ressources disponibles : 2 taxonomies correspondant deux bases de donnes
gographiques (TOPO et CARTO), 1 taxonomie issue de leur fusion (rorganisation
manuelle partielle)
- Prsentation de travaux raliss en appariement gographique de donnes.
- Rsultats attendus rappels : ontologie(s) plus riche(s) et plus juste(s), mthodologies de
construction, dalignement et de comparaison dontologies, exploitation des ontologies
pour comprendre le point de vue dcrit, intgrer des schmas de bases de donnes, accder
aux donnes gographiques via un portail.
IRIT : Mouna Kamel, Ollivier Haemmerl
- Prsentation de lapproche dextraction de relations par patrons lexico-syntaxiques et son
intgration au sein dun processus de construction dontologie.
- Prsentation de deux outils utiliss lIRIT : Cameleon dvelopp lIRIT (gratuit et
disponible bibliothque de 70 patrons valids patrons dfinis par des non-

informaticiens) et la plate-forme dingnierie linguistique Gate (libre daccs trs


utilise application successive de ressources linguistiques utilisable par des
informaticiens : patrons dfinis en Jape - dfinition possible de classes smantiques au
sein des patrons). Le choix entre les deux outils peut aussi dpendre de lobjectif vis :
enrichir, peupler, annoter, indexer une ontologie.
Prsentation du problme de lextraction de relations entre des termes appartenant des
phrases diffrentes.
Rappel de la contribution au projet : extraction de concepts partir doutils prouvs,
extraction de relations partir de patrons lexico-syntaxiques (adaptation de patrons,
dfinition de nouveaux patrons exploitant le type de document, sa structure), rechercher
les paramtres dune relation en exploitant les relations argumentatives, identifier les
relations exprimes sur plusieurs phrases.

LIUPPA : Christian Sallaberry, Mauro Gaio, Pierre Loustau


- Prsentation de lapproche de recherche dinformation gographique par contenu du projet
DESI : des traitements faits lchelle du syntagme nominal construit autour dentits
spatiales, des recherches de motifs dune granularit suprieure sappuyant sur lextraction
dentits spatiales et temporelles, sur lexploitation de connaissances complmentaires et
sur la mise en uvre de mcanismes de raisonnement spcifiques.
- Prsentation du modle pour reprsenter les entits spatiales faisant une distinction entre
ces entits selon quelles peuvent tre go-localises ou non (entits spatiales absolues ou
relatives) et du modle pour reprsenter les entits temporelles calendaires (absolues et
relatives galement). Ces modles peuvent faire lobjet de traitements informatiques de
faon, par exemple, reconstruire un itinraire partir de son vocation dans un texte.
- Prsentation du fonds documentaire patrimonial mis disposition par la mdiathque de
Pau. Les documents (rcits de voyage) composant ce fonds dcrivent le territoire local.
LRI : Brigitte Safar, Nathalie Pernelle
- Prsentation de loutil dalignement de taxonomies TaxoMap : contexte dapplication,
types de mappings produits, nature des ressources mises en correspondance,
caractristiques du processus mis en uvre, description des techniques composant le
systme et de la faon dont elles sont appliques.
- Prsentation du problme de la rconciliation des donnes et de lapproche LN2R,
totalement automatique, combinant une approche logique infrant des dcisions de
rconciliation (ou de non rconciliation) sres et une approche numrique fonde sur
un calcul de similarit.
- Rappel des objectifs dans le projet : tester et tendre loutil TaxoMap pour grer
lhtrognit structurelle du point de vue de la prcision, de la qualit et de la
fiabilit de la reprsentation, analyser les rsultats dappariement dans un but de
fusion, de rorganisation dontologie ou de comprhension des points de vue
modliss, combiner des techniques de recherche de mises en correspondance entre
concepts et entre instances.
3. Point organisation
-

Mise en place dun site Web au plus tard T0+6 sur lequel seront dposs les
ressources mises disposition du projet par les partenaires ainsi que les donnes
relatives aux runions organises (ordre du jour, compte rendu, transparents des
prsentations). Responsable : Chantal Reynaud.

Le COGIT communique des versions .doc des spcifications de bases de


donnes gographiques ds que possible.
Le LIUPPA communique trs prochainement des documents textuels extraits dun
corpus documentaire numris constitu de rcits de voyages.
LIGN dispose dun lexique franco-anglais des termes gographiques (origine
diffrente des ontologies). Il pourra tre communiqu aux partenaires du projet.
LIRIT et le LIUPPA se mettent en relation pour travailler sur le problme de
lextraction des concepts et des relations. Une runion est prvue le 15/02 Toulouse
pour approfondir et comparer les outils dextraction des deux partenaires.
Le COGIT et le LRI prvoient de se runir dbut mars (la date prcise sera fixe
ultrieurement) suite aux premires exprimentations qui seront effectues au LRI en
alignement dontologies sur les ontologies TOPO et CARTO transmises par le
COGIT. Le COGIT transmettra galement la taxonomie (ONTOGEO) issue de la
fusion de CARTO et TOPO.
Le comit de pilotage du projet se runira la fin du 1er semestre 2008 et fera le point
sur lavancement du projet dans sa globalit. La runion aura lieu dbut juin Pau.

Fin de la runion de lancement du projet Geonto 16h30.


Chantal Reynaud

You might also like