575 Works

Construire et évaluer une application de veille pour l'information sur les événements sismiques.

Romaric Besançon, Olivier Ferret & Ludovic Jean-Louis
RÉSUMÉ. Le développement d'applications opérationnelles de veille pour des domaines spéci- fiques nécessite l'intégration de nombreuses techniques et outils issus du champ de la recherche d'information et du traitement automatique des langues. Dès lors, un des défis présidant à une telle intégration est la prise en compte des limitations propres à chacune de ces techniques et outils en termes d'influence sur le résultat final du système. Plus précisément, nous pré- sentons dans cet article une...

A la Recherche de noeuds informatifs dans des corpus de documents XML.

Karen Sauvagnat & Mohand Boughanem
Un des principaux challenge de la Recherche d'Information dans des documents XML est le traitement des requêtes composées de simples mots-clés. L'utilisateur exprimant de telles requêtes ne donne en effet aucune indication au système sur la granularité de l'information qu'il désire. De quel type doit-être cette information ? Les documents XML pouvant être considérés comme des arbres, chercher les parties de documents pertinentes à une requête revient à chercher des sous-arbres pertinents. Ceci soulève les...

Une nouvelle approche pour la modélisation du prol de l'utilisateur dans les systèmes de filtrage d'information basés sur le contenu: le modèle de filtre détecteur de nouveauté.

Randa Kassab, Jean-Charles Lamirel & Emmanuel Nauer
Cet article présente un mécanismme original pour la modélisation du profil de l'utilisateur dans les systèmes de filtrage d'information basés sur le contenu. Ce mécanisme repose sur un modèle de filtre basé sur la détection de la nouveauté. En exploitant les bouclages de pertinence positif et négatif, ce modèle permet à la fois de construire incrémentalement une représentation synthétique, ou profil, du besoin de l'utilisateur et d'adapter ce profil selon le changement de ses centres...

Query by Example for Symbolic Still Image Retrieval.

Emmanuel Debanne & Philippe Mulhem
RÉSUMÉ . Cet article décrit et défini l'utilisation de requêtes par l'exemple (QBE) dans le cadre de recherche symbolique d'images photographiques. La nouveauté de cette approche consiste en l'utilisation conjointe d'indexation symbolique automatique et d'un formalisme de représentation de connaissances pour représenter le contenu des images. De plus, le mécanisme d'abstraction perm la recherche d'images par l'exemple et le bouclage de pertinence basés sur la représentation symbolique des images, et pas sur leur description signal...

Compression de structure XML pour la recherche d'information structurée.

Michel Beigbeder
RÉSUMÉ. La recherche d'informations dans les documents structurés nécessite le stockage de la structure des documents indexés dans les index. Si de nombreuses méthodes sont connues et largement utilisées pour compresser les index pour les documents plats, le stockage efficient de la structure est peu étudié. Nous présentons une représentation de structure arborescente adap- tée à la recherche d'information structurée, puis nous proposons une méthode de compression des données de cette représentation. Nous présentons les...

Analyse morphologique fine pour la recherche d'information biomédicale.

Vincent Claveau & Ewa Kijak
RÉSUMÉ. Dans le domaine biomédical, l'emploi de termes spécialisés est la clef de l'accès à l'in- formation. Mais dans la plupart des langues indo-européennes, ces termes sont des construc- tions morphologiques complexes. Dans cet article, nous cherchons à identifier les différents éléments de sens composant ces termes et utilisons ces analyses pour améliorer la recherche d'information biomédicale. Nous présentons en particulier une approche automatique combi- nant alignement avec une langue pivot et apprentissage analogique permettant...

Aide à l'interprétation de documents juridiques - une approche centrée utilisateur.

Youssouf Saidali, Julien Lecanu, Éric Trupin & Jacques Labiche
RÉSUMÉ . Nous présentons un projet de recherche en cours visant à améliorer les interactions d'utilisateurs de différentes catégories professionnelles avec un système d'information dédié au droit du transport et de la logistique. L'objectif vise à concevoir et à mettre au point un environnement numérique de travail (ENT) destiné à un public professionnel (entreprises de la filière logistique, juristes, risk managers, assureurs, avocats, ...) et non professionnel (usagers ou salariés des transports). Après avoir posé...

Vectorisation des processus d'appariement document-requête.

Vincent Claveau, Romain Tavenard & Laurent Amsaleg
RÉSUMÉ. Dans la plupart des applications de RI, calculer rapidement la proximité entre do- cuments et requêtes est crucial. Avec les modèles vectoriels, ce calcul se fait généralement de manière très efficace. Cependant, lorsque les requêtes sont très longues ou dans le cas de SRI basés sur des modèles plus avancés, ce calcul devient plus complexe et coûteux. Dans cet article, nous proposons une technique simple pour transformer n'importe quel processus d'ap- pariement requête-document fournissant...

Définition et exploitation des méta-rôles des utilisateurs pour la recherche d’information collaborative.

Laure Soulier & Lynda Tamine
RÉSUMÉ. La recherche d’information collaborative est un processus particulier impliquant un ensemble d’utilisateurs partageant un même besoin en information. Dans ce contexte, l’exploitation de la division du travail au travers des rôles est une des techniques utilisées pour structurer la session de recherche et optimiser son efficacité. Dans ce papier, nous proposons d’étudier les caractéristiques de comportement d’une paire de collaborateurs sur la base d’hypothèses de leur complémentarité. Nous définissons ainsi la notion de rôles...

Recherche d'information dans des documents structurés par proximité des termes.

Michel Beigbeder
RÉSUMÉ. Nous présentons une méthode pour calculer un score d'un élément quelconque d'un document structuré qui prend en compte la proximité des termes de la requête dans le texte du document. Plus précisément nous définissons autour de chaque occurrence d'un terme de la requête une fonction d'influence. Pour une occurrence qui apparaît dans le texte proprement dit, cette fonction d'influence décroit linéairement de 1 à 0 selon la distance à l'occurrence. Lorsqu'un terme de la...

Étude des mesures de similarité sémantique basées sur les arcs.

Aly Ngoné Ngom
RESUME. Les mesures de similarité sémantique sont des fonctions très utilisées dans plusieurs domaines de l’informatique parmi lesquels nous pouvons citer le Traitement Automatique du Langage Naturel (TALN), la Bioinformatique, la Recherche d’Information... Elles permettent de déterminer la similarité entre des termes ou concepts qui n’ont aucune ressemblance syntaxique. L’objectif de ce papier est de faire une étude d’une classe particulière de mesures de similarité sémantique : les mesures basées sur les arcs. Nous ferons,...

Introduction de la sémantique d'un document sous le modèle de langage.

Arezki Hammache, Mohand Boughanem & Rachid Ahmed-Ouamer
RÉSUMÉ. La plupart des systèmes de recherche d'information classiques se basent sur une indexation par termes simples. Cependant, ces derniers délivrent beaucoup de résultats en réponse aux requêtes des utilisateurs. Ceci est du en partie au fait que le contenu sémantique d'un document (ou d'une requête) ne peut pas être capturé précisément par un simple ensemble de mots clés indépendants. Deux directions sont explorées pour incorporer la sémantique dans les modèles de langage. La première...

Selection of Search Facets.

Aparna Nurani Venkitasubramanian & Marie-Francine Moens
RÉSUMÉ. Les recherches par mots clés sur le Web donnent souvent une énorme quantité de pages Web pertinentes. Un cadre qui intègre les avantages á la fois des u mot-clé » et des u facettes » des recherches a des larges avantages pour les utilisateurs Web, car il offre une meilleure or- ganisation des résultats de la recherche et une plate-forme utile pour guider les utilisateurs á trouver les informations pertinentes. Dans un cadre pareil,...

Classification de questions par traduction.

Anne-Laure Ligozat
RÉSUMÉ. Dans cet article, nous nous intéressons à la classification de questions pour un système de questions-réponses en français. Faisant le constat d'un manque de corpus annoté en français, nous nous interrogeons sur la possibilité d'exploiter les corpus anglais existants, en utilisant des traducteurs automatiques. Nous avons mené une série d'expériences en faisant varier le sens de traduction des corpus et les attributs fournis au classifieur. Les résultats mon- trent qu'il est possible de s'approcher...

Choix d'une mesure d'association pour une extension de requête contôlée : la question de l'orientation de la mesure.

Christophe Brouard
RÉSUMÉ . Cet article présente une étude comparative de mesures d'association dans le contexte de la construction automatique de thésaurus. L'étude porte plus particulièrement sur la question de l'orientation de la mesure d'association. Différentes solutions sont distinguées et testées dans le cadre d'une tâche de filtrage adaptatif dans laquelle le thésaurus est utilisé pour sélectionner des termes d'indexation à ajouter au cours de l'apprentissage. Les résultats obtenus sur le corpus OSHUMED montrent une forte influence...

Recherche de passages pertinents dans les fichiers logs par enrichissement de requêtes.

Hassan Saneifar, Stéphane Bonniol, Anne Laurent, Pascal Poncelet & Mathieu Roche
RÉSUMÉ. Les systèmes de question réponse sont considérés comme la prochaine génération des moteurs de recherche. Notre article s'intéresse à la première étape d'un tel processus qui consiste à rechercher des passages pertinents possédant des réponses. Une telle tâche peut se révéler difficile en raison de la complexité des données traitées, des fichiers logs dans notre cas. Notre contribution repose sur un double enrichissement de requêtes primitives en utili- sant une méthode d'apprentissage fondée sur...

Indexation de blocs extraits de pages Web en utilisant le rendu visuel.

Nicolas Faessel
RÉSUMÉ. Cet article présente un modèle d'indexation de pages Web basé sur leur rendu visuel. Dans ce modèle, une page Web n'est plus considérée comme un tout, mais comme la combinai- son d'un ensemble de blocs dont chacun porte sa sémantique propre. L'indexation d'une page Web est réalisée en deux étapes : (1) construction d'un arbre hiérarchique de blocs visuels, en s'appuyant sur la disposition visuelle des blocs de la page (2) indexation textuelle de...

Vectorisation du modèle d'appariement pour la recherche d'images par le contenu.

Hanen Karamti
RÉSUMÉ. Le développement rapide des techniques de numérisation et de stockage a engendré une croissance accrue du volume des documents électroniques (textes, images, sons et vidéos). Pour faire face à cette grande masse d'informations, en particulier les images, il est nécessaire de développer des outils qui permettent d'optimiser l'accès à de telles sources de données. Le problème qui se pose est la représentation du contenu d'images, puisque les techniques actuelles ne permettent pas de décrire...

Un système d'aide à la recherche d'information en ligne basé sur les ontologies (SA-RI-Onto).

Rania Soussi, Nesrine Ben Mustapha, Hajer Baazaoui Zghal & Marie-Aude Aufaure
RÉSUMÉ . La croissance très importante des informations disponibles sur Internet nécessite des outils de recherche de plus en plus performants permettant de discerner efficacement les informations intéressantes parmi des centaines voire des milliers de documents. Seulement, la qualité des résultats fournis par les moteurs de recherche traditionnels n'est pas toujours pertinente surtout quand il s'agit de composer plus d'une requête. Ceci est dû aux ambiguïtés linguistiques et aux concepts abstraits qui ne sont pas...

GVC: a graph-based Information Retrieval Mode.

Quoc Dinh Truong, Taoufiq Dkaki, Josiane Mothe & Pierre-Jean Charrel

Approche par réutilisation d'annotations sémantiques pour la recherche d'information sur le web.

Wiem Yaiche Elleuch, Lobna Jéribi, Mohamed Tmar & Abdelmajid Ben Hamadou
RÉSUMÉ. Dans cet article, nous présentons une nouvelle approche d'aide à la recherche d'information sur le web. Elle a pour objectif de présenter à l'utilisateur courant des documents réponses pertinents pour sa requête et adaptés à son profil. Elle consiste à utiliser le mécanisme du Raisonnement à Partir de Cas (RàPC) pour mémoriser les sessions de recherche effectuées par les utilisateurs (profil utilisateur, requête, annotation d'un document pertinent, date) et à les réutiliser lorsqu'une session...

Indexation sémantique et recherche d'information interactive.

Frédérik Bilhaut, Franck Dumoncel, Patrice Enjalbert & Nicolas Hernandez
RÉSUMÉ . Parmi les différentes facettes de la recherche d'information en données textuelles, la recherche d'informations localisées dans l'espace et dans le temps constitue un domaine d'étude à part entière. Celle-ci nécessite en effet, pour l'indexation comme pour la recherche, des analyses linguistiques et des ressources spécifiques. Le projet GéoSem fut le cadre de conception de techniques d'indexation sémantique d'informations géographiques. Ces techniques se trouvent aujourd'hui mises en oeuvre au sein d'un moteur de recherche...

EDOLA : Une nouvelle méthode d'alignement d'ontologies OWL-Lite.

Sami Zghal, Karim Kamoun, Sadok Ben Yahia, Engelbert Mephu Nguifo & Yahya Slimani
RÉSUMÉ. L'alignement d'ontologies revêt toute son importance dans des applications nécessi- tant la prise en compte d'une interopérabilité sémantique. Plusieurs approches d'alignement d'ontologies existent dans la littérature. Elles sont basées sur les mesures de similarités. Dans ce papier, une nouvelle méthode d'alignement d'ontologies OWL-Lite est décrite. Le module d'alignement implémente une nouvelle approche d'alignement d'ontologies qui défi- nit un modèle global de calcul de similarité, tout en remédiant au problème de l'intervention de l'utilisateur dans...

Un gestionnaire de dialogue oral arabe Homme-machine : Réalisation et évaluation.

Younès Bahou, Amine Bayoudhi & Lamia Hadrich Belguith
RÉSUMÉ. Dans le présent papier, nous proposons un gestionnaire de dialogue oral arabe Homme-machine. Ce travail entre dans le cadre de la réalisation du serveur vocal interactif SARF (Bahou et al., 2008) qui offre des renseignements sur le transport ferroviaire tunisien en langue arabe standard moderne. Le gestionnaire de dialogue, que nous proposons, se base sur une approche structurelle et utilise une grammaire formelle transformée en un automate fini déterministe afin d'assurer le suivi et...

Construction des profils utilisateurs à base d'une ontologie pour une recherche d'information personnalisée.

Mariam Daoud, Lynda Tamine, Mohand Boughanem & Bilal Chebaro
RÉSUMÉ. La recherche d'information (RI) personnalisée tend principalement à modéliser l'utili- sateur selon un profil puis à l'intégrer dans la chaîne d'accès à l'information, afin de mieux ré- pondre à ses besoins spécifiques. Ce papier présente une extension d'une approche de construc- tion implicite du profil utilisateur précédemment développée où les centres d'intérêts sont re- présentés à base de termes pondérés. L'extension de cette approche permet d'obtenir une re- présentation sémantique de ces centres à...

Registration Year

  • 2017
    544
  • 2018
    31

Resource Types

  • Text
    575