598 Works

Vers des méta-règles de contexte appréciées par la IIE pour la RI.

Belhaj Rhouma Sourour, Cherif Chiraz Latiri & Yahya Slimani
RÉSUMÉ. Le processus de Fouille de Textes (FT), basé sur l'extraction des règles d'association en utilisant un algorithme, génère une quantité importante de règles d'association. Dans cet article, ce sont des règles d'association non redondantes résultantes d'un processus d'extrac- tion à partir d'un corpus de textes. Nous proposons tout d'abord de montrer l'intérêt et l'utilité de règles d'association filtrées par une mesure de qualité autre que la confiance, en particulier l'Intensité d'Implication Entropique (IIE). D'autre...

On the use of tolerant graded inclusions in information retrieval.

Patrick Bosc & Olivier Pivert
RÉSUMÉ . Dans cet article, un modèle de recherche d'information fondé sur la théorie des ensembles flous est considéré. Tout d'abord, nous montrons que le mécanisme de recherche dans un tel modèle peut être défini en termes d'inclusion graduelle. Cette approche est fortement liée à la notion de division dans un contexte de bases de données relationnelles. Dans un deuxième temps, nous mettons en évidence plusieurs axes d'extension de l'inclusion graduelle, l'objectif étant de rendre...

Apprentissage d'inférences par édition d'arbres pour répondre à des questions.

Martin Gleize & Brigitte Grau
RÉSUMÉ. La sélection de réponse en recherche d'information précise met nécessairement en oeuvre un appariement de passages avec la question. Nous proposons un algorithme qui consiste à engendrer et apprendre les inférences utiles pour rapprocher les passages de texte à des couples (questions, réponse candidate). Ceux-ci sont sélectionnés au moyen d'une ex- pansion lexicale utilisant WordNet et des vecteurs de mots. Ils sont représentés par leur arbre de dépendances syntaxique, enrichi au moyen de plusieurs...

Auto-complétion de requêtes par une base générique de règles d'association triadiques.

Chiraz Trabelsi, Nader Jelassi & Sadok Ben Yahia
RÉSUMÉ. L'exploitation des réseaux sociaux et systèmes collaboratifs dans le cadre d'un pro- cessus de recherche d'information est un phénomène qui peu à peu est intégré aux pratiques de la recherche sur Internet. Ces systèmes, émergeants de l'ère du Web 2.0, permettent aux parti- cipants de collaborer via l'indexation libre du contenu à l'aide de mots-clés, les tags ; créant ainsi des structures légères représentées comme des hypergraphes tripartites d'utilisateurs, de tags et de ressources,...

Recherche et filtrage d'information dans des transcriptions de conversations.

Caroline Tambellini, Catherine Berrut & Christophe Brouard
RÉSUMÉ. Nous nous intéressons dans cet article au problème de l'indexation de documents audio de type u conversation téléphonique ». Nous nous interrogeons en particulier sur le bien fondé de l'utilisation, pour ce type de documents, des méthodes d'indexation classiquement utilisées en recherche d'information textuelle. Pour répondre à ces questions, nous revisitons certaines hypothèses de la recherche d'information en étudiant la spécificité et l'applicabilité de ces hypothèses à des transcriptions de conversations téléphoniques. Nos observations...

AGATHE : une architecture générique à base d'agents et d'ontologies pour la collecte d'information sur domaines restreints du Web.

Bernard Espinasse, Sébastien Fournier & Frederico Luiz Gonçalves De Freitas
RÉSUMÉ . La collecte pertinente d'information sur le Web est une tâche très complexe et les moteurs de recherche actuels, reposant sur des méthodes d'indexation et de recherches basées sur des mots-clés, ont de très faibles taux de précision. Les recherches qu'ils réalisent sont essentiellement lexicales statistiques et ne prennent pas en compte leurs contextes sous- jacents. En se limitant à des domaines restreints, la prise en compte de ces contextes est possible et doit...

Normalisation et validation d'images de documents capturées en mobilité.

Marçal Rusiñol, Joseph Chazalon & Jean-Marc Ogier
RÉSUMÉ. La numérisation de documents à l'aide des smartphones introduit un nombre impor- tant de dégradations qui doivent être corrigées ou détectées sur le mobile, avant l'envoi de données sur un réseau payant ou la perte de disponibilité du document. Dans cet article, nous proposons un système permettant de corriger les problèmes de perspective et d'illumination avant d'estimer la netteté de l'image pour un traitement OCR. L'étape corrective repose sur une détection des contours, suivie...

Recherche d'entités nommées dans les journaux radiophoniques par contextes hiérarchique et syntaxique.

Azeddine Zidouni, Hervé Glotin & Mohamed Quafafou
RÉSUMÉ. Ce papier présente une approche pour la recherche d'entités nommées dans des transcriptions radiophoniques. Nous allons utiliser les structures des entités nommées afin d'améliorer le taux de leur reconnaissance. En effet, l'espace des entités peut être représenté par une structure hiérarchique (arbre). Ainsi, un concept peut être vu comme un noeud dans l'arbre, et une entité comme un parcours dans la structure de l'espace. Nous allons montrer l'apport de cette représentation en utilisant le...

Variations axiomatiques pour la recherche d’information personnalisée.

Philippe Mulhem, Nawal Ould Amer & Mathias Géry
RÉSUMÉ. Cet article s'intéresse à l'exploitation du profil des utilisateurs pour la recherche d'information dans un réseau social d'annotation (tagging). Nous faisons l'hypothèse que le profil doit être filtré de manière adéquate pour permettre une personnalisation efficace de la requête. Afin d'étudier cette personnalisation d'un point de vue axiomatique, la contrainte d'expansion de requête basée sur le profil est alors définie. Elle décrit le comportement attendu des termes du profil utilisateur qui permettront de personnaliser...

Relations explicites entre différentes représentations d'image dans un modèle de graphe visuel.

Trong-Ton Pham, Philippe Mulhem & Loïc Maisonnasse
RÉSUMÉ. Nous présentons dans ce papier une nouvelle méthode pour exploiter la relation entre différents niveaux de représentation d'image afin de compléter le modèle de graphe visuel. Le modèle de graphe visuel est une extension du modèle de langue classique en recherche d'infor- mation. Nous utilisons des régions d'images et des points d'intérêts (associées automatiquement à des concepts visuels), ainsi que des relations entre ces concepts, lors de la construction de la représentation sous forme...

AXON : Un Système de RI Personnalisée dans des Textes Arabes basée sur le profil utilisateur et l'expansion de requêtes.

Houssem Safi
RÉSUMÉ. Les travaux présentés dans cet article visent à développer un système de recherche d'information qui présente la particularité d'être adapté pour la langue arabe et de fournir des résultats personnalisés en fonction des préférences/centres d'intérêt de l'utilisateur. Pour cela, nous avons proposé une méthode d'expansion de requêtes basée à la fois sur des connaissances sémantiques issues d'ontologies existantes pour la langue arabe et sur des informations provenant de profils d'utilisateurs. La méthode d'expansion exploite...

Expertise et système de recherche d'informations en dialogue naturel : vers une considération des connaissances utilisateur.

Karl Devooght & Antoine Spaëter
RÉSUMÉ. Ce papier présente le principe général d'un agent rationnel dialoguant qui prend en compte le profil utilisateur afin d'adapter ses réactions. Sur la base de la théorie de l'interaction nous proposons de modéliser les connaissances de l'utilisateur sur le domaine de recherche. Dans un second temps, des règles de comportement de l'agent sont mises en oeuvre sur la base de résultats expérimentaux en ergonomie cognitive. La prise en compte du modèle utilisateur est illustrée...

Regroupements non-disjoints de mots pour la classification de documents.

Guillaume Cleuziou
RÉSUMÉ . La classification automatique de documents est un domaine d'étude en plein essor dans le domaine du Traitement et de la Recherche d'Information (RI). Dans un cadre supervisé, il s'agit alors d'entraîner un modèle de classifieur sur un corpus de documents étiquetés. La difficulté majeure consiste à représenter les documents par un nombre limité et suffisant d'attributs. Dans cet article, nous proposons une méthode de regroupement de mots, basée sur l'algorithme PoBOC (Pole-Based Overlapping...

Améliorer la classification de documents par combinaison de descripteurs visuels et textuels.

Olivier Augereau, Nicholas Journet & Jean-Philippe Domenger
RÉSUMÉ. La contribution principale de cet article est de proposer une nouvelle méthode de clas- sification des images de documents combinant les caractéristiques textuelles visuelles extraites respectivement avec les techniques des sacs de mots (BoW) et sacs de mots visuels (BoVW). Alors que les tentatives classiques de combinaison telles que celles basées sur le 'Borda-Count' aboutissent à des résultats décevants, nous proposons ici une combinaison par apprentissage. Les expériences de cet article ont été réalisées...

Les Signaux Sociaux Émotionnels : Quel impact sur la recherche d’information ?

Ismail Badache & Mohand Boughanem
RÉSUMÉ. Une grande partie des traces des utilisateurs exprimées par des signaux sociaux (ex. j'aime, +1, rating) sont attribuées aux ressources web. Ces signaux sont souvent exploités par les systèmes de RI comme des sources d'évidence additionnelles pour trier les résultats de recherche. Notre objectif dans cet article est d'étudier l'impact des nouveaux signaux sociaux, appelés Facebook reactions (j'adore, haha, grrr, wouah, triste) sur le tri de ces résultats. Ces réactions permettent aux utilisateurs d'exprimer...

Métriques statistiques pour l’évaluation de performance en présence de vérité terrain imprécise.

Bart Lamiroy & Pascal Pierrot
RÉSUMÉ. Ce papier aborde l’évaluation de performances en présence de vérité terrain imprécise. En effet, lors de procédures de benchmarking il est généralement supposé que les données de référence sont parfaites. Nous avons démontré précédemment que cette hypothèse de travail n’est généralement pas satisfaite dans le contexte de problèmes d’interprétation perceptuelle, sauf dans les cas les plus triviaux. Nous présentons ici un approche et test statistiques qui permettent de mesurer la confiance que l’on peut...

Ordonnancement d'entités appliqué à la construction de snippets sémantiques.

Mazen Alsarem, Pierre-Edouard Portier, Sylvie Calabretto & Harald Kosch
RÉSUMÉ. Les avancées de l'initiative Linked Open Data (LOD) ont permis de mieux structurer le Web des données. En effet, quelques jeux de données servent de centralisateurs (par exemple, DBpedia) et permettent ainsi de maintenir les différentes sources de données du LOD liées entre elles. Ces jeux de données ont également permis le développement de services de détection des entités du Web des données dans une page du Web des documents (par exemple, DBpedia Spot-...

Reconnaissance de l'écriture arabe multifonte à très basse résolution.

Oussama Zayene & Fouad Slimane
RÉSUMÉ . Nous proposons dans ce travail une approche de reconnaissance de textes arabes imprimés hors-ligne à vocabulaire ouvert et à très basse résolution (72 dpi). La méthode est basée sur les Modèles de Markov Cachés en utilisant la boite à outils HTK. La nouveauté de QRWUH WUDYDLO HVW GDQV O¶DQDO\VH GH FH W\SH GH V\VWqPHV VXU Wrois fontes de calligraphie complexe et présentant de fortes ligatures : DiwaniLetter, DecoTypeNaskh et DecoTypeThuluth. Nous proposons une...

A multi-layer separation based system for camera-based complex map image retrieval.

Quoc Bao Dang, Muhammad Muzzamil Luqman, Mickaël Coustaty, Nibal Nayef, Jean-Marc Ogier & Cao De Tran

Spatio-Temporal Modeling for Knowledge Discovery in Satellite Image Databases.

Wadii Boulila, Imed Riadh Farah, Karim Saheb Ettabaâ, Basel Solaiman & Henda Ben Ghézala
RÉSUMÉ. L'extraction automatique des connaissances à partir des images satellitaires dans un contexte spatio-temporel est un défit majeur pour le domaine de la télédétection. Dans ce contexte, nous présentons une approche haut-niveau pour la modélisation des connaissances spatio-temporelles à partir des images satellitaires. Nous proposons, aussi, d'utiliser une seg- mentation multi-approche comportant plusieurs méthodes de segmentation pour améliorer la modélisation et l'interprétation des images. Les expérimentations montrent que les résultats de la segmentation issues de...

Suggestion d'experts pour renouveler le comité de programme d'une conférence.

Hong Diep Tran, Guillaume Cabanac & Gilles Hubert
RÉSUMÉ. Le processus d'évaluation par les pairs permet de valider les progrès scientifiques communiqués dans des articles de recherche. Cette grande responsabilité repose sur les comités éditoriaux des journaux, sur les comités de programme des conférences et sur chacun de leurs membres. De plus, avec un grand nombre de conférences scientifiques organisées chaque année, la recherche d'experts pour participer au comité de programme devient une tâche fréquente et coûteuse. Dans cet article, nous proposons une...

6IR : Un index paramétrable pour les requêtes ramifiées.

Youen Péron
RÉSUMÉ. Cet article contient une présentation de notre travail en cours de dévelop- pement dans le domaine de la recherche d'informations dans des bases de documents semi-structurées. Nous cherchons à construire un système d'interrogation u dénommé 6IR pour Structure based IndeX Information Retrieval u qui fournisse une liste de documents similaires au contenu et à la structure d'une requête ramifiée. L'extraction des documents est basée sur l'identification de points communs entre leur structure et celle...

MAD : une plateforme mobile pour l'annotation de document vers la classification.

Benjamin Duthil, Vincent Courboulay, Mickaël Coustaty & Jean-Marc Ogier
RÉSUMÉ. Aujourd'hui, l'incroyable explosion de l'acquisition mobile d'images ou de documents parait sans limite. Bien qu'il soit facile de les partager sur les réseaux sociaux ou sur le cloud, il est encore très difficile de les classer automatiquement, de les trier ou de rechercher à l'inté- rieur de cette base de connaissance. Pour répondre à ce défi, nous devons d'abord proposer une annotation automatique pertinente pour pouvoir utiliser par la suite une recherche lexicale ro-...

Représentation sémantique de questions pour interroger le Web sémantique.

Romain Beaumont, Brigitte Grau & Anne-Laure Ligozat
RÉSUMÉ. Les bases de connaissances du Web sémantique sont généralement représentées sous forme de triplets RDF formant un graphe. Leur interrogation passe par un langage de type SPARQL, langage non maîtrisé des utilisateurs non experts, qui requiert de connaître le schéma de la base. C’est pourquoi les systèmes d’interrogation en langage naturel se développent actuellement. Se pose alors le problème de construction automatique de requêtes, devant intégrer des problèmes de distance lexicale entre les mots...

Quel est l'auteur de ce roman ?

Jacques Savoy
RÉSUMÉ . Dans cet article, nous présentons le problème de l'attribution d'auteur d'une oeuvre écrite. Comme représentation des textes, les études récentes s'appuient sur un ensemble restreint de mots fonctionnels ou très fréquents (50 ou 100). Sur cette base, les méthodes de l'analyse en composantes principales (ACP) ou des correspondances (AC) permettent de visualiser les affinités et différences entre les représentations des écrits. En appliquant l'approche du plus proche voisin, nous pouvons estimer l'auteur de...

Registration Year

  • 2017
    544
  • 2018
    31
  • 2019
    23

Resource Types

  • Text
    598