598 Works

Synthèse de flux de messages en temps réel.

Abdelhamid Chellal, Mohand Boughanem & Bernard Dousset
RÉSUMÉ. La supervision d'événements à travers les réseaux sociaux ont connu un engouement certain ces dernières années. Cependant, le nombre considérable de messages publiés rend dif- ficile, voire impossible, pour une personne de suivre 'ce qui se passe autour de l'événement'. Le filtrage et la génération en temps réel d'une synthèse de messages importants portant sur l'événement permet de répondre à ce besoin. La génération de cette synthèse pose plusieurs problèmes qui rend cette tâche...

Expansion de requêtes par apprentissage.

Ahlem Bouziri, Chiraz Latiri & Éric Gaussier
RÉSUMÉ. Cet article propose une approche d'expansion automatique de requêtes par appren- tissage. L'expansion de requêtes se fait par l'ajout de termes provenant de règles d'association entre termes. Le problème d'expansion de requêtes est modélisé comme un problème de classifi- cation superviséE qui vise à déterminer les règles d'association les plus adaptées pour enrichir une requête donnée. Un ensemble de données d'entraînement est construit en utilisant un algo- rithme d'exploration de règles d'association pertinentes, basé...

Généralisation des opérateurs de dérivation de Galois en recherche d'information basée sur l'analyse formelle de concepts.

Yassine Djouadi
RÉSUMÉ. La recherche d'information basée sur l'analyse formelle de concepts repose généra- lement sur l'utilisation de la structure de treillis des concepts formels. Les noeuds de ce treillis (i.e. les concepts formels) peuvent être interprétés comme des paires hréponse,requêtei. A ce jour, la quasi-majorité des travaux existant en ce sens utilisent l'opérateur de dérivation de Ga- lois classique (opérateur de suffisance). Il s'avère que cet opérateur se restreint à l'expression de requêtes conjonctives. Pour palier...

Proposition d'une nouvelle structure de document pour améliorer la recherche d'information.

Rocío Abascal, Béatrice Rumpler & Suela Berisha-Bohé
Actuellement l'information contenue dans les bibliothèques numériques n'est pas totalement décrite et son exploitation est insuffisante. La description de l'information en utilisant des métadonnées nous semble une bonne solution pour envisager une recherche d'information plus pertinente. Notre proposition est fondée sur la création et l'introduction au sein du document de "tags sémantiques" capables de décrire, dans notre cas, des thèses doctorales. Nous présentons l'analyse de quatre outils de Traitement Automatique des Langues (TAL) capables d'extraire...

Recherche par le contenu d'images de monnaies de collection.

Joseph Chazalon & Mickaël Coustaty
RÉSUMÉ. Cette démonstration consiste en une variante du travail de (Perronnin et al., 2010) simplifiée et transposée au cas des images de monnaies de collection. Tirant profit de certaines particularité des objets numismatiques (pièces et billets de collection), qui peuvent être assimilés à un type de documents particuliers, nous avons développé un outil qui permet de chercher les objets similaires à un objet requête parmi une base de plusieurs dizaines de milliers d’objets. Plusieurs modifications...

Reconnaissance et classification de lettrines à base des descripteurs de bas niveau et de représentation structurelle.

Maroua Mehri, Pierre Héroux, Mickaël Coustaty, Petra Gomez-Krämer, Julien Lerouge & Rémy Mullot
RÉSUMÉ. Cet article s’intéresse à un des éléments importants dans l’analyse de graphiques sur les images de documents anciens que sont les lettrines. Nous proposons dans ce travail des méthodes génériques pour la reconnaissance et la classification de lettrines. Tout d’abord, une méthode ascendante de segmentation à base de descripteurs de bas niveau est présentée, permettant d’assurer la séparation des éléments de la couche de forme de ceux de la couche du fond de la...

Relations explicites entre différentes représentations d'image dans un modèle de graphe visuel.

Trong-Ton Pham, Philippe Mulhem & Loïc Maisonnasse
RÉSUMÉ. Nous présentons dans ce papier une nouvelle méthode pour exploiter la relation entre différents niveaux de représentation d'image afin de compléter le modèle de graphe visuel. Le modèle de graphe visuel est une extension du modèle de langue classique en recherche d'infor- mation. Nous utilisons des régions d'images et des points d'intérêts (associées automatiquement à des concepts visuels), ainsi que des relations entre ces concepts, lors de la construction de la représentation sous forme...

Choix d'une mesure d'association pour une extension de requête contôlée : la question de l'orientation de la mesure.

Christophe Brouard
RÉSUMÉ . Cet article présente une étude comparative de mesures d'association dans le contexte de la construction automatique de thésaurus. L'étude porte plus particulièrement sur la question de l'orientation de la mesure d'association. Différentes solutions sont distinguées et testées dans le cadre d'une tâche de filtrage adaptatif dans laquelle le thésaurus est utilisé pour sélectionner des termes d'indexation à ajouter au cours de l'apprentissage. Les résultats obtenus sur le corpus OSHUMED montrent une forte influence...

Plongement incrémental dans un contexte de dissimilarité.

Rachid Hafiane, Luc Brun & Salvatore Tabbone
RÉSUMÉ. Le domaine de la reconnaissance statistique de formes est basé sur la représentation numérique des objets et peut donc être facilement combiné avec des méthodes d’apprentissage automatique. D’autre part, la reconnaissance structurelle de formes utilise un ensemble limité de méthodes d’apprentissage automatique mais encode une riche description des objets via les chaînes de caractères ou les graphes. Cette dernière décennie a vu l’émergence de deux tendances étroitement liées, visant à combler l’écart entre ces...

Un modèle à base de chemin de lecture pour la Recherche d'Informations précises sur le Web.

Saïd Radhouani, Jean-Pierre Chevallet & Mathias Géry
RÉSUMÉ . Actuellement, le noeud hypertexte (document) est utilisé comme la plus petite granularité d'information que l'utilisateur cherche. Nous supposons que le fait de considérer le noeud hypertexte comme unité informationnelle n'as pas toujours un sens, car il s'agit uniquement d'une contrainte physique. Dans la réalité, l'utilisateur peut avoir envie de rechercher un seul paragraphe, ou au contraire un ensemble de pages. Or, les SRI se basent sur la granularité d'un noeud comme unité de...

A la Recherche de noeuds informatifs dans des corpus de documents XML.

Karen Sauvagnat & Mohand Boughanem
Un des principaux challenge de la Recherche d'Information dans des documents XML est le traitement des requêtes composées de simples mots-clés. L'utilisateur exprimant de telles requêtes ne donne en effet aucune indication au système sur la granularité de l'information qu'il désire. De quel type doit-être cette information ? Les documents XML pouvant être considérés comme des arbres, chercher les parties de documents pertinentes à une requête revient à chercher des sous-arbres pertinents. Ceci soulève les...

Aggregated search: From information nuggets to aggregated documents.

Arlind Kopliku
RÉSUMÉ. Le but de la recherche agregée est de rassembler des informations provenant de plu- sieurs sources en une seule interface. Elle doit ainsi gérer des problématiques liées aux dif- férents types de contenu (texte, vidéo, image, etc) ainsi qu'à la granularité des résultats. La formation d'un contenu agrégé à partir de différents types de contenus retrouvés contraste avec l'approche commune en RI consistant à renvoyer à l'utilisateur une liste ordonnée de résultats. Si nous...

Méthodologie pour une représentation multi-dimensionnelle des documents.

Benjamin Piwowarski
RÉSUMÉ. La représentation des documents et questions en Recherche d'Information (RI) est res- tée une représentation majoritairement uni-dimensionnelle (i.e., vecteur). Cette représentation a des limites : Comment par exemple représenter un document qui traite de plusieurs thèmes ou une question ambiguë ? Ces problèmes sont importants pour développer des systèmes de RI interactifs ou cherchant à diversifier les résultats. Les modèles actuels sont soit basés sur des heuristiques, soit sur des modèles latents qui pré-supposent...

Quel est l'auteur de ce roman ?

Jacques Savoy
RÉSUMÉ . Dans cet article, nous présentons le problème de l'attribution d'auteur d'une oeuvre écrite. Comme représentation des textes, les études récentes s'appuient sur un ensemble restreint de mots fonctionnels ou très fréquents (50 ou 100). Sur cette base, les méthodes de l'analyse en composantes principales (ACP) ou des correspondances (AC) permettent de visualiser les affinités et différences entre les représentations des écrits. En appliquant l'approche du plus proche voisin, nous pouvons estimer l'auteur de...

Représentation par graphe de mots manuscrits dans les images pour la recherche par similarité.

Wang 0006, Peng, Véronique Eglin, Christophe Garcia, Christine Largeron, Josep Lladós & Alicia Fornés
RÉSUMÉ . Dans ce papier, nous proposons une nouvelle approche de la recherche de mots par similarité reposant sur une structure de graphes intégrant des informations sur la topologie, la morphologie locale des mots ainsi que des informations contextuelles dans le voisinage de chaque point d'intérêt. Chaque mot image est représenté par une séquence de graphes associés chacun à un objet connexe. Un graphe est construit sur la base d'un squelette décrit par un descripteur...

Identification Semi-Automatique de Mots-Germes pour l’Analyse de Sentiments et son Intensité

Amal Htait, Sébastien Fournier & Patrice Bellot
RÉSUMÉ. Dans le but d'exploiter les opinions dans les tweets, cet article présente une classification à partir du sentiment contenu au sein des tweets. Nous présentons une méthode d'identifi- cation de nouveaux mots-germes. Ils sont utilisés pour la prédiction de l'intensité de sentiments des mots en co-occurrence avec ces mots-germes. Ensuite, le calcul de similarités entre sen- timents est appliqué en utilisant: la mesure de la similarité entre deux mots et l'utilisation de plongement de...

Classement collaboratif de manuscrits.

Pierre-Edouard Portier
RÉSUMÉ. Pour chaque projet d'édition numérique de manuscrits, après que le corpus ait été constitué, les chercheurs commencent par le classer. Cette opération demande de grands ef- forts d'interprétation, elle n'est pas neutre mais contribue à la construction du point de vue du chercheur sur son objet d'étude. Ainsi, plusieurs classements peuvent être proposés pour un même sous-ensemble de l'archive. Or il n'existe pas de plateforme informatique spécifi que pour assister les chercheurs dans cette...

Personnalisation flexible d'un processus de recherche d'information mobile.

Ourdia Bouidghaghen & Lynda Tamine
RÉSUMÉ. Dans le passé, les modèles de recherche personnalisés ont été principalement fondés sur le contexte cognitif (Url visitées, les documents vus) de l'utilisateur indépendamment de son environnement caractérisé par le lieu, le temps, les personnes proches, etc. Dans cet ar- ticle nous proposons une approche de personnalisation des résultats de recherche Web pour des utilisateurs mobiles en exploitant à la fois le contexte cognitif et spatio-temporel. Nous proposons de modéliser l'utilisateur par un profil...

XFIRM: un Modèle Flexible de Recherche d'Information pour le stockage et l'interrogation de documents XML.

Karen Sauvagnat
RESUME : Les utilisateurs recherchant une information précise ne souhaitent pas la voir noyée aux milieux d'autres sujets, comme cela peut être le cas dans de grands documents. Les documents XML, par leur structure même, permettent de traiter l'information qu'ils contiennent à un niveau de granularité autre que celui du document tout entier. Deux approches s'affrontent pour la recherche d'information (RI) dans des documents XML. La première est basée sur des méthodes issues de la...

Architecture siamoise et embeddings de triplet pour la validation de relations

Jose G. Moreno, Rashedur Rahman, Charlotte Rudnik, Cong Wang & Brigitte Grau
RÉSUMÉ. La reconnaissance qu'une relation existe entre deux entités mentionnées dans un texte joue un rôle vital en extraction d'information (EI). Pour répondre à la nécessité d'annoter ma- nuellement de nombreux exemples, des paradigmes de supervision distante et d'EI non super- visée ont été proposés. Le point crucial dans ces approches est de pouvoir évaluer la validité des relations extraites. Dans cet article, nous proposons une nouvelle architecture neuronale pour modéliser la validation de relations,...

Vers un modèle d'indexation sémantique adapté aux dossiers médicaux de patients.

Ba-Duy Dinh & Lynda Tamine-Lechani
RÉSUMÉ. Ce papier présente un modèle d'indexation sémantique adapté aux dossiers électro- niques de patients. Ce modèle servira de support à des processus de recherche d'information médicale, permettant à terme de promouvoir l'expérience collective des médecins. Compte tenu de la spécificité de ce type de documents, le processus d'indexation est basé sur la succes- sion d'étapes d'annotation sémantique fondée sur l'utilisation de MeSH (Medical Subject Hea- dings), de désambiguïsation répondant au problème d'homonymie, d'extraction de...

Recherche approchée d'information dans une base de documents semi-structurés.

Eugen Popovici, Gildas Ménier & Pierre-François Marteau
RÉSUMÉ .Nous proposons des algorithmes dédiés à l'indexation et à la recherche approximative d'information dans les bases de données hétérogènes semi-structurées XML. Le modèle d'indexation proposé est adapté à la recherche de contenu textuel dans les contextes XML définis par les structures d'arbres. Les mécanismes de recherche approchée mis en oeuvre s'appuient sur une distance de Levenshtein modifiée et des heuristiques de fusion d'information. Une implémentation exploitant simultanément l'information structurée, i.e. l'arborescence des éléments XML,...

Un modèle syllabique pour la reconnaissance de l’écriture.

Wassim Swaileh, Kamel Ait Mohand & Thierry Paquet
RÉSUMÉ. Dans cet article nous introduisons un nouveau modèle syllabique pour la reconnaissance de l'écriture. Une méthode de syllabation orthographique supervisée du Français est proposé pour la construction d’un vocabulaire de syllabes. Un modèle de langage statistique en n-gram combinant syllabes et caractères est appris sur un corpus Wikipedia. Le système de reconnaissance d’écriture fondé sur des modèles optiques HMM de caractères procède à un décodage en deux passes en exploitant le modèle syllabique proposé....

Registration Year

  • 2017
    544
  • 2018
    31
  • 2019
    23

Resource Types

  • Text
    598