619 Works

MyBestQuery : un jeu sérieux pour apprendre des utilisateurs.

Adrian Chifu, Serge Molina & Josiane Mothe
RESUME. MyBestQuery est un jeu sérieux qui collecte des éléments sur les requêtes soumises à un moteur de recherche: (i) la prédiction de la difficulté de la requête par le joueur (ii) des raisons possibles expliquant cette difficulté (iii) des propositions de reformulation.

Tied Spatial Transformer Networks for Character Recognition.

Bogdan-Ionut Cirstea & Laurence Likforman-Sulem
RÉSUMÉ. Cet article présente une nouvelle approche appliquée aux réseaux de neurones convolutionnels (RNC), qui utilise les réseaux de transformations spatiales (RTS). L’approche consiste à construire une architecture combinant un RNC pour la localisation et un RNC pour la classification. Bien que les deux réseaux soient dédiés à des taches différentes, la majorité de leurs poids sont partagées. Par la suite nous appelons ce type de réseaux réseaux de transformations spatiales liées ou RTSL. Le...

Modèle évolutif d'un profil utilisateur.

Suela Berisha-Bohé & Béatrice Rumpler
RESUME. La prise en compte des besoins, des intentions et des spécificités cognitives, cuturelles ou autres, qui caractérisent le profil d'un utilsiateur constitue un élément déterminant pour améliorer la pertinence des réponses lors d'une session de Recherche d'Information dans de grandes bases de documents. La modélisation des profils et la manière de les adapter à différents utilisateurs qui n'ont pas une idée précise sur l'information qu'ils recherchent, nous permet d'offrir un accès personnalisé au contenu...

Traduction automatique de termes biomédicaux pour la recherche d'information interlingue.

Vincent Claveau
RÉSUMÉ. Dans cet article, nous présentons une méthode de traduction automatique de termes biomédicaux. Cette méthode s'appuie sur une technique originale d'apprentissage supervisé de règles de réécriture et sur l'utilisation de modèles de langue. Les évaluations présentées montrent que notre technique est très performante et permet de traduire à partir et à desti- nation de n'importe quelle langue pourvu que leurs différences soient suffisamment régulières pour être apprises. Cette méthode de traduction est appliquée et...

Recherche d'information et analyse bibliographique appliquées à la mise à jour automatique de Swiss-Prot.

Imad Tbahriti, Anne-Lise Veuthey, Patrick Ruch & Julien Gobeill
RÉSUMÉ .But : Le but de cette étude est de découvrir de nouveaux articles scientifiques utiles pour la mise à jour de l'information dans la base de données de biologie moléculaire UniProtKB/Swiss-Prot. Notre hypothèse de base est qu'un article qui cite un autre article déjà référencé dans une entrée Swiss-Prot pour une protéine donnée est un bon candidat pour mettre à jour l'information de l'entrée de cette protéine dans la base. Méthodes : La procédure...

Une approche de représentation de l'information en RI basée sur les sousarbres.

Mustapha Baziz, Mohand Boughanem & Henri Prade
RÉSUMÉ. Ce papier propose une approche de recherche d’information basée sur l’utilisation d’une structure conceptuelle pour indexer les documents. La structure conceptuelle est hiérarchique. Elle est représentée par un sous-arbre pondéré. Un sous-arbre est obtenu d’abord en projetant document et requête sur une ressource conceptuelle externe, puis en appliquant une méthode de complétion via des noeuds intermédiaires extraits de cette ressource en vue d’avoir une représentation hiérarchique. Dans cette approche, l’évaluation des requêtes se fait...

Connaître la Couleur des Objets pour Segmenter les Images et Améliorer la Recherche d'Images sur le Web.

Christophe Millet
RÉSUMÉ. Les résultats des moteurs actuels de recherche d'images sur le web sont très bruités, c'est-à-dire que quand nous cherchons un objet précis, un grand nombre d'images retournées par le système ne concerne pas la requête : environ 50% de ces images sont hors-sujet. Dans cet article, nous expliquons comment utiliser la connaissance de la couleur des objets pour trouver l'objet recherché dans les images, et nous proposons également deux méthodes pour connaître automatiquement la...

Association d'un détecteur de visages et d'un détecteur d'entités nommées pour l'annotation automatique d'images.

Pierre Tirilly, Emmanuelle Martienne, Vincent Claveau & Patrick Gros
RÉSUMÉ. Dans cet article, nous proposons une méthode d'annotation d'images de visages dans un grand corpus réel de documents texte-images. Cette méthode s'appuie sur l'utilisation conjointe d'un détecteur de visages et d'un détecteur d'entités nommées : les images contenant des visages sont annotées par les entités nommées les plus fréquentes dans le texte accompa- gnant les images. Bien que basique, cette méthode donne de bons résultats. Elle constitue un premier pas vers des méthodes d'indexation...

Considérations sur l'évaluation de la robustesse en recherche d'information.

Samir Abdou & Jacques Savoy
RÉSUMÉ . Cette communication évalue et compare l'efficacité de modèles vectoriels, probabilistes ou de langue afin de dépister des articles de presse rédigés en langue française. En se basant sur un corpus créé durant trois campagnes d'évaluation CLEF et comprenant

Une approche d'extraction et de recherche d'information spatiale dans les documents textuels - évaluation.

Christian Sallaberry, Mustapha Baziz, Julien Lesbegueries & Mauro Gaio
RÉSUMÉ .Ce papier propose une approche d'Extraction d'Information (EI) et de Recherche d'Information (RI) spatiales dans le cadre de bibliothèques numériques liées au patrimoine culturel local. L'approche proposée (implémentée dans le prototype PIV) est construite autour d'une analyse sémantique de tels corpus et de requêtes écrites en texte libre. Nous présentons la méthodologie d'annotation sémantique pour l'indexation automatique et le géo-référencement de documents textuels. Un cas d'étude permet ensuite d’évaluer le processus de RI spatiale...

Indexation sémantique et recherche d'information interactive.

Frédérik Bilhaut, Franck Dumoncel, Patrice Enjalbert & Nicolas Hernandez
RÉSUMÉ . Parmi les différentes facettes de la recherche d'information en données textuelles, la recherche d'informations localisées dans l'espace et dans le temps constitue un domaine d'étude à part entière. Celle-ci nécessite en effet, pour l'indexation comme pour la recherche, des analyses linguistiques et des ressources spécifiques. Le projet GéoSem fut le cadre de conception de techniques d'indexation sémantique d'informations géographiques. Ces techniques se trouvent aujourd'hui mises en oeuvre au sein d'un moteur de recherche...

Filtrage de textes dans le but de produire un résumé de documents multiples.

Fatma Kallel Jaoua, Lamia Hadrich Belguith, Maher Jaoua & Abdelmajid Ben Hamadou
RÉSUMÉ . Dans le cadre de la conférence d'évaluation DUC, nous avons développé un système de résumé automatique de documents multiples qui se base sur l'extraction des phrases clés. La méthode proposée utilise un algorithme génétique qui permet de combiner les phrases des documents sources pour former les extraits, qui seront croisés et mutés pour générer de nouveaux extraits. L'examen des résultats obtenus dans les deux sessions DUC'04 et DUC'07 a montré un écart significatif...

GVC: a graph-based Information Retrieval Mode.

Quoc Dinh Truong, Taoufiq Dkaki, Josiane Mothe & Pierre-Jean Charrel

Modèle de recherche contextuelle orientée contenu pour un corpus de documents XML.

Ounas Asfari
RÉSUMÉ . Dans le cadre de corpus de documents XML, la recherche par mots-clés reste le moyen le plus utilisé pour un utilisateur dont le besoin d'information est vague, ou encore parce qu'il ne connaît pas précisément la structure des documents. Dans cet article nous présentons notre approche de recherche de noeuds pertinents à une requête orientée contenu 'Content Only' composée de simples mots clés dans un corpus de documents XML en prenant en compte...

Annotation collective dans le contexte RI : définition d'une plate-forme pour expérimenter la validation sociale.

Guillaume Cabanac
RÉSUMÉ. Avec l'avènement du Web participatif, les lecteurs de documents électroniques sont de plus en plus actifs. En particulier, des systèmes d'annotation leur permettent de commen- ter, de reformuler, de critiquer, etc. des passages de documents. Les approches de RI qui ne considéraient jusqu'alors que le contenu des documents tendent actuellement à exploiter cette dimension participative du Web. L'activité des lecteurs (annotations et débats suscités) peut par exemple améliorer rappel et précision des résultats de...

Un modèle de recherche de fichiers personnels par contexte dans les systèmes d'étiquetage.

Ba-Hung Ngo, Frédérique Silber-Chaussumier & Christian Bac
RÉSUMÉ . Depuis peu, les étiquettes sont utilisées largement pour identifier des contenus aussi bien sur le bureau informatique des utilisateurs que sur les sites coopératifs du Web dit 2.0. Notre recherche se focalise sur l'organisation assistée des étiquettes personnelles afin d'améliorer la pertinence des recherches de fichiers personnels associés à des étiquettes. Notre proposition utilise la notion de contexte comme point central. Un contexte est constitué à partir d'un ensemble d'étiquettes affectées par un...

La fiabilité des informations sur le web: le cas Wikipédia.

Bernard Jacquemin, Aurélien Lauf, Céline Poudat, Martine Hurault-Plantet & Nicolas Auray
RÉSUMÉ. Les outils de recherche d'information sur le web doivent tenir compte des phénomènes nouveaux liés à l'apparition des blogs, wikis, et autres publications collaboratives. Parmi ces sites, l'encyclopédie Wikipédia constitue une source importante d'information. La qualité de ses informations a pourtant été récemment mise en cause. Mieux connaître les comportements des contributeurs peut permettre de guider les utilisateurs dans des contenus de qualité parfois disparate. Pour explorer cette voie, nous présentons une analyse du...

Approche par réutilisation d'annotations sémantiques pour la recherche d'information sur le web.

Wiem Yaiche Elleuch, Lobna Jéribi, Mohamed Tmar & Abdelmajid Ben Hamadou
RÉSUMÉ. Dans cet article, nous présentons une nouvelle approche d'aide à la recherche d'information sur le web. Elle a pour objectif de présenter à l'utilisateur courant des documents réponses pertinents pour sa requête et adaptés à son profil. Elle consiste à utiliser le mécanisme du Raisonnement à Partir de Cas (RàPC) pour mémoriser les sessions de recherche effectuées par les utilisateurs (profil utilisateur, requête, annotation d'un document pertinent, date) et à les réutiliser lorsqu'une session...

Indexation semi-automatique de textes : thésaurus et transducteurs.

Laurent Kevers
RÉSUMÉ. Cet article présente une méthode de classification ne nécessitant pas de phase d'apprentissage. Son but est d'améliorer l'indexation manuelle des documents textuels, une opéra- tion souvent menée au sein de certains systèmes d'information requérant un niveau de précision élevé. Le système, qui apporte une aide à l'indexeur humain, est semi-automatique. Par analo- gie à la terminologie utilisée en apprentissage automatique, la méthode est dite supervisée car elle exploite une définition préalable des catégories d'indexation....

Modèle d'indexation dynamique à base d'ontologies.

Gilles Hubert, Josiane Mothe, Bachelin Ralalason & Bertin Ramanonjisoa
RÉSUMÉ .Cet article propose un modèle de données pour une indexation basée sur une ontologie de référence représentant la sémantique des termes d'indexation. Le modèle proposé vise à permettre une indexation en temps réel qui suit la dynamique du corpus tout en assurant la disponibilité des documents et de l'index. Ceci permet de garder la cohérence entre les documents de la collection, l'index et l'ontologie de référence. Notre modèle permet ainsi d'éviter la reconstruction de...

Impact de la reconnaissance de l'écriture en-ligne sur une tâche de catégorisation.

Sebastián Peña Saldarriaga, Emmanuel Morin & Christian Viard-Gaudin
RÉSUMÉ. Cet article s'intéresse à la problématique de la catégorisation automatique de docu- ments manuscrits en-ligne et plus particulièrement à l'impact de la reconnaissance de l'écriture dans un processus de catégorisation utilisant des méthodes d'apprentissage automatique. Nous comparons les performances obtenues avec des documents issus d'un système de recon- naissance de l'écriture en-ligne et leur version originale électronique. Les résultats montrent qu'aucune perte significative des performances n'est à signaler lorsque 78 % des termes d'in-...

SRI à base d'inclusion graduelle.

Laurent Ughetto, Olivier Pivert, Vincent Claveau & Patrick Bosc
RÉSUMÉ. Cet article étudie, d'un point de vue expérimental, l'apport des inclusions graduelles issues de la théorie des ensembles flous pour la modélisation d'un système de recherche d'in- formation (SRI), comme l'ont proposé de manière théorique (Bosc et al., 2008b). Documents et requêtes sont représentés par des ensembles flous, appariés par des opérateurs flous, dont le choix est crucial pour obtenir un système adapté à la RI. S'ils sont bien choisis, le SRI flou ob-...

Structure et proximité pour la recherche documentaire.

Michel Beigbeder
RÉSUMÉ. Notre étude compare les performances d'un système de recherche d'information basé sur la proximité des occurrences des termes de la requête dans les documents avec un système classique de modèle de langue avec lissage de Dirichlet et le modèle Okapi BM25 . Notre modèle basé sur la proximité calcule en chaque position du document une valeur d'autant plus grande que des occurrences de tous les termes de la requête sont proches de cette position....

REVISE, un outil d'évaluation précise des systèmes questions-réponses.

Sarra El Ayari, Brigitte Grau & Anne-Laure Ligozat
RÉSUMÉ. Des campagnes d'évaluations sont organisées chaque année pour évaluer des systèmes de questions-réponses sur la validité des résultats fournis. Pour les équipes, il s'agit ensuite de réussir à mesurer la pertinence des stratégies développées ainsi que le fonctionnement des com- posants. À ces fi ns, nous décrivons un outil générique d'évaluation de type boîte transparente qui permet à un système produisant des résultats intermédiaires d'évaluer ses résultats. Nous illustrerons cette démarche en testant l'impact...

Registration Year

  • 2021
    21
  • 2019
    23
  • 2018
    31
  • 2017
    544

Resource Types

  • Text
    597
  • Conference Paper
    21
  • Conference Proceeding
    1