598 Works

Indexation sémantique et recherche d'information interactive.

Frédérik Bilhaut, Franck Dumoncel, Patrice Enjalbert & Nicolas Hernandez
RÉSUMÉ . Parmi les différentes facettes de la recherche d'information en données textuelles, la recherche d'informations localisées dans l'espace et dans le temps constitue un domaine d'étude à part entière. Celle-ci nécessite en effet, pour l'indexation comme pour la recherche, des analyses linguistiques et des ressources spécifiques. Le projet GéoSem fut le cadre de conception de techniques d'indexation sémantique d'informations géographiques. Ces techniques se trouvent aujourd'hui mises en oeuvre au sein d'un moteur de recherche...

Filtrage de textes dans le but de produire un résumé de documents multiples.

Fatma Kallel Jaoua, Lamia Hadrich Belguith, Maher Jaoua & Abdelmajid Ben Hamadou
RÉSUMÉ . Dans le cadre de la conférence d'évaluation DUC, nous avons développé un système de résumé automatique de documents multiples qui se base sur l'extraction des phrases clés. La méthode proposée utilise un algorithme génétique qui permet de combiner les phrases des documents sources pour former les extraits, qui seront croisés et mutés pour générer de nouveaux extraits. L'examen des résultats obtenus dans les deux sessions DUC'04 et DUC'07 a montré un écart significatif...

GVC: a graph-based Information Retrieval Mode.

Quoc Dinh Truong, Taoufiq Dkaki, Josiane Mothe & Pierre-Jean Charrel

Modèle de recherche contextuelle orientée contenu pour un corpus de documents XML.

Ounas Asfari
RÉSUMÉ . Dans le cadre de corpus de documents XML, la recherche par mots-clés reste le moyen le plus utilisé pour un utilisateur dont le besoin d'information est vague, ou encore parce qu'il ne connaît pas précisément la structure des documents. Dans cet article nous présentons notre approche de recherche de noeuds pertinents à une requête orientée contenu 'Content Only' composée de simples mots clés dans un corpus de documents XML en prenant en compte...

Annotation collective dans le contexte RI : définition d'une plate-forme pour expérimenter la validation sociale.

Guillaume Cabanac
RÉSUMÉ. Avec l'avènement du Web participatif, les lecteurs de documents électroniques sont de plus en plus actifs. En particulier, des systèmes d'annotation leur permettent de commen- ter, de reformuler, de critiquer, etc. des passages de documents. Les approches de RI qui ne considéraient jusqu'alors que le contenu des documents tendent actuellement à exploiter cette dimension participative du Web. L'activité des lecteurs (annotations et débats suscités) peut par exemple améliorer rappel et précision des résultats de...

Un modèle de recherche de fichiers personnels par contexte dans les systèmes d'étiquetage.

Ba-Hung Ngo, Frédérique Silber-Chaussumier & Christian Bac
RÉSUMÉ . Depuis peu, les étiquettes sont utilisées largement pour identifier des contenus aussi bien sur le bureau informatique des utilisateurs que sur les sites coopératifs du Web dit 2.0. Notre recherche se focalise sur l'organisation assistée des étiquettes personnelles afin d'améliorer la pertinence des recherches de fichiers personnels associés à des étiquettes. Notre proposition utilise la notion de contexte comme point central. Un contexte est constitué à partir d'un ensemble d'étiquettes affectées par un...

La fiabilité des informations sur le web: le cas Wikipédia.

Bernard Jacquemin, Aurélien Lauf, Céline Poudat, Martine Hurault-Plantet & Nicolas Auray
RÉSUMÉ. Les outils de recherche d'information sur le web doivent tenir compte des phénomènes nouveaux liés à l'apparition des blogs, wikis, et autres publications collaboratives. Parmi ces sites, l'encyclopédie Wikipédia constitue une source importante d'information. La qualité de ses informations a pourtant été récemment mise en cause. Mieux connaître les comportements des contributeurs peut permettre de guider les utilisateurs dans des contenus de qualité parfois disparate. Pour explorer cette voie, nous présentons une analyse du...

Approche par réutilisation d'annotations sémantiques pour la recherche d'information sur le web.

Wiem Yaiche Elleuch, Lobna Jéribi, Mohamed Tmar & Abdelmajid Ben Hamadou
RÉSUMÉ. Dans cet article, nous présentons une nouvelle approche d'aide à la recherche d'information sur le web. Elle a pour objectif de présenter à l'utilisateur courant des documents réponses pertinents pour sa requête et adaptés à son profil. Elle consiste à utiliser le mécanisme du Raisonnement à Partir de Cas (RàPC) pour mémoriser les sessions de recherche effectuées par les utilisateurs (profil utilisateur, requête, annotation d'un document pertinent, date) et à les réutiliser lorsqu'une session...

Indexation semi-automatique de textes : thésaurus et transducteurs.

Laurent Kevers
RÉSUMÉ. Cet article présente une méthode de classification ne nécessitant pas de phase d'apprentissage. Son but est d'améliorer l'indexation manuelle des documents textuels, une opéra- tion souvent menée au sein de certains systèmes d'information requérant un niveau de précision élevé. Le système, qui apporte une aide à l'indexeur humain, est semi-automatique. Par analo- gie à la terminologie utilisée en apprentissage automatique, la méthode est dite supervisée car elle exploite une définition préalable des catégories d'indexation....

Modèle d'indexation dynamique à base d'ontologies.

Gilles Hubert, Josiane Mothe, Bachelin Ralalason & Bertin Ramanonjisoa
RÉSUMÉ .Cet article propose un modèle de données pour une indexation basée sur une ontologie de référence représentant la sémantique des termes d'indexation. Le modèle proposé vise à permettre une indexation en temps réel qui suit la dynamique du corpus tout en assurant la disponibilité des documents et de l'index. Ceci permet de garder la cohérence entre les documents de la collection, l'index et l'ontologie de référence. Notre modèle permet ainsi d'éviter la reconstruction de...

Impact de la reconnaissance de l'écriture en-ligne sur une tâche de catégorisation.

Sebastián Peña Saldarriaga, Emmanuel Morin & Christian Viard-Gaudin
RÉSUMÉ. Cet article s'intéresse à la problématique de la catégorisation automatique de docu- ments manuscrits en-ligne et plus particulièrement à l'impact de la reconnaissance de l'écriture dans un processus de catégorisation utilisant des méthodes d'apprentissage automatique. Nous comparons les performances obtenues avec des documents issus d'un système de recon- naissance de l'écriture en-ligne et leur version originale électronique. Les résultats montrent qu'aucune perte significative des performances n'est à signaler lorsque 78 % des termes d'in-...

SRI à base d'inclusion graduelle.

Laurent Ughetto, Olivier Pivert, Vincent Claveau & Patrick Bosc
RÉSUMÉ. Cet article étudie, d'un point de vue expérimental, l'apport des inclusions graduelles issues de la théorie des ensembles flous pour la modélisation d'un système de recherche d'in- formation (SRI), comme l'ont proposé de manière théorique (Bosc et al., 2008b). Documents et requêtes sont représentés par des ensembles flous, appariés par des opérateurs flous, dont le choix est crucial pour obtenir un système adapté à la RI. S'ils sont bien choisis, le SRI flou ob-...

Structure et proximité pour la recherche documentaire.

Michel Beigbeder
RÉSUMÉ. Notre étude compare les performances d'un système de recherche d'information basé sur la proximité des occurrences des termes de la requête dans les documents avec un système classique de modèle de langue avec lissage de Dirichlet et le modèle Okapi BM25 . Notre modèle basé sur la proximité calcule en chaque position du document une valeur d'autant plus grande que des occurrences de tous les termes de la requête sont proches de cette position....

REVISE, un outil d'évaluation précise des systèmes questions-réponses.

Sarra El Ayari, Brigitte Grau & Anne-Laure Ligozat
RÉSUMÉ. Des campagnes d'évaluations sont organisées chaque année pour évaluer des systèmes de questions-réponses sur la validité des résultats fournis. Pour les équipes, il s'agit ensuite de réussir à mesurer la pertinence des stratégies développées ainsi que le fonctionnement des com- posants. À ces fi ns, nous décrivons un outil générique d'évaluation de type boîte transparente qui permet à un système produisant des résultats intermédiaires d'évaluer ses résultats. Nous illustrerons cette démarche en testant l'impact...

Recherche contextuelle d'information dans un environnement mobile.

Ourdia Bouidghaghen
RÉSUMÉ . La recherche contextuelle d'information (RCI) a pour objectif de mieux répondre aux besoins de l'utilisateur en lui délivrant l'inf ormation adaptée à son contexte spécifique de recherche. Cet article présente une approche de RCI dans le cas d'un environnement mobile, où le contexte spatio-temporel de l'utilisateur et son contexte cognitif, sont à la fois considérés pour lui délivrer de l'information pertinente. Nous proposons de construire des profils situationnels basés sur l'historique de recherche...

Modèle de langue visuel pour la reconnaissance de scènes.

Trong-Ton Pham, Loïc Maisonnasse, Philippe Mulhem & Éric Gaussier
RÉSUMÉ. Dans cet article, nous décrivons une méthode pour utiliser un modèle de langue sur des graphes pour la recherche et la catégorisation d'images. Nous utilisons des régions d'images (associées automatiquement à des concepts visuels), ainsi que des relations spatiales entre ces régions, lors de la construction de la représentation sous forme de graphe des images. Notre méthode gère différents scénarios, selon que des images isolées ou groupées soient utilisés comme base d'apprentissage ou de...

Modèles d'Ordonnancement pour l'Annotation Automatique d'Images dans les Réseaux Sociaux.

Ludovic Denoyer & Patrick Gallinari
RÉSUMÉ. Nous proposons un modèle d'ordonnancement de données relationnelles pour ap- prendre automatiquement à annoter des images dans les sites permettant le partage social d'images. Ce modèle apprend à associer une liste ordonnée d'étiquettes à une image en consi- dérant simultanément l'information de contenu (texte/image) et les informations relationnelles entre les images. Il est capable d'utiliser aussi bien des informations relationnelles implicites comme les similarités visuelles ou les informations relationnelles explicites comme l'amitié entre deux...

Indexation de structures de documents par réseaux bayésiens.

Mohamed Ali Mahjoub & Khlifia Jayech
RÉSUMÉ : Notre objectif est d'étudier l'apport des réseaux naïfs augmentés dans les problèmes de classification d'images. Les images utilisées dans notre étude représentent la structure d'un type de documents qui contiennent des blocs de textes et de graphiques. Nous avons proposé trois variantes des réseaux bayésiens. En premier lieu les réseaux bayésiens naïfs RN qui malgré leur structure simple ont donnés un très bons résultats. En second lieu, les réseaux bayésiens naïfs augmentés par...

Vectorisation des processus d'appariement document-requête.

Vincent Claveau, Romain Tavenard & Laurent Amsaleg
RÉSUMÉ. Dans la plupart des applications de RI, calculer rapidement la proximité entre do- cuments et requêtes est crucial. Avec les modèles vectoriels, ce calcul se fait généralement de manière très efficace. Cependant, lorsque les requêtes sont très longues ou dans le cas de SRI basés sur des modèles plus avancés, ce calcul devient plus complexe et coûteux. Dans cet article, nous proposons une technique simple pour transformer n'importe quel processus d'ap- pariement requête-document fournissant...

Expansion de requêtes pour la recherche d'information multilingue.

Benoît Gaillard, Jean Léon Bouraoui, Emilie Guimier De Neef & Malek Boualem

Mining the Web for lists of Named Entities.

Arlind Kopliku, Mohand Boughanem & Karen Pinel-Sauvagnat
RÉSUMÉ. Les entités nommées jouent un rôle important en extraction d'information. Dans cet article, nous proposons une méthode pour extraire des entités nommées de la même classe au sein de listes HTML. Au lieu de partir d'une classe donnée et d'extraire les entités correspon- dantes, nous proposons une nouvelle approche qui consiste à identifier des ensembles d'entités nommées sans connaître leur classe d'appartenance. Un avantage évident de cette approche est qu'elle peut s'appliquer à tout...

Etude de l'impact du regroupement automatique de phrases sur un système de résumé multi-documents.

Aurélien Bossard & Emilie Guimier De Neef
RÉSUMÉ. Dans cet article, nous comparons les résultats produits par différentes approches de résumé multi-documents. Nous opposons deux approches classiques à la nôtre qui place la modélisation de la diversité informationnelle du corpus au centre du processus. Nous évaluons également l'impact de différentes mesures de similarité entre phrases. Les expériences, menées sur le corpus RPM2, montrent qu'un regroupement des phrases en classes sémantiques améliore la qualité des résumés.

Recherche d'information dans un corpus bruité (OCR).

Nada Naji, Jacques Savoy & Ljiljana Dolamic
RÉSUMÉ .Cet article désire mesurer la perte de performance lors de la recherche d'information dans une collection de documents scannés. Disposant d'un corpus sans erreur et de deux versions renfermant 5 % et 20 % d'erreurs en reconnaissance, nous avons évalué six modèles de recherche d'information basés sur trois représentations des documents (sac de mots, n-grammes, ou trunc-n) et trois enracineurs. Basé sur l'inverse du rang du premier document pertinent dépisté, nous démontrons que la...

Construire et évaluer une application de veille pour l'information sur les événements sismiques.

Romaric Besançon, Olivier Ferret & Ludovic Jean-Louis
RÉSUMÉ. Le développement d'applications opérationnelles de veille pour des domaines spéci- fiques nécessite l'intégration de nombreuses techniques et outils issus du champ de la recherche d'information et du traitement automatique des langues. Dès lors, un des défis présidant à une telle intégration est la prise en compte des limitations propres à chacune de ces techniques et outils en termes d'influence sur le résultat final du système. Plus précisément, nous pré- sentons dans cet article une...

Registration Year

  • 2019
    23
  • 2018
    31
  • 2017
    544

Resource Types

  • Text
    598