619 Works

Recherche contextuelle d'information dans un environnement mobile.

Ourdia Bouidghaghen
RÉSUMÉ . La recherche contextuelle d'information (RCI) a pour objectif de mieux répondre aux besoins de l'utilisateur en lui délivrant l'inf ormation adaptée à son contexte spécifique de recherche. Cet article présente une approche de RCI dans le cas d'un environnement mobile, où le contexte spatio-temporel de l'utilisateur et son contexte cognitif, sont à la fois considérés pour lui délivrer de l'information pertinente. Nous proposons de construire des profils situationnels basés sur l'historique de recherche...

Modèle de langue visuel pour la reconnaissance de scènes.

Trong-Ton Pham, Loïc Maisonnasse, Philippe Mulhem & Éric Gaussier
RÉSUMÉ. Dans cet article, nous décrivons une méthode pour utiliser un modèle de langue sur des graphes pour la recherche et la catégorisation d'images. Nous utilisons des régions d'images (associées automatiquement à des concepts visuels), ainsi que des relations spatiales entre ces régions, lors de la construction de la représentation sous forme de graphe des images. Notre méthode gère différents scénarios, selon que des images isolées ou groupées soient utilisés comme base d'apprentissage ou de...

Modèles d'Ordonnancement pour l'Annotation Automatique d'Images dans les Réseaux Sociaux.

Ludovic Denoyer & Patrick Gallinari
RÉSUMÉ. Nous proposons un modèle d'ordonnancement de données relationnelles pour ap- prendre automatiquement à annoter des images dans les sites permettant le partage social d'images. Ce modèle apprend à associer une liste ordonnée d'étiquettes à une image en consi- dérant simultanément l'information de contenu (texte/image) et les informations relationnelles entre les images. Il est capable d'utiliser aussi bien des informations relationnelles implicites comme les similarités visuelles ou les informations relationnelles explicites comme l'amitié entre deux...

Indexation de structures de documents par réseaux bayésiens.

Mohamed Ali Mahjoub & Khlifia Jayech
RÉSUMÉ : Notre objectif est d'étudier l'apport des réseaux naïfs augmentés dans les problèmes de classification d'images. Les images utilisées dans notre étude représentent la structure d'un type de documents qui contiennent des blocs de textes et de graphiques. Nous avons proposé trois variantes des réseaux bayésiens. En premier lieu les réseaux bayésiens naïfs RN qui malgré leur structure simple ont donnés un très bons résultats. En second lieu, les réseaux bayésiens naïfs augmentés par...

Vectorisation des processus d'appariement document-requête.

Vincent Claveau, Romain Tavenard & Laurent Amsaleg
RÉSUMÉ. Dans la plupart des applications de RI, calculer rapidement la proximité entre do- cuments et requêtes est crucial. Avec les modèles vectoriels, ce calcul se fait généralement de manière très efficace. Cependant, lorsque les requêtes sont très longues ou dans le cas de SRI basés sur des modèles plus avancés, ce calcul devient plus complexe et coûteux. Dans cet article, nous proposons une technique simple pour transformer n'importe quel processus d'ap- pariement requête-document fournissant...

Expansion de requêtes pour la recherche d'information multilingue.

Benoît Gaillard, Jean Léon Bouraoui, Emilie Guimier De Neef & Malek Boualem

Mining the Web for lists of Named Entities.

Arlind Kopliku, Mohand Boughanem & Karen Pinel-Sauvagnat
RÉSUMÉ. Les entités nommées jouent un rôle important en extraction d'information. Dans cet article, nous proposons une méthode pour extraire des entités nommées de la même classe au sein de listes HTML. Au lieu de partir d'une classe donnée et d'extraire les entités correspon- dantes, nous proposons une nouvelle approche qui consiste à identifier des ensembles d'entités nommées sans connaître leur classe d'appartenance. Un avantage évident de cette approche est qu'elle peut s'appliquer à tout...

Etude de l'impact du regroupement automatique de phrases sur un système de résumé multi-documents.

Aurélien Bossard & Emilie Guimier De Neef
RÉSUMÉ. Dans cet article, nous comparons les résultats produits par différentes approches de résumé multi-documents. Nous opposons deux approches classiques à la nôtre qui place la modélisation de la diversité informationnelle du corpus au centre du processus. Nous évaluons également l'impact de différentes mesures de similarité entre phrases. Les expériences, menées sur le corpus RPM2, montrent qu'un regroupement des phrases en classes sémantiques améliore la qualité des résumés.

Recherche d'information dans un corpus bruité (OCR).

Nada Naji, Jacques Savoy & Ljiljana Dolamic
RÉSUMÉ .Cet article désire mesurer la perte de performance lors de la recherche d'information dans une collection de documents scannés. Disposant d'un corpus sans erreur et de deux versions renfermant 5 % et 20 % d'erreurs en reconnaissance, nous avons évalué six modèles de recherche d'information basés sur trois représentations des documents (sac de mots, n-grammes, ou trunc-n) et trois enracineurs. Basé sur l'inverse du rang du premier document pertinent dépisté, nous démontrons que la...

Construire et évaluer une application de veille pour l'information sur les événements sismiques.

Romaric Besançon, Olivier Ferret & Ludovic Jean-Louis
RÉSUMÉ. Le développement d'applications opérationnelles de veille pour des domaines spéci- fiques nécessite l'intégration de nombreuses techniques et outils issus du champ de la recherche d'information et du traitement automatique des langues. Dès lors, un des défis présidant à une telle intégration est la prise en compte des limitations propres à chacune de ces techniques et outils en termes d'influence sur le résultat final du système. Plus précisément, nous pré- sentons dans cet article une...

Solving Concept mismatch through Bayesian Framework by Extending UMLS Meta-Thesaurus.

Karam Abdulahhad, Jean-Pierre Chevallet & Catherine Berrut
RÉSUMÉ. La plupart des systèmes de Recherche d'Information sont basés sur la correspondance exacte entre termes, même si de nombreuses recherches portent sur le problème de la corres- pondance entre variantes de termes issus de mots synonymes, d'une formulation multilingue, ou sur l'utilisation de termes experts très précis. Résoudre ces problèmes nécessite une analyse particulière pour combler l'écart entre l'information contenue dans les documents et le besoin de l'utilisateur. Dans ce travail, nous proposons une...

Personnalisation flexible d'un processus de recherche d'information mobile.

Ourdia Bouidghaghen & Lynda Tamine
RÉSUMÉ. Dans le passé, les modèles de recherche personnalisés ont été principalement fondés sur le contexte cognitif (Url visitées, les documents vus) de l'utilisateur indépendamment de son environnement caractérisé par le lieu, le temps, les personnes proches, etc. Dans cet ar- ticle nous proposons une approche de personnalisation des résultats de recherche Web pour des utilisateurs mobiles en exploitant à la fois le contexte cognitif et spatio-temporel. Nous proposons de modéliser l'utilisateur par un profil...

Extraction de relations n-aires interphrastiques guidée par une RTO.

Akila Ghersedine, Patrice Buche, Juliette Dibie-Barthélemy, Nathalie Hermandez & Mouna Kamel
RÉSUMÉ. Nous proposons dans cet article une méthode d'extraction d'instances de relations n- aires dans un texte guidée par une Ressource Termino-Ontologique (RTO) de domaine. Une RTO est une ressource comportant une composante conceptuelle (l'ontologie) et une compo- sante terminologique (la terminologie), dans laquelle les termes sont distingués des concepts qu'ils dénotent. L'ontologie permet la modélisation de relations n-aires, reliant des arguments pouvant être des concepts symboliques et des quantités. La méthode proposée s'applique aux...

Retrieval effectiveness study with Farsi language.

Mitra Akasereh & Jacques Savoy
RESUME. Dans le but d'utiliser le persan comme langue de référence, et en utilisant une collection test de 166 774 documents et de 100 requêtes, cette étude évalue la performance des différents modèles de RI sur lesquels sont appliqués diverses stratgies d'indexation et de recherche. De plus, cette étude évalue l'impact de l'élimination de la liste des mots-outils lors de l'indexation. Selon les résultats obtenus, le modèle DFR-I(ne)C2 est le plus performant. L'enracineur léger et...

Intrégration des facteurs temps et autorité sociale dans un modèle bayésien de recherche de tweets.

Lamjed Ben Jabeur, Lynda Tamine & Mohand Boughanem
RÉSUMÉ. Cet article présente une approche sociale pour la recherche d'information dans les microblogs intégrant diverses sources d'évidence au sein d'un réseau bayésien. Notre contribu- tion consiste à étendre la notion classique de pertinence, basée sur la similarité textuelle, par de nouveaux facteurs tels que l'importance sociale des blogueurs et la magnitude temporelle des microblogs. Dans ce papier, l'importance sociale d'un blogueur est assimilée à son in- fluence dans le réseau et est évaluée par...

Coûts de distance d'édition pour la Recherche d'Information XML.

Cyril Laitang, Karen Pinel-Sauvagnat & Mohand Boughanem
RESUME. La recherche d'information structurée (RIS) sur documents de type XML permet de retourner des parties de documents répondant plus précisément aux besoins des utilisateurs. Ces derniers, parfois exprimés sous forme de requêtes structurées, peuvent tout comme les documents être représentés sous forme d'arbres. Notre approche utilise ces représentations arborescentes et mesure la pertinence des éléments XML au travers de la distance d'édition. Cette dernière se définit comme la somme des coûts minimaux d'opérations de...

Génération de réponses pour un système de questions-réponses.

Van-Minh Pho
RÉSUMÉ. Les systèmes de questions-réponses (SQR) actuels répondent à une question posée par l'utilisateur en langue naturelle par une information précise ainsi qu'un passage de document justifiant cette information. Le principal défaut de ces réponses est qu'elles ne créent pas d'interaction avec l'utilisateur, ce qui peut être problématique, en particulier dans le cas où le SQR est intégré dans un système de dialogue oral. Cet article présente un système générant des réponses en langue naturelle...

Quantification et identification des concepts implicites d'une requête.

Romain Deveaud, Ludovic Bonnefoy & Patrice Bellot
RÉSUMÉ. Nous proposons dans cet article une méthode non supervisée pour l’identification et la modélisation de concepts associés à une recherche d’information. Nous utilisons l’allocation de Dirichlet latente (LDA), un modèle génératif probabiliste, pour détecter les concepts implicites de la requête en utilisant les documents obtenus par un processus de retour de pertinence simulé (ou documents de feedback). Notre approche estime automatiquement le nombre de concepts ainsi que le nombre de documents de feedback sans...

Construction automatique de ressources lexicales pour la fouille d'opinion.

Yves Bestgen
RÉSUMÉ . De nombreuses méthodes automatiques de fouille d'opinion s'appuient sur un lexique dans lequel à chaque entrée est associé un degré de polarité. La construction de telles ressources linguistiques est donc devenue un champ de recherche important en linguistique computationnelle. Des techniques automatiques, basées sur les similarités sémantiques entre les mots dont on veut estimer la polarité et des mots dont la polarité est connue, ont été développées ces dix dernières années et leur...

Vectorisation du modèle d'appariement pour la recherche d'images par le contenu.

Hanen Karamti
RÉSUMÉ. Le développement rapide des techniques de numérisation et de stockage a engendré une croissance accrue du volume des documents électroniques (textes, images, sons et vidéos). Pour faire face à cette grande masse d'informations, en particulier les images, il est nécessaire de développer des outils qui permettent d'optimiser l'accès à de telles sources de données. Le problème qui se pose est la représentation du contenu d'images, puisque les techniques actuelles ne permettent pas de décrire...

Classification non supervisée floue des termes basée sur la proximité pour les systèmes de recherche d'information.

Ilyes Khennak
RÉSUMÉ. Le regroupement des termes basé sur la mesure de proximité est une stratégie menant efficacement à trouver les documents pertinents. Contrairement à ce qu'ont montré les études récentes qui ont utilisé la proximité des termes pour le classement des documents, le processus de recherche d'information est entièrement revu dans ce travail en ce qui concerne les étapes d'indexation et d'interrogation. Par conséquent, un Fichier Inverse Etendu est construit en ex- ploitant le concept de...

Applying a family of IR models to text description-based service retrieval.

Isaac-Bernardo Caicedo, Marie-Christine Fauvet, Ahmed Lbath & Helga Duarte-Amaya
RÉSUMÉ. Dans l'étude rapportée dans cet article, nous appliquons et étudions une famille de modèles de Recherche d'Information (RI) afin de traiter le problème de la recherche de services, dont la description correspond aux requêtes des utilisateurs exprimées sous forme libre. Ainsi, nous appliquons quatre modèles qui, au meilleur de notre connaissance, n'ont été appliqués dans aucune des approches existantes de RI pour la découverte de services. Les deux pre- miere sont basés sur des...

Apprentissage de métrique appliqué à la détection de changement de page Web et aux attributs relatifs.

Marc Teva Law, Nicolas Thome, Stéphane Gançarski & Matthieu Cord
RÉSUMÉ. Nous proposons dans cet article un nouveau schéma d'apprentissage de métrique. Basé sur l'exploitation de contraintes qui impliquent des quadruplets d'images, notre approche vise à modéliser des relations sémantiques de similarités riches ou complexes. Nous étudions comment ce schéma peut être utilisé dans des contextes tels que la détection de régions impor- tantes dans des pages Web ou la reconnaissance à partir d'attributs relatifs.

Registration Year

  • 2021
    21
  • 2019
    23
  • 2018
    31
  • 2017
    544

Resource Types

  • Text
    597
  • Conference Paper
    21
  • Conference Proceeding
    1