598 Works

Aggregated search: From information nuggets to aggregated documents.

Arlind Kopliku
RÉSUMÉ. Le but de la recherche agregée est de rassembler des informations provenant de plu- sieurs sources en une seule interface. Elle doit ainsi gérer des problématiques liées aux dif- férents types de contenu (texte, vidéo, image, etc) ainsi qu'à la granularité des résultats. La formation d'un contenu agrégé à partir de différents types de contenus retrouvés contraste avec l'approche commune en RI consistant à renvoyer à l'utilisateur une liste ordonnée de résultats. Si nous...

Quel est l'auteur de ce roman ?

Jacques Savoy
RÉSUMÉ . Dans cet article, nous présentons le problème de l'attribution d'auteur d'une oeuvre écrite. Comme représentation des textes, les études récentes s'appuient sur un ensemble restreint de mots fonctionnels ou très fréquents (50 ou 100). Sur cette base, les méthodes de l'analyse en composantes principales (ACP) ou des correspondances (AC) permettent de visualiser les affinités et différences entre les représentations des écrits. En appliquant l'approche du plus proche voisin, nous pouvons estimer l'auteur de...

Représentation par graphe de mots manuscrits dans les images pour la recherche par similarité.

Wang 0006, Peng, Véronique Eglin, Christophe Garcia, Christine Largeron, Josep Lladós & Alicia Fornés
RÉSUMÉ . Dans ce papier, nous proposons une nouvelle approche de la recherche de mots par similarité reposant sur une structure de graphes intégrant des informations sur la topologie, la morphologie locale des mots ainsi que des informations contextuelles dans le voisinage de chaque point d'intérêt. Chaque mot image est représenté par une séquence de graphes associés chacun à un objet connexe. Un graphe est construit sur la base d'un squelette décrit par un descripteur...

Identification Semi-Automatique de Mots-Germes pour l’Analyse de Sentiments et son Intensité

Amal Htait, Sébastien Fournier & Patrice Bellot
RÉSUMÉ. Dans le but d'exploiter les opinions dans les tweets, cet article présente une classification à partir du sentiment contenu au sein des tweets. Nous présentons une méthode d'identifi- cation de nouveaux mots-germes. Ils sont utilisés pour la prédiction de l'intensité de sentiments des mots en co-occurrence avec ces mots-germes. Ensuite, le calcul de similarités entre sen- timents est appliqué en utilisant: la mesure de la similarité entre deux mots et l'utilisation de plongement de...

Classement collaboratif de manuscrits.

Pierre-Edouard Portier
RÉSUMÉ. Pour chaque projet d'édition numérique de manuscrits, après que le corpus ait été constitué, les chercheurs commencent par le classer. Cette opération demande de grands ef- forts d'interprétation, elle n'est pas neutre mais contribue à la construction du point de vue du chercheur sur son objet d'étude. Ainsi, plusieurs classements peuvent être proposés pour un même sous-ensemble de l'archive. Or il n'existe pas de plateforme informatique spécifi que pour assister les chercheurs dans cette...

Personnalisation flexible d'un processus de recherche d'information mobile.

Ourdia Bouidghaghen & Lynda Tamine
RÉSUMÉ. Dans le passé, les modèles de recherche personnalisés ont été principalement fondés sur le contexte cognitif (Url visitées, les documents vus) de l'utilisateur indépendamment de son environnement caractérisé par le lieu, le temps, les personnes proches, etc. Dans cet ar- ticle nous proposons une approche de personnalisation des résultats de recherche Web pour des utilisateurs mobiles en exploitant à la fois le contexte cognitif et spatio-temporel. Nous proposons de modéliser l'utilisateur par un profil...

XFIRM: un Modèle Flexible de Recherche d'Information pour le stockage et l'interrogation de documents XML.

Karen Sauvagnat
RESUME : Les utilisateurs recherchant une information précise ne souhaitent pas la voir noyée aux milieux d'autres sujets, comme cela peut être le cas dans de grands documents. Les documents XML, par leur structure même, permettent de traiter l'information qu'ils contiennent à un niveau de granularité autre que celui du document tout entier. Deux approches s'affrontent pour la recherche d'information (RI) dans des documents XML. La première est basée sur des méthodes issues de la...

Vers un modèle d'indexation sémantique adapté aux dossiers médicaux de patients.

Ba-Duy Dinh & Lynda Tamine-Lechani
RÉSUMÉ. Ce papier présente un modèle d'indexation sémantique adapté aux dossiers électro- niques de patients. Ce modèle servira de support à des processus de recherche d'information médicale, permettant à terme de promouvoir l'expérience collective des médecins. Compte tenu de la spécificité de ce type de documents, le processus d'indexation est basé sur la succes- sion d'étapes d'annotation sémantique fondée sur l'utilisation de MeSH (Medical Subject Hea- dings), de désambiguïsation répondant au problème d'homonymie, d'extraction de...

Recherche approchée d'information dans une base de documents semi-structurés.

Eugen Popovici, Gildas Ménier & Pierre-François Marteau
RÉSUMÉ .Nous proposons des algorithmes dédiés à l'indexation et à la recherche approximative d'information dans les bases de données hétérogènes semi-structurées XML. Le modèle d'indexation proposé est adapté à la recherche de contenu textuel dans les contextes XML définis par les structures d'arbres. Les mécanismes de recherche approchée mis en oeuvre s'appuient sur une distance de Levenshtein modifiée et des heuristiques de fusion d'information. Une implémentation exploitant simultanément l'information structurée, i.e. l'arborescence des éléments XML,...

Un modèle syllabique pour la reconnaissance de l’écriture.

Wassim Swaileh, Kamel Ait Mohand & Thierry Paquet
RÉSUMÉ. Dans cet article nous introduisons un nouveau modèle syllabique pour la reconnaissance de l'écriture. Une méthode de syllabation orthographique supervisée du Français est proposé pour la construction d’un vocabulaire de syllabes. Un modèle de langage statistique en n-gram combinant syllabes et caractères est appris sur un corpus Wikipedia. Le système de reconnaissance d’écriture fondé sur des modèles optiques HMM de caractères procède à un décodage en deux passes en exploitant le modèle syllabique proposé....

Étude préliminaire à la recherche de photographies muséales en mobilité.

Maxime Portaz, Philippe Mulhem & Jean-Pierre Chevallet
RÉSUMÉ. Cet article étudie la problématique de l’indexation et de la recherche d’image dans le cadre de visites de musée. Nous nous intéressons en particulier au cas d’utilisation d’outils mobiles "hors ligne" (c’est-à-dire sans connexion à un serveur distant), du point de vue qualité intrinsèque et du point de vue application mobile. Nous décrivons trois approches de référence, et nous étudions leur comportement qualitatif sur une collection de photographies de peintures, prises par des outils...

Apprentissage d'un espace de concepts de mots pour une nouvelle représentation des données textuelles.

Young-Min Kim, Jean-François Pessiot, Massih-Reza Amini & Patrick Gallinari
RÉSUMÉ. Dans cet article nous proposons une technique à base d'apprentissage non-supervisé pour la réduction de dimension des données textuelles. Cette technique est basée sur l'hypo- thèse que les termes co-occurrants dans les mêmes documents avec les mêmes fréquences sont sémantiquement proches. Suivant cette hypothèse les termes sont d'abord regroupés avec l'al- gorithme CEM qui est une version classifiante de l'algorithme EM. Les documents sont ensuite représentés dans l'espace de ces groupes de termes. Nous...

Experiments on two Query Expansion Approaches for a Proximity-based Information Retrieval Model.

Bissan Audeh
RÉSUMÉ. L'expansion de requêtes est une technique bien connue pour dépasser l'exigence de recherche par mot exact en recherche d'information. Cependant, l'expansion automatique vient avec le risque de dérive de la requête. Dans ce travail nous avons eu ce problème en essayant d'étendre des requêtes booléennes pour un modèle de recherche basé sur la proximité. Ce modèle obtient une bonne précision dans les campagnes d'évaluation mais il rend très peu de résultats. Dans ce travail,...

Extraction de patterns successifs dans des images de document en combinant histogrammes de forces et droites discrètes.

Isabelle Debled-Rennesson & Laurent Wendling
RÉSUMÉ. Nous proposons dans cet article une méthode originale pour la recherche de séries de patterns successifs dans des images de documents. L’objectif de notre approche est d’extraire des symboles de même nature, suivant une direction quelconque, et en considérant des objets quelconques. Pour ceci, nous considérons la localisation spatiale de triplets de composantes connexes définis en exploitant les propriétés inhérentes de l’histogramme de forces. Puis la reconnaissance est effectuée en prolongeant et en exploitant,...

Recherche d'information XML utilisant un principe de vote.

Gilles Hubert, Josiane Mothe & Sandra Poulain
RÉSUMÉ . Cet article décrit une approche pour la recherche d'information dans des collections de documents XML. Cette approche utilise une méthode de vote pour déterminer les éléments XML répondant à une requête. Une requête peut combiner des informations sur le contenu recherché, sur la granularité des éléments recherchés et sur les éléments structurels associés aux concepts recherchés. La méthode proposée a été expérimentée et évaluée dans le cadre de la campagne INEX 2004.

Un modèle pour l'interrogation visuelle des documents structurés.

Rami Harrathi & Sylvie Calabretto
RÉSUMÉ . Dans cet article, nous présentons un modèle d'interrogation visuelle des documents structurés permettant de représenter graphiquement les requêtes utilisateurs sous forme de graphe, et d'effectuer ainsi des requêtes d'une rare complexité syntaxique et sémantique. Le modèle est validé par le développement d'un prototype XmlBrowser permettant d'explorer et d'interroger une collection de documents structurés (Xml).

Utilisation du réseau sémantique de l'UMLS pour la définition de types d'entités nommées médicales.

Thierry Delbecque, Pierre Jacquemart & Pierre Zweigenbaum
RÉSUMÉ. Les entités nommées (EN) sont des objets importants pour les systèmes de Questions- Réponses (QR). Cependant, les types d'EN habituels couvrent des concepts très généraux : dates, lieux géographiques, noms de personnes, etc. Pour un système de QR dédié à la méde- cine, il serait utile de disposer de types plus spécifiques. Une hiérarchie de types de concepts médicaux est définie dans l'UMLS, une grande base terminologique médicale produite par la NLM. Nous tentons...

Intrégration des facteurs temps et autorité sociale dans un modèle bayésien de recherche de tweets.

Lamjed Ben Jabeur, Lynda Tamine & Mohand Boughanem
RÉSUMÉ. Cet article présente une approche sociale pour la recherche d'information dans les microblogs intégrant diverses sources d'évidence au sein d'un réseau bayésien. Notre contribu- tion consiste à étendre la notion classique de pertinence, basée sur la similarité textuelle, par de nouveaux facteurs tels que l'importance sociale des blogueurs et la magnitude temporelle des microblogs. Dans ce papier, l'importance sociale d'un blogueur est assimilée à son in- fluence dans le réseau et est évaluée par...

Detection of abusive messages in an on-line community.

Etienne Papegnies, Vincent Labatut, Richard Dufour & Georges Linarès
RÉSUMÉ. La modération du contenu posté par les utilisateurs de communautés en ligne est majoritairement effectuée manuellement. De par la taille des données à traiter, les méthodes au- tomatiques ont un intérêt certain pour réduire la charge de travail. Actuellement, l'industrie utilise des approches basiques à base de recherche de mots, comme par exemple le filtrage des messages contenant certains mots interdits. Nous nous intéressons dans cet article à une tâche de classification permettant de...

SnapToTell Accès ubiquitaire à de l'information multimédia à partir d'un téléphone portable.

Jean-Pierre Chevallet & Joo-Hwee Lim
RÉSUMÉ. Avec la prolifération des téléphones portables munis d'appareils photo, beaucoup de nouvelles applications et services vont émerger : nous présentons le système SnapToTell, qui permet de fournir de l'information à partir de requêtes images prises d'un téléphone portable. Nous présentons également des résultats expérimentaux sur l'identification de scènes, basés sur une collection test d'images originales et réalistes de scènes à Singapour.

Querying by examples.

Arlind Kopliku, Mohand Boughanem & Karen Pinel-Sauvagnat

Utilisation des syntagmes nominaux dans un système de recherche d'information en langue arabe.

Siham Boulaknadel
RÉSUMÉ . Dans un contexte riche, un système de recherche d'information doit être capable de trouver les meilleurs résultats possibles. Dans ce but, notre étude s'intéresse aux connaissances qui peuvent être extraites du contenu textuel des documents en associant la finesse d'analyse d'une approche linguistique à la capacité d'une approche statistique traitant des corpus de grandes tailles. L'approche statistique se base sur la fouille de données textuelles et principalement sur la technique d'analyse sémantique latente...

Une approche non supervisée pour le typage et la validation d'une réponse à une question en langage naturel : application à la tâche Entity de TREC 2010.

Ludovic Bonnefoy, Patrice Bellot & Michel Benoit
RÉSUMÉ. La recherche d'entités nommées a été le sujet de nombreux travaux en recherche d'in- formation. Dans ce papier, nous cherchons à déterminer si une entité est d'un type donné, et ce de manière non-supervisée et quel que soit son type. Nous proposons pour cela une approche basée sur l'utilisation de modèles de langage estimés à partir du web. De plus, nous souhaitons déterminer si cette nouvelle information peut être utilisée efficacement pour améliorer le...

Recherche contextuelle d'information dans un environnement mobile.

Ourdia Bouidghaghen
RÉSUMÉ . La recherche contextuelle d'information (RCI) a pour objectif de mieux répondre aux besoins de l'utilisateur en lui délivrant l'inf ormation adaptée à son contexte spécifique de recherche. Cet article présente une approche de RCI dans le cas d'un environnement mobile, où le contexte spatio-temporel de l'utilisateur et son contexte cognitif, sont à la fois considérés pour lui délivrer de l'information pertinente. Nous proposons de construire des profils situationnels basés sur l'historique de recherche...

Registration Year

  • 2017
    544
  • 2018
    31
  • 2019
    23

Resource Types

  • Text
    598