598 Works

Fusion d'informations pour l'indexation de photos.

Saïd Kharbouche, Michel Plu & Patrick Vannoorenberghe
RÉSUMÉ. Cet article présente une méthode d'indexation de photos appliquée à la reconnaissance de personnes dans des photos personnelles afin de permettre à un utilisateur de les retrouver à partir de requêtes correspondant à des identifiants de personnes. Cette méthode utilise la fusion d'index-FUSINDEX- issus de l'analyse de la photo elle-même et de l'analyse des com- mentaires textuels et oraux qui lui ont été associés. Ces analyses sont effectuées par différents moteurs d'indexations dédiés qui...

Indexation de sous-collections pour l'amélioration de la haute précision.

Joëlson Randriamparany
RESUMÉ : Cet article présente une méthode de recherche d'information basée sur une indexation en deux étapes. L'objectif est de trouver si affiner l'indexation et la recherche sur une sous-collection homogène améliore la qualité de l'information recherchée. Nous évaluons l'intérêt d'une telle approche en termes de précision en utilisant les modèles de recherches okapi BM25 et TF-IDF et les collections TREC-7 et TREC-8 ad hoc. Les résultats montrent que cette méthode améliore significativement les hautes...

Architecture siamoise et embeddings de triplet pour la validation de relations

Jose G. Moreno, Rashedur Rahman, Charlotte Rudnik, Cong Wang & Brigitte Grau
RÉSUMÉ. La reconnaissance qu'une relation existe entre deux entités mentionnées dans un texte joue un rôle vital en extraction d'information (EI). Pour répondre à la nécessité d'annoter ma- nuellement de nombreux exemples, des paradigmes de supervision distante et d'EI non super- visée ont été proposés. Le point crucial dans ces approches est de pouvoir évaluer la validité des relations extraites. Dans cet article, nous proposons une nouvelle architecture neuronale pour modéliser la validation de relations,...

On the use of tolerant graded inclusions in information retrieval.

Patrick Bosc & Olivier Pivert
RÉSUMÉ . Dans cet article, un modèle de recherche d'information fondé sur la théorie des ensembles flous est considéré. Tout d'abord, nous montrons que le mécanisme de recherche dans un tel modèle peut être défini en termes d'inclusion graduelle. Cette approche est fortement liée à la notion de division dans un contexte de bases de données relationnelles. Dans un deuxième temps, nous mettons en évidence plusieurs axes d'extension de l'inclusion graduelle, l'objectif étant de rendre...

Semantic Query Structuring to Enhance Precision of an Information Retrieval System: Application to the Medical Domain.

Mohannad Almasri
RÉSUMÉ. La plupart des systèmes de recherche d'information représentent la requête, et les do- cuments, comme un sac de termes d'indexation sans aucune relation entre eux. Cette représen- tation pose problème pour les spécialistes d'un domaine spécifique comme le domaine médical. Nous proposons une alternative au sac de termes d'indexation, en fonction de la structuration requête sémantique, afin de répondre à ce besoin de précision dans un domaine spécifique. Cette structuration est obtenue en regroupant...

Classification de profils d'utilisateurs en fonction de leurs orientations politiques.

Youssef Meguebli
RÉSUMÉ. Les plateformes d'informations recueillent des commentaires émis par les utilisateurs. Ces commentaires constituent un formidable moyen d'accès aux opinions de ces utilisateurs sur tous les sujets de la vie courante. Il est possible d'utiliser ces commentaires afin d'identifier des tendances dans bon nombre de scénarios. Par exemple, les partis politiques peuvent être intéressés à contrôler leur image. Dans ce papier, nous présentons une technique non super- visée pour classifier des utilisateurs à partir de...

Un modèle de recherche d'information collaborative basé sur l'expertise des utilisateurs.

Laure Soulier, Lynda Tamine & Wahiba Bahsoun
RÉSUMÉ. Dans ce papier, nous nous intéressons à un contexte de recherche d'information col- laborative où les utilisateurs sont caractérisés par différents niveaux d'expertise du sujet de la requête. Nous proposons un modèle d'ordonnancement de documents intégrant les rôles d'ex- pert et de novice tenant compte de la spécificité de chacun des rôles et assignant un document à l'utilisateur le plus à même de le juger en fonction de son niveau d'expertise. Pour cela, les...

Catégorisation libre d’extraits musicaux et analyse automatique

Nicolas Dauban, Paul Albenge, Ludovic Florin, Julien Pinquier, Christine Sénac, Pascal Gaillard & Patrice Guyot
RÉSUMÉ. Cet article décrit le protocole expérimental et les résultats obtenus lors d'une expérience de catégorisation. Cette expérience s'inscrit dans le cadre de travaux de recherche sur la recommandation musicale personnalisée et basée sur le contenu. Durant cette expérience, les volontaires ont dû catégoriser librement des extraits musicaux sélectionnés selon des critères musicologiques. Cette catégorisation est analysée via un dendrogramme représentant la u classification moyenne des participants ». Une analyse automatique des résultats menée a...

Clustering Spectral semi-supervisé avec propagation automatique des contraintes par paires.

Nicolas Voiron, Alexandre Benoit, Andrei Filip, Patrick Lambert & Bogdan Ionescu
RÉSUMÉ. Dans un monde guidé par les données, la classification est un outil essentiel pour ai- der les utilisateurs à appréhender la structure de ces données. Les techniques d'apprentissage supervisé permettent d'obtenir de très bonnes performances lorsque l'on dispose d'une base an- notée, mais un risque de sur-apprentissage existe toujours. Il existe de nombreuses techniques de classification non supervisée qui cherchent à construire la structure des données sans dispo- ser de données d'entraînement. Mais dans...

Un regard statistique sur l'évaluation de performance : L'exemple de CLEF 2005.

Jacques Savoy
RÉSUMÉ . Cette communication évalue et compare l'efficacité du dépistage de l'information de onze modèles à l'aide de quatre collections de documents rédigés dans les langues française, portugaise- brésilienne, hongroise et bulgare. Pour les deux dernières langues, on compare également l'indexation basée sur des mots à celle reposant sur des quadrigrammes (4-grams). En recourant à quatre tests statistiques et deux règles ad hoc, nous analysons les performances obtenues pour savoir si les différences de performance...

Influence de l'hétérogénéité sémantique sur les performances d'un système de RI distribuée.

Thomas Cerqueus, Sylvie Cazalens & Philippe Lamarre
RÉSUMÉ. Nous considérons des systèmes pair-à-pair pour le partage de documents dans lesquels chaque pair utilise une ontologie pour représenter ses documents. Lorsque tous les pairs n'utilisent pas la même ontologie, le système est sémantiquement hétérogène, ce qui constitue à priori un frein à l'inter- opérabilité. Nous proposons un système dont l'organisation générique en couches logicielles sépare les algorithmes dédiés à la diminution de l'hétérogénéité de ceux utilisés pour la recherche d'informa- tion sémantique distribuée....

Apport des services Web dans l'amélioration de l'accès à l'information sur le Web ?

Christian Belbèze & Chantal Soulé-Dupuy
RÉSUMÉ . La difficulté à trouver de l'information sur le Web croît et ceci même pour les plus experts des utilisateurs. Afin de mieux comprendre comment recherchent les internautes, nous avons observé cinq adultes et quatre enfants. Des protocoles d'observation différents, présentant tous deux des recherches imposées et libres, ont été définis pour les enfants et les adultes. Nous avons pu définir un certain nombre de comportements, d'attitudes et de difficultés. Le résultat de ces...

Impact précoce du poids des balises pour la recherche d'information ciblée.

Mathias Géry, Christine Largeron & Franck Thollard
RESUME. Cet article traite de l'intégration des balises XML dans la fonction de pondération des termes, pour la recherche d'information (RI) XML ciblée. Notre modèle permet de considérer un certain type d'information structurelle: les balises qui représentent la structure logique des documents (titre, section, paragraphe, etc.) ainsi que les balises liées à la mise en forme (gras, italique, centré, etc.). Nous prenons en compte l'influence des balises sous forme d'un poids en estimant la probabilité...

Grammatical Inference and Textual Information Extraction.

Alexandre S. Saidi
RÉSUMÉ. L'objectif de l'Extraction de Connaissances Textuelles (ECT) est la recherche de mo- tifs intéressants dans les documents. La plupart des techniques employées dans ce domaine n'utilisent pas la structure linguistique, étant donnée le coût d'une analyse morpho-syntaxique (complète) et l'absence du respect des règles grammaticale (langue naturelle) dans ces textes. Dans ce contexte, l'Inférence Grammaticale peut être utilisée pour extraire la structure d'un texte (ou de ses sous-languages) afin de permettre une recherche informée...

Filtrage collaboratif et intégration de la polarité des jugements.

Luc-Aurélien Gauthier, Benjamin Piwowarski & Patrick Gallinari
RÉSUMÉ. Nous nous intéressons à la recommandation par des systèmes de filtrage collaboratif. Nous proposons de combiner une approche globale basée sur une factorisation matricielle et une approche locale basée sur l'exploitation directe d'un voisinage de l'utilisateur. L'hypothèse explorée dans l'article est que les jugements utilisateurs ont une sémantique et donc une utilité différente suivant qu'ils sont positifs ou négatifs. Nous proposons un modèle qui exploite cette polarité et apprend à pondérer l'influence de ses...

Réseaux de neurones convolutifs de quaternions pour l'identification de thèmes de conversations téléphoniques

Titouan Parcollet, Mohamed Morchid & Georges Linarès
RÉSUMÉ. Les réseaux de neurones convolutifs de quaternions (QCNN) forment un ensemble d’algorithmes particulièrement efficaces pour l’apprentissage et la modélisation des relations internes et externes existantes entre les caractéristiques d’un vecteur de données. Ce travail propose d’évaluer l’efficacité des QCNNs à travers une tâche réaliste d’identification automatique de thèmes contenus dans des conversations téléphoniques, impliquant des agents et des usagers du centre d’appel du service de transport de la ville de Paris (RATP). Il est...

Réseaux de neurones pour la représentation des contextes continus des mots.

Killian Janod, Mohamed Morchid, Richard Dufour & Georges Linarès
RÉSUMÉ. Les méthodes d'apprentissage profond s'appuient de plus en plus sur des représen- tations vectorielles continues des mots. Ces méthodes, déjà appliquées avec succès dans de nombreuses tâches de traitement automatique du langage naturel écrit et oral, sont capables de représenter des mots ainsi que les relations les liant. De manière générale, ces méthodes utilisent des représentations par "sac-de-mots" et traitent donc tous les mots d'un contexte de façon égale. Cet article propose une méthode...

Extraction de formules chimiques dans des documents manuscrits composites.

Nabil Ghanmi & Abdel Belaïd
RÉSUMÉ. Nous abordons dans ces travaux, le problème de la segmentation de documents de cahiers de la chimie en zones homogènes. Les documents à traiter sont manuscrits sans contraintes composés de zones de textes, de tableaux et de graphiques, représentant l'expres- sion graphique de l'expérience réalisée. L'objectif de ce premier travail est d'extraire, dans chaque document, le bloc contenant le schéma graphique. Nous proposons une méthode d'ex- traction et de classification des structures élémentaires du...

Browsing Information Retrieval System Results

Tamer Abdulghani, Mahmoud Al Najar, Rayhane Belaroussi, Josiane Mothe, Mikhail Ryzhov & Sarune Samoskaite
RÉSUMÉ. L'évaluation en recherche d'information (RI) est fondamentale. Depuis les années 70, les chercheurs utilisent un cadre d'évaluation du type de celui proposé dans les projets Cranfield ou TREC pour calculer l'efficacité du système sur des collections de référence. Alors que les résultats numériques sont une pratique courante de comparaison de systèmes, nous pensons que les comparaisons visuelles pourraient aussi être utiles aux chercheurs. À cette fin, nous avons développé une interface qui permet aux...

Estimation du paramètre de collection des modèles d'information pour la RI.

Parantapa Goswami & Éric Gaussier
RÉSUMÉ. Nous explorons dans cet article plusieurs méthodes permettant, a priori, d'estimer le paramètre de collection des modèles d'information. Jusqu'à présent, ce paramètre a était fixé au nombre moyen de documents dans lesquels un mot donné apparaissait. Nous présentons ici plusieurs méthodes d'estimation de ce paramètre et montrons qu'il est possible d'améliorer les performances du système de recherche d'information lorsque ce paramètre est estimé de façon adéquate.

Association d'un détecteur de visages et d'un détecteur d'entités nommées pour l'annotation automatique d'images.

Pierre Tirilly, Emmanuelle Martienne, Vincent Claveau & Patrick Gros
RÉSUMÉ. Dans cet article, nous proposons une méthode d'annotation d'images de visages dans un grand corpus réel de documents texte-images. Cette méthode s'appuie sur l'utilisation conjointe d'un détecteur de visages et d'un détecteur d'entités nommées : les images contenant des visages sont annotées par les entités nommées les plus fréquentes dans le texte accompa- gnant les images. Bien que basique, cette méthode donne de bons résultats. Elle constitue un premier pas vers des méthodes d'indexation...

Alignement des ontologies : Utilisation de WordNet et une nouvelle mesure structurelle.

Fellah Aissa
RÉSUMÉ. L'interopérabilité sémantique entre sources d'information hétérogènes est une problématique importante du fait du nombre croissant de sources d'information disponibles sur le web. L'utilisation des ontologies est une voie très prometteuse pour permettre l'interopérabilité, seulement les ontologies eux même peuvent être hétérogènes. L'alignement des ontologies est le noyau de cette interopérabilité, cependant la génération automatique des correspondances entre deux ontologies est d'une extrême difficulté qui est dû aux divergences (conceptuelle, habitudes, etc.) entre communautés différentes...

Détection de locuteurs dans les séries TV.

Xavier Bost & Georges Linarès
RÉSUMÉ. La segmentation de flux audio en locuteurs apparaît particulièrement délicate lors- qu'elle est appliquée à des films de fiction, où de nombreux personnages parlent dans des conditions acoustiques variables (musique de fond, bruitages, fluctuations dans l'intonation...). Au-delà d'une telle variabilité acoustique, ce type de films exhibe cependant de la régularité sur le plan visuel, particulièrement dans les passages dialogués. Nous introduisons dans ce papier une méthode en deux temps pour procéder à la segmentation...

Registration Year

  • 2017
    544
  • 2018
    31
  • 2019
    23

Resource Types

  • Text
    598