619 Works

Détection d’influenceurs dans des médias sociaux

Kévin Deturck
RÉSUMÉ Les influenceurs ont la capacité d'avoir un impact sur d'autres individus lorsqu'ils interagissent avec eux. Détecter les influenceurs permet d'identifier les quelques individus à cibler pour toucher largement un réseau. Il est possible d'analyser les interactions dans un média social du point de vue de leur structure ou de leur contenu. Dans nos travaux de thèse, nous abordons ces deux aspects. Nous présentons d'abord une évaluation de différentes mesures de centralité sur la structure...

Extraction d’interactions entre aliment et médicament : Etat de l’art et premiers résultats

Tsanta Randriatsitohaina
RÉSUMÉ Dans cet article, nous nous intéressons à l'extraction des interactions entre médicaments et aliments, une tâche qui s'apparente à l'extraction de relations entre termes dans les textes de spécialité. De nombreuses approches ont été proposées pour extraire des relations à partir de textes : des patrons lexico-syntaxiques, de la classification supervisée, et plus récemment de l'apprentissage profond. A partir de cet état de l'art, nous présentons une méthode basée sur un apprentissage supervisé et...

Impact de la présence/absence des termes de la requête dans le document sur le processus d’appariement document-requête en utilisant Word2Vec

Thiziri Belkacem, Taoufiq Dkaki, José G. Moreno & Mohand Boughanem
RÉSUMÉ. Dans cet article, nous étudions l'appariement document-requête basé sur des similarités sémantiques entre les termes de la requête et ceux du document, à l'aide du plongement lexical des mots (word embedding). Contrairement aux approches traditionnelles qui sont basées sur les représentations dites sac de mots et qui reposent sur l'appariement exact entre les mots, le processus d'appariement pourrait être amélioré en tenant compte de tous les mots du document et en traitant différemment les...

Catégorisation libre d’extraits musicaux et analyse automatique

Nicolas Dauban, Paul Albenge, Ludovic Florin, Julien Pinquier, Christine Sénac, Pascal Gaillard & Patrice Guyot
RÉSUMÉ. Cet article décrit le protocole expérimental et les résultats obtenus lors d'une expérience de catégorisation. Cette expérience s'inscrit dans le cadre de travaux de recherche sur la recommandation musicale personnalisée et basée sur le contenu. Durant cette expérience, les volontaires ont dû catégoriser librement des extraits musicaux sélectionnés selon des critères musicologiques. Cette catégorisation est analysée via un dendrogramme représentant la u classification moyenne des participants ». Une analyse automatique des résultats menée a...

État de l'art du changement sémantique à partir de plongements contextualisés

Syrielle Montariol, Alexandre Allauzen & Antoine Doucet
Les changements lexico-sémantiques --- des variations temporelles dans l'usage et la signification des mots --- reflètent l'évolution de divers aspects de la société tels que l'environnement technologique et culturel. Détecter et comprendre ces changements est utile, par exemple, en lexicographie et en sociolinguistique. Ce domaine détude a rapidement évolué avec l'essor de la sémantique distributionnelle et a connu un élan dintérêt au cours des dernières années, avec lusage des plongements neuronaux. Plus récemment, les modèles...

État de l'art des approches de modélisation et de simulation utilisateur pour la recherche d'information conversationnelle

Pierre Erbacher and Laure Soulier
La recherche d'information conversationnelle (RIC) est un domaine à la croisée de la RI interactive et des systèmes de dialogue pour des besoins en information sur des domaines ouverts. Afin d'optimiser les interactions entre système et utilisateur et améliorer au mieux l'expérience utilisateur, il est nécessaire d'améliorer les modèles d'interactions en RI par la prise en compte séquentielle des actions hétérogènes. L'apprentissage par renforcement s'est imposé comme un paradigme particulièrement adapté pour optimiser les prises...

Vers un système de recommandation de profils experts dans l'industrie des procédés

Yann Duperis, Adrian-Gabriel Chifu, Bernard Espinasse, Sébastien Fournier & Arthur Kuehn
La dématérialisation des processus de recrutement na pas fait disparaître toutes les frictions inhérentes à cette activité. La recherche automatisée dun candidat idéal se heurte toujours à la difficulté à modéliser correctement les besoins exprimés en langage naturel dans une offre d'emploi. Le recrutement d'experts, notamment, est particulièrement difficile. En effet, ces profils concernent une proportion réduite des recrutements et leur prise en charge informatisée nécessite une connaissance précise du secteur d'activité concerné. Dans cet...

Modelling document-query interaction in a hierarchical neural model for IR

Johan Chagnon, Diana Popa, Yagmur Gizem Cinar & Eric Gaussier
Recent deep approaches to information retrieval are either representation-oriented or interaction-oriented, depending on how they view the modelling of document and query representations and their interactions. We explore a hierarchical approach to document encoding that enables modelling the query-document interaction at different levels of granularity. The proposed model splits the input documents into blocks that are individually matched to a given query through a series of self-attention modules, along with pooling and projection layers. We...

RFreeStem un raciniseur pour le Malgache

Andonirina Andriamihasinoro, Oihana Coustie, Josiane Mothe & Olivier Teste
La racinisation est une étape dans le pré-traitement des textes qui regroupe des mots qui sont morphologiquement différents mais sémantiquement similaires, et qui donc, utilisés dans une requête, devraient correspondre à des résultats d'un moteur de recherche similaires voire identiques. Pour de nombreuses langues, les raciniseurs sont à base de règles. Pour des langues non outillées, le problème de racinisation demeure non résolu. C'est le cas du malgache. Cet article analyse l'efficacité d'un raciniseur, RFeeStem,...

Analyse de sentiments dans les textes économiques : un exemple d'application chez ReportLinker

Marilyne Latour
Cet article présente un retour dexpérience mené dans un cadre industriel sur de l'analyse de sentiments. Lexpérience consiste à traiter des données non structurées à partir de dépêches d'actualité en économie afin d'extraire la tonalité des phrases (positives et négatives principalement). Nous présentons ici la méthode utilisée au sein de notre moteur de recherche, ReportLinker. Il s'agit d'une méthode hybride ; basée sur de la linguistique (Lexicons) et de la statistique (modèle de régression logistique)....

Extraction des liens d'articles à partir de la une des journaux en ligne

Romain Perrone, Cédric Boscher, Nada Lasri & Elöd Egyed-Zsigmond
La détection automatisée des liens d'articles dans la une des journaux en ligne est un sujet très peu étudié, bien qu'il s'agisse d'une étape clé pour extraire des informations à partir d'un journal. Dans cette étude, nous présentons une nouvelle approche permettant de détecter efficacement les liens des articles présents sur un large éventail de pages web de journaux. Notre méthode détecte les liens présents sur une page web et élimine les liens non pertinents...

Exploration de l'apport de l'analyse des perceptions oculaires : étude préliminaire pour le bouclage de pertinence

Lucas Albarede, Francis Jambon & Philippe Mulhem
RÉSUMÉ. Nos travaux visent à évaluer l’impact potentiel de l’utilisation des perceptions oculaires vis-à-vis du mécanisme de bouclage de pertinence d’un moteur de recherche d’information. Nous nous sommes intéressés aux situations écologiques où l’utilisateur évalue la pertinence des résultats d’une requête via les snippets affichées sur la page des résultats. Notre hypothèse est que la connaissance des termes lus par un utilisateur sur cette page de résultats peut être utilisée pour améliorer le mécanisme de...

Detecting new word meanings: a comparison of word embedding models in Spanish

Andrés Torres Rivera & Juan-Manuel Torres-Moreno
RÉSUMÉ. Les néologismes sémantiques (NS) sont définis comme des mots qui acquièrent une nou- velle signification tout en maintenant leur forme. Compte tenu de la nature de ce type de néolo- gisme, la tâche d'identifier ces nouveaux sens des mots est actuellement effectuée manuellement par des spécialistes des observatoires de néologie. Pour détecter les NS de manière semi- automatique, nous avons développé un système mettant en uvre une combinaison des stratégies suivantes: modélisation de sujets,...

CLEF MC2 Lab: Évaluation, Résultats, et Perspectives

Malek Hajjem, Jean Valère Cossu, Chiraz Latiri & Eric SanJuan
RÉSUMÉ. Le Lab MC21 2018 est une tâche de recherche d’information (RI) au sein de la campagne d’évaluation CLEF. L’objectif de cette tâche est de développer des méthodes et ressources textuelles pour l’analyse des médias sociaux autour d’évènements culturels. Cet atelier de recherche se focalise sur le corpus de microblogs "GAFES"2 comme principale ressource. En exploitant ces données pendant trois ans, les organisateurs ont pu proposer au fil de temps des sous-tâches aux perspectives diverses....

Expansion de requêtes à base de motifs et de Word Embeddings pour améliorer la recherche de microblogs

Meryem Bendella & Mohamed Quafafou
RÉSUMÉ. Les services sociaux de microblogging jouent un rôle important dans notre société. Twitter est l'une des plateformes de microblogging les plus populaires, utilisées par les in- ternautes pour trouver des informations pertinentes (sujets d'actualité, tendances populaires, informations sur certains internautes, etc.). Dans ce contexte, la recherche d'information pro- venant de telles données a récemment gagné un intérêt majeur et ouvert de nouveaux défis. Cependant, la taille de ces données ainsi que des requêtes est...

Influence des lexiques d’émotions et de sentiments sur l’analyse des sentiments

Soëlie Lerch, Patrice Bellot, Elisabeth Murisasco & Emmanuel Bruno
RÉSUMÉ. Les consommateurs ont l'habitude de consulter les critiques postées sur internet avant d'acheter un produit. Mais, il est difficile pour le consommateur de connaître l'opinion globale du produit vu le nombre important de ces critiques. L'analyse des sentiments permet de détecter la polarité (positive, négative ou neutre) sur une opinion exprimée et donc de classer ces critiques. Notre but est de déterminer l'influence de l'expression des émotions sur l'analyse de la polarité des critiques...

Architecture basée sur les mécanismes d'attention: le cas de la génération de questions neuronales

Thomas Scialom, Benjamin Piwowarski & Jacopo Staiano
RÉSUMÉ. Les architectures neuronales basées sur l'attention, telles que le Transformer, ont ré- cemment suscité l'intérêt de la communauté scientifique et ont permis d'obtenir des progrès im- portants par rapport à l'état de l'art dans plusieurs domaines. L'adaptation des Transformers à la tâche de la génération de questions n'est pas simple car les données sont ici relativement peu volumineuses. Nous explorons, par conséquent, comment un Transformer peut être adapté et, en particulier, étudions l'effet des...

Exploitation de syntagmes dans la découverte de thèmes

Amaury Delamaire, Michel Beigbeder & Mihaela Juganaru-Mathieu
RÉSUMÉ. Le but de cet article est d'étudier l'apport des syntagmes nominaux, verbaux et ad- jectivaux pour la découverte de thèmes ( topic modeling). Nous testons l'hypothèse qu'ajouter des syntagmes à la représentation des documents-- pour lesquels ne sont traditionnellement considérés que les mots simples-- permettrait d'améliorer la qualité d'un modèle de thèmes, en l'occurrence LDA. Des différences significatives sont attendues notamment lorsque plusieurs thèmes partagent le même vocabulaire. Nous présentons des résultats sur un...

Registration Year

  • 2021
    21
  • 2019
    23
  • 2018
    31
  • 2017
    544

Resource Types

  • Text
    597
  • Conference Paper
    21
  • Conference Proceeding
    1