598 Works

Résumé automatique guidé de textes: État de l’art et perspectives

Salima Lamsiyah, Said Ouatik El Alaoui & Bernard Espinasse
RÉSUMÉ Les systèmes de résumé automatique de textes (SRAT) consistent à produire une représentation condensée et pertinente à partir d'un ou de plusieurs documents textuels. La majorité des SRAT sont basés sur des approches extractives. La tendance actuelle consiste à s'orienter vers les approches abstractives. Dans ce contexte, le résumé guidé défini par la campagne d'évaluation internationale TAC (Text Analysis Conference) en 2010, vise à encourager la recherche sur ce type d'approche, en se basant...

Routage sémantique des requêtes dans les systèmes pair-à-pair.

Taoufik Yeferny, Khedija Arour & Yahya Slimani
RÉSUMÉ. Les systèmes pair-à-pair (P2P) se sont imposés ces dernières années comme la technologie majeure d'accès à différentes ressources sur Internet. De nombreuses recherche concer- nant la sélection des meilleurs pairs contenant les données appropriées à une requête,ont émergé et constituent un axe de recherche très actif. L'efficacité de la recherche dans ces systèmes, et surtout le cas non structuré, peut être améliorée en introduisant de la sémantique dans le processus de routage des requêtes....

Semantic Query Structuring to Enhance Precision of an Information Retrieval System: Application to the Medical Domain.

Mohannad Almasri
RÉSUMÉ. La plupart des systèmes de recherche d'information représentent la requête, et les do- cuments, comme un sac de termes d'indexation sans aucune relation entre eux. Cette représen- tation pose problème pour les spécialistes d'un domaine spécifique comme le domaine médical. Nous proposons une alternative au sac de termes d'indexation, en fonction de la structuration requête sémantique, afin de répondre à ce besoin de précision dans un domaine spécifique. Cette structuration est obtenue en regroupant...

Solving Concept mismatch through Bayesian Framework by Extending UMLS Meta-Thesaurus.

Karam Abdulahhad, Jean-Pierre Chevallet & Catherine Berrut
RÉSUMÉ. La plupart des systèmes de Recherche d'Information sont basés sur la correspondance exacte entre termes, même si de nombreuses recherches portent sur le problème de la corres- pondance entre variantes de termes issus de mots synonymes, d'une formulation multilingue, ou sur l'utilisation de termes experts très précis. Résoudre ces problèmes nécessite une analyse particulière pour combler l'écart entre l'information contenue dans les documents et le besoin de l'utilisateur. Dans ce travail, nous proposons une...

Mise en œuvre d’une base de données graphe pour l’analyse des logs de requêtes en recherche d’information.

Josiane Mothe & Sagun Pai
RÉSUMÉ. Les travaux présentés dans cet article concernent la mise en oeuvre d'une base de données orientée graphe pour l'étude des reformulations de requêtes réalisées par les utilisa- teurs d'un moteur de recherche. Notre objectif est de rechercher des patrons de reformulation à des fins d'analyse linguistique. Nous nous sommes appuyés sur un log de connexion issu d'un moteur de recherche associé à la librairie digitale Revue.org. Après avoir extrait les sessions de recherche, nous...

Recherche d'information dans les systémes P2P hétérogènes.

Thomas Cerqueus
RÉSUMÉ. Nous considérons la recherche d'information sémantique dans les systèmes pair-à- pair. Ces derniers semblent être une solution intéressante pour le partage de données car ils garantissent le passage à l'échelle, et gère la dynamicité. Dans ce contexte, il est difficilement imaginable que tous les participants s'accordent sur l'utilisation d'une même représentation sémantique (schéma, ontologie, graphe conceptuel). Dans ce cas, le système est sémantique- ment hétérogène. Cette situation limite l'interopérabilité entre participants. Dans cet article...

Poursuite de cibles dans l'espace de recommandation - vers un nouveau système de recommandation basé sur le filtrage de Kalman.

Cédric Bernier, Samuel Nowakowski & Anne Boyer
RÉSUMÉ . Dans cet article, nous proposons une nouvelle approche de système de recommandation basée sur la poursuite de cible à l'aide des filtres de Kalman. Nous supposons que les utilisateurs et leurs consommations de télévision (films, séries, émissions, etc.) sont représentés par des vecteurs dans l'espace multidimensionnel des genres des contenus (action, aventure, divertissement, etc.). Connaissant cet espace, nous proposons un algorithme basé sur les filtres de Kalman pour poursuivre le profil de l'utilisateur...

DefAcro : mesure de qualité pour le choix de la définition des acronymes ambigus.

Mathieu Roche & Violaine Prince
RÉSUMÉ. Cet article présente un ensemble de mesures de qualité pour déterminer le choix de la meilleure définition pour un acronyme non défini dans la page Web le contenant. L'approche contextuelle que nous proposons utilise des statistiques calculées à partir de pages Web pour déterminer la définition appropriée. Les premiers résultats sont très satisfaisants car la défini- tion pertinente des acronymes est trouvée dans 92 à 98% des cas.

Identification de documents par classification monoclasse.

Nicolas Sidere, Jean-Yves Ramel, Sabine Barrat, Vincent Poulain D'Andecy & Saddok Kebairi
RÉSUMÉ. Utilisée dans un contexte industriel, la classification d'images de documents néces- site le respect de certaines contraintes; par exemple, être confronté à une grande variabilité des documents et/ou du nombre de classes. Dans cet article, nous répondons à ce problème en présentant une nouvelle approche basée sur la spécialisation du vecteur de caractéristiques et d'un classificateur pour chaque classe, contrairement à la majorité des méthodes qui traitent l'ensemble des classes. Cette approche permet alors...

RI dans les microblogs : que manque-t-il aux approches classiques ?

Firas Damak
RÉSUMÉ. Nous nous intéressons dans cet article à la recherche d'information dans les microblogs. Les modèles de RI classiques, conçus pour des textes plus longs que les 140 caractères d'un microblog, ne sont pas forcément adaptés pour ces derniers. Une analyse de leurs résultats nous a permis d'identifier la différence de vocabulaire entre les microblogs et la requête comme étant la raison principale de leur manque de performance. Pour améliorer la qualité de la recherche,...

Fusion de ressources hétérogènes pour la recherche d'information multilingue.

Frédérik Cailliau, Aude Giraudel & Céline Poudat
RÉSUMÉ . Afin d'améliorer la recherche multilingue dans le moteur de recherche Sinequa Engine, nous avons intégré les connaissances multilingues du service Sensagent au module de requêtes du moteur de recherche Sinequa Engine. L'interface développée propose une extension de la requête aux choix de l'utilisateur par traduction des différents mots dans les langues sélectionnées. Pour limiter le grand nombre de traductions que peut engendrer une requête complexe, nous avons déployé un filtrage sémantique par calcul...

Classification dynamique par treillis de concepts pour la recherche d'information sur le web.

Emmanuel Nauer & Yannick Toussaint
RÉSUMÉ. L'analyse de concepts formels (ACF) permet d'organiser des objets en fonction de leurs propriétés. Des travaux récents ont utilisé l'ACF pour réorganiser, sous la forme d'un treillis de concepts, les réponses fournies par un moteur de recherche du web. L'utilisateur na- vigue dans le treillis pour explorer un résultat structuré et synthétique. Or, un tel treillis contient des concepts qui sont pertinents par rapport à une tâche de recherche d'information donnée et d'autres qui...

Sélection adaptative de Services de Recherche d'Information web par l'analyse du besoin et du comportement de l'utilisateur.

Aurélien Saint-Réquier
RÉSUMÉ. Dans le cadre de travaux de recherche sur la modélisation du besoin et du comporte- ment de l'utilisateur, nous décrivons une approche de sélection de Services de Recherche d'In- formation (SRI) web adaptés au besoin de l'utilisateur. Un système expérimental intégrant une modélisation de l'utilisateur par un profil représentant ses centres d'intérêt, une modélisation du comportement par un mécanisme de récupération des interactions utilisateurs et une base de SRI généralistes et verticaux, est présenté....

Recherche d'informations dans la blogosphère : Défis et premières évaluations.

Claire Fautsch & Jacques Savoy
RESUME . Recourant au modèle vectoriel tf idf, ainsi qu'à trois approches probabilistes et un modèle de langue, cet article évalue leur performance sur un corpus TREC extrait de la blogosphère et comprenant 100 requêtes. Basé sur deux mesures de performance, nous démontrons que l'absence d'enracineur s'avère plus efficace que d'autres approches (enracineur léger ou celui de Porter).

Expansion sélective de requêtes par apprentissage.

Adrian-Gabriel Chifu & Josiane Mothe
RÉSUMÉ. Si l'expansion de requête automatique améliore en moyenne la qualité de recherche, elle peut la dégrader pour certaines requêtes. Ainsi, certains travaux s'intéressent à développer des approches sélectives qui choisissent la fonction de recherche ou d'expansion en fonction des requêtes. La plupart des approches sélectives utilisent un processus d'apprentissage sur des caractéristiques de requêtes passées et sur les performances obtenues. Cet article présente une nouvelle méthode d'expansion sélective qui se base sur des prédicteurs...

Classification multi-label à grande dimension pour la détection de concepts médicaux

Nomena Ny Hoavy, Mamitiana Ignace Randrianarivony & Josiane Mothe
RÉSUMÉ Dans ce papier, nous présentons une méthode pour associer de façon automatique des concepts à des images. Nous nous focalisons plus particulièrement sur des images médicales à annoter avec des concepts UMLS. Nous avons développé deux modèles de transfert d'apprentissage à partir des réseaux CNN VGG19 et ResNet50 . Nous avons utilisé des modèles avec des techniques simples et que nous avons optimisés pour l'apprentissage. Les résultats que nous avons obtenus en utilisant les...

La reformulation hybride des requêtes exploratoires à l'aide de concepts explicites et implicites.

Bissan Audeh, Philippe Beaune & Michel Beigbeder
RÉSUMÉ. Les requêtes exploratoires du Web sont souvent courtes et ambigües. De plus, l'utilisation des entités nommées dans ce type de requêtes est fréquente. Dans cet article, nous explorons l'expansion des requêtes exploratoires par l'ajout de termes appartenant aux concepts de la requête. Nous distinguons deux types de concepts : explicites, correspondants aux enti- tés nommées ayants des références aux concepts de l'ontologie YAGO, et implicites que nous trouvons à l'aide de l'approche LSI (Indexation...

Corpus-Based vs. Model-Based Selection of Relevant Features.

Cyril Goutte, Pavel B. Dobrokhotov, Éric Gaussier & Anne-Lise Veuthey
RESUME. Le travail que nous présentons ici a pour but la comparaison de méthodes de sélection d’attributs. Plus précisément, nous nous intéressons à deux grandes approches, celles fondées uniquement sur les données, approche classique qui permet de ne se reposer, pour la construction de modèles de catégorisation, que sur un ensemble restreint, mais pertinent, d’attributs, et celles qui découlent d’un modèle appris. Ces dernières permettent d’expliquer les décisions prises par un modèle, et fournissent aux...

Association d'un détecteur de visages et d'un détecteur d'entités nommées pour l'annotation automatique d'images.

Pierre Tirilly, Emmanuelle Martienne, Vincent Claveau & Patrick Gros
RÉSUMÉ. Dans cet article, nous proposons une méthode d'annotation d'images de visages dans un grand corpus réel de documents texte-images. Cette méthode s'appuie sur l'utilisation conjointe d'un détecteur de visages et d'un détecteur d'entités nommées : les images contenant des visages sont annotées par les entités nommées les plus fréquentes dans le texte accompa- gnant les images. Bien que basique, cette méthode donne de bons résultats. Elle constitue un premier pas vers des méthodes d'indexation...

Évaluation de la robustesse des descripteurs de texture pour la segmentation des images de documents anciens.

Maroua Mehri, Van Cuong Kieu, Mohamed Mhiri, Pierre Héroux, Petra Gomez-Krämer, Mohamed Ali Mahjoub & Rémy Mullot
RESUME. Dans la littérature, le choix d’utiliser des descripteurs de texture pour guider la segmentation d’images de documents anciens soumises à des dégradations importantes et variées s’est déjà révélé pertinent. Par ailleurs, il a également été démontré que l’usage de tels descripteurs permet de se dispenser de connaissances préalables sur le modèle du document ou des param` etres typographiques. Nous proposons de rechercher des régions homogènes du point de vue des descripteurs de texture en...

Modèle de langue visuel pour la reconnaissance de scènes.

Trong-Ton Pham, Loïc Maisonnasse, Philippe Mulhem & Éric Gaussier
RÉSUMÉ. Dans cet article, nous décrivons une méthode pour utiliser un modèle de langue sur des graphes pour la recherche et la catégorisation d'images. Nous utilisons des régions d'images (associées automatiquement à des concepts visuels), ainsi que des relations spatiales entre ces régions, lors de la construction de la représentation sous forme de graphe des images. Notre méthode gère différents scénarios, selon que des images isolées ou groupées soient utilisés comme base d'apprentissage ou de...

La prédiction efficace de la difficulté des requêtes : une tâche impossible?

Adrian-Gabriel Chifu, Léa Laporte & Josiane Mothe
RÉSUMÉ. Les moteurs de recherche d’information (RI) retrouvent des réponses quelle que soit la requête, mais certaines requêtes sont difficiles (le système n’obtient pas de bonne performance en termes de mesure de RI). Pour les requêtes difficiles, des traitements adhoc doivent être appliqués. Prédire qu’une requête est difficile est donc crucial et différents prédicteurs ont été proposés. Dans cet articlenous étudions la variété de l’information captée par les prédicteurs existants et donc leur non redondance....

Spatio-Temporal Modeling for Knowledge Discovery in Satellite Image Databases.

Wadii Boulila, Imed Riadh Farah, Karim Saheb Ettabaâ, Basel Solaiman & Henda Ben Ghézala
RÉSUMÉ. L'extraction automatique des connaissances à partir des images satellitaires dans un contexte spatio-temporel est un défit majeur pour le domaine de la télédétection. Dans ce contexte, nous présentons une approche haut-niveau pour la modélisation des connaissances spatio-temporelles à partir des images satellitaires. Nous proposons, aussi, d'utiliser une seg- mentation multi-approche comportant plusieurs méthodes de segmentation pour améliorer la modélisation et l'interprétation des images. Les expérimentations montrent que les résultats de la segmentation issues de...

Prédiction de la polysémie pour un terme biomédical.

Juan Antonio Lossio Ventura, Clement Jonquet, Mathieu Roche & Maguelonne Teisseire
RÉSUMÉ. La polysémie est la caractéristique d'un terme à avoir plusieurs significations. La prédiction de la polysémie est une première étape pour l'Induction de Sens (IS), qui permet de trouver des significations différentes pour un terme, ainsi que pour les systèmes d'extraction d'information. En outre, la détection de la polysémie est importante pour la construction et l'en- richissement de terminologies et d'ontologies. Dans cet article, nous présentons une nouvelle approche pour prédire si un terme...

Registration Year

  • 2017
    544
  • 2018
    31
  • 2019
    23

Resource Types

  • Text
    598