598 Works

Impact de la reconnaissance de l'écriture en-ligne sur une tâche de catégorisation.

Sebastián Peña Saldarriaga, Emmanuel Morin & Christian Viard-Gaudin
RÉSUMÉ. Cet article s'intéresse à la problématique de la catégorisation automatique de docu- ments manuscrits en-ligne et plus particulièrement à l'impact de la reconnaissance de l'écriture dans un processus de catégorisation utilisant des méthodes d'apprentissage automatique. Nous comparons les performances obtenues avec des documents issus d'un système de recon- naissance de l'écriture en-ligne et leur version originale électronique. Les résultats montrent qu'aucune perte significative des performances n'est à signaler lorsque 78 % des termes d'in-...

Apprentissage de classification des requêtes basée sur la confiance et la couverture.

Hajer Ayadi, Mouna Torjmen Khemakhem, Mariam Daoud, Jimmy Xiangji Huang & Maher Ben Jemaa
RÉSUMÉ. Les requêtes médicales sont souvent étiquetées par le type du modèle de recherche estimé donnant les meilleures performances selon des experts du domaine. Dans un travail pré- cédent, nous avons proposé d'automatiser cette tâche d'étiquetage (de classification) manuelle. Dans ce papier, nous proposons une nouvelle approche de classification qui apprend automati- quement à associer à chaque requête l'étiquette du modèle de recherche le plus adéquat. Plus précisément, nous générons un ensemble de règles d'association...

La recherche d'information évolutive dans des documents de type encyclopédique : l'apport de techniques linguistiques.

Marion Laignelet
RÉSUMÉ. Dans cet article nous présentons la notion d'information évolutive : le développement de ce concept s'inscrit dans le cadre d'un projet de recherche industriel visant la recherche automatique de segments textuels nécessitant une mise à jour de l'information dans un but éditorial. Pour répondre à cet objectif nous faisons l'hypothèse de la nécessité d'associer des techniques issues de la recherche d'information à des techniques linguistiques.

Exploitation des connaissances d'UMLS pour la recherche d'information médicale. Vers un modèle bayésien d'indexation.

Diem Thi Hoang Le
RÉSUMÉ. La recherche d'information à base de connaissances est largement étudiée, mais avec peu de succès. Dans cet article, nous étudions l'impact de l'exploration d'une base de connais- sance, nommée méta thésaurus UMLS pour la recherche d'information médicale. D'abord, l'in- dexation par concepts d'UMLS extrait dans des textes ne montre qu'une légère amélioration de MAP(Mean Average Precision) par rapport à l'indexation par termes. Nous intégrons ensuite les étiquettes sémantiques des concepts dans une indexation multicouche...

Plateforme d'étiquetage dynamique pour la fouille d'opinion.

Coralie Reutenauer & Tanguy Urvoy
RÉSUMÉ. Les plateformes sociales (Twitter, blogs, forums), vecteurs de la diversité des points de vue de la collectivité, constituent un vivier de données convoité pour la fouille d'opinion et l'analyse de sentiments. Dans ce cadre, les méthodes appliquées en classification n'apprennent souvent que des sorties relativement frustes : celles-ci se réduisent à une polarité ou à une gradation linéaire. Est-il possible d'apprendre des motifs plus riches avec un nombre raison- nable d'exemples ? Notre démarche...

Indexation et représentation comparative : application au discours électoral.

Jacques Savoy
RESUME . Cet article décrit quelques approches afin d'extraire les termes les plus représentatifs d'un site web ou d'un ensemble de documents en comparaison avec d'autres sites ou un corpus de référence. Nous montrons que la fréquence d'occurrence ou le rang des termes les plus fréquents peut fournir une première synthèse. Notre proposition s'appuie sur une distribution binomiale des mots et le calcul d'un score normalisé (score Z) mettant en lumière les termes comparativement les...

Indexation spatiale et temporelle basée sur un principe de "tuilage" : contribution à la recherche d'information géographique dans des documents textuels faiblement structurés.

Christian Sallaberry, Damien Palacio & Mauro Gaio
RÉSUMÉ. La plupart des moteurs de recherche nécessitent, pour fonctionner, une indexation préalable des documents. Certaines de ces approches sont limitées compte tenu de contextes particuliers ou de la forme particulière de l'information recherchée. Notre contribution porte sur la construction d'index adaptés à la facette spatiale et temporelle spécifique au contexte de l'information géographique tout en permettant une compatibilité avec les outils de recherche génériques. Ce travail présente une stratégie générique d'indexation basée sur le...

Un modèle de bibliothèque numérique collaborative - ARMARIUS.

Reim Doumat, Elöd Egyed-Zsigmond & Jean-Marie Pinon
RÉSUMÉ. Les manuscrits anciens numérisés représentent un contenu spécifique pour les bibliothèques numériques. Les utilisateurs travaillant sur ce type de documents ont besoin de systèmes d'assistance et d'espaces de travail collectif pour interpréter, annoter et transcrire ces manuscrits. Dans cet article, nous présenterons un modèle de bibliothèque numérique spécialement conçu pour des manuscrits anciens numérisés : Armarius. Celui-ci fournit des interfaces d'annotation manuelle et semi-automatique. Il propose également un système d'assistance pour aider l'utilisateur à...

Tied Spatial Transformer Networks for Character Recognition.

Bogdan-Ionut Cirstea & Laurence Likforman-Sulem
RÉSUMÉ. Cet article présente une nouvelle approche appliquée aux réseaux de neurones convolutionnels (RNC), qui utilise les réseaux de transformations spatiales (RTS). L’approche consiste à construire une architecture combinant un RNC pour la localisation et un RNC pour la classification. Bien que les deux réseaux soient dédiés à des taches différentes, la majorité de leurs poids sont partagées. Par la suite nous appelons ce type de réseaux réseaux de transformations spatiales liées ou RTSL. Le...

Approche hybride de segmentation de page à base d'un descripteur de traits.

Mehdi Felhi, Salvatore Tabbone & Maria V. Ortiz Segovia
RÉSUMÉ. Dans cet article, nous présentons une nouvelle approche hybride pour la segmenta- tion de pages basée sur les composantes connexes et sur l'analyse de régions. Nous décrivons d'abord notre descripteur de traits qui permet de détecter les candidats de texte et des lignes par la squelettisation de l'image du document binarisée. Ensuite, un modèle de contours actifs est appliqué pour segmenter le reste de l'image en photos et arrière plan. Cette classification est vérifiée...

Recherche d'information flexible basée CP-nets.

Fatiha Boubekeur & Lynda Tamine-Lechani
RÉSUMÉ . Ce papier décrit une approche de recherche d'information (RI) flexible fondée sur l'utilisation des CP-Nets (Conditional Preferences Networks). Le formalisme CP-Net est utilisé d'une part, pour la représentation graphique de requêtes flexibles exprimant des préférences qualitatives et d'autre part pour l'évaluation flexible de la pertinence des documents. Le raisonnement et l'inférence sur les préférences qualitatives n'étant pas aisés, nous devons quantifier les préférences. Nous proposons alors une approche de pondération automatique des requêtes...

Dynamiques des popularités dans YouTube.

Cédric Richier, Georges Linarès, Rachid El Azouzi, Tania Jiménez, Eitan Altman & Yonathan Portilla
RÉSUMÉ. Cet article est une étude de l’évolution du nombre de vues des contenus dans You- Tube. Nous proposons dans un premier temps plusieurs modèles inspirés de l’économie et de la biologie pour caractériser les courbes d’évolution des nombres de vues des vidéos. Dans un deuxième temps, nous proposons une méthode automatique de classification de ces courbes en les associant à l’un des différents modèles suggérés. Nous montrons, sur un large ensemble de données, que...

RI sociale : intégration de propriétés sociales dans un modèle de recherche.

Ismail Badache
RÉSUMÉ . Cet article propose une approche de recherche d'information, basée sur le contenu généré par l'utilisateur (CGU). Nos travaux se focalisent sur l'exploitation des CGUs dans la recherche des ressources web (pages, vidéos, etc). En particulier, nous nous intéressons à identifier, extraire et quantifier, à partir de plusieurs réseaux sociaux, certaines propriétés de ces CGUs, telles que la popularité et la confiance. Ces propriétés vont être intégrées dans un modèle de ranking. Plus précisément,...

Evaluation de diverses stratégies de désambiguïsation lexicale.

Claire Fautsch & Jacques Savoy
RESUME . Dans la campagne d'évaluation CLEF-2008, la tâche u robuste » fournissait un corpus enrichi en langue anglaise. Pour chaque mot, le lemme, la partie du discours et le numéro Synsets de WordNetTM (numéro de classe d'un thésaurus) étaient fournis. Sur cette base, nous avons testé plusieurs approches afin de lever, en partie pour le moins, l'ambiguïté lexicale. Recourant au modèle vectoriel tf idf, ainsi qu'à trois approches probabilistes et un modèle de langue,...

Indexation de documents multimédia par réseaux d'opérateurs.

Stéphane Ayache & Georges Quénot
RÉSUMÉ. Le franchissement du fossé sémantique entre les descriptions au niveau signal et au niveau sémantique est le principal problème à résoudre pour l'indexation multimédia. Les ap- proches les plus avancées prennent en compte plusieurs types de descripteurs, plusieurs moda- lités et/ou le contexte pour améliorer la détection des concepts. Afin de maîtriser la complexité liée à l'intégration de données et de traitement hétérogènes que cela suppose, nous proposons une approche à base d'opérateurs organisés...

Détection et reconnaissance de texte dans les documents vidéos. Et leurs apports à la reconnaissance de personnes.

Johann Poignant
RÉSUMÉ. Cet article présente les différentes étapes de reconnaissance des caractères dans un système de reconnaissance multimodale de personnes dans des documents audiovisuels (défi ANR REPERE). La détection du texte est réalisée par une technique basée sur les caracté- ristiques du texte (texture, couleur, contraste, géométrie, suivi temporel, mesure du gradient cumulé). La reconnaissance du texte est ensuite effectuée avec le logiciel libre de Google Tes- seract. La méthode a été évaluée sur un corpus...

Points d'intérêt dans les vidéos HDR - Premiére évaluation différentielle de la quantité et de la qualité des points d'intérêt spaciaux et spatio-temporels obtenus sur des vidéos classiques et HDR.

Alain Simac-Lejeune
RÉSUMÉ . La HDR (High Dynamic Range) permet de représenter des images d'une manière analogue à la représentation de notre système de vision et de manière plus complexe que dont nous disposons à l'heure actuelle sur notre ordinateur. Cet article propose d'analyser le comportement des extracteurs de points d'intérêt spatiaux et spatio-temporels lors de leur utilisation sur des vidéos HDR en les comparant avec leur utilisation sur des vidéos classique afin de déterminer l'influence des...

Modèles d'information pour la recherche multilingue.

Li 0012, Bo & Éric Gaussier
RÉSUMÉ. Nous présentons dans cet article plusieurs extensions multilingues des modèles d'infor- mation, en particulier le modèle log-logistique (LL) et le modèle Smoothed Power Law (SPL), récemment introduits en recherche d'information (Clinchant et al., 2010). Ces extensions sont fondées sur (a) une généralisation de la notion d'information utilisée dans ces modèles, (b) une généralisation des variables aléatoires utilisées et (c) une expansion de la requête utilisant l'en- semble des traductions de chaque mot. Nous analysons...

Phrases Visuelles pour l'annotation automatique d'images.

Rami Albatal, Philippe Mulhem & Yves Chiaramella
RÉSUMÉ. L'annotation automatique d'images photographiques est un problème complexe. En ef- fet, les caractéristiques visuelles des objets d'une classe varient selon l'instance considérée et les conditions de prise de vue. Nous proposons dans cet article une caractérisation visuelle des parties d'objets appelées 'Phrases Visuelles', robuste à ces variations. Une Phrase Visuelle est un ensemble de régions d'intérêts construit suivant des critères prédéfinis; un critère proposé et étudié ici est de nature topologique. Basé sur notre...

Identification de phénomènes dans l'analyse d'interactions humaines: Les traces d'interactions humaines, un nouveau domaine d'application pour la RI.

Gregory Dyke, Michel Beigbeder, Kristine Lund & Jean-Jacques Girardot
RESUME. L'éŽtude socio-cognitive des interactions humaines méŽdiatisŽées par ordinateur passe par l'analyse de corpus complexes, de plus en plus vastes, regroupant les enregistrements audio- video et les traces informatiques de l'interaction méŽdiatisée. Dans cet article, nous préŽsentons et modéŽlisons l'interrogation de tels corpus au moyen de mŽthodes de RI. Nous montrons que, moyennant ces modèles, certaines questions de recherche pour l'analyse d'interactions peuvent se ramener à des problèmes connus de RI. Nous exposons enfin les...

Apprentissage de Relations entre Concepts - Génération Automatique d'une Structuration Hiérarchique à partir de Corpus.

Hermine Njike Fotzo & Patrick Gallinari
RÉSUMÉ . Nous étudions comment apprendre automatiquement à partir de corpus, des hiérarchies de concepts obéissant à une relation du type généralisation / spécialisation. Nous proposons une méthode qui permet à partir de concepts identifiés automatiquement sur un corpus de documents, d'apprendre des relations généralisation / spécialisation à partir de cooccurrence de ces concepts, puis de construire une hiérarchie ordonnée suivant cette même relation. A titre d'application, nous montrons comment utiliser cette hiérarchie de concepts...

Ridgelet-based signatures for natural image classification.

Hervé Le Borgne & Noel E. O'Connor
RÉSUMÉ. Dans cet article nous proposons une nouvelle représentation des images naturelles permettant de les organiser en groupes sémantiquement consistants. Les catégories concernées par la méthode sont identifiées par les propriétés statistiques des scènes naturelles. Les images sont décrites par une signature basée sur les ridgelets. Elle est combinée à une classifieur à vecteur support (SVM),qui est particulièrement adapté à la représentation des données en grande dimension, résultant en un système de reconnaissance efficace. Le...

Registration Year

  • 2017
    544
  • 2018
    31
  • 2019
    23

Resource Types

  • Text
    598