544 Works

Tied Spatial Transformer Networks for Character Recognition.

Bogdan-Ionut Cirstea & Laurence Likforman-Sulem
RÉSUMÉ. Cet article présente une nouvelle approche appliquée aux réseaux de neurones convolutionnels (RNC), qui utilise les réseaux de transformations spatiales (RTS). L’approche consiste à construire une architecture combinant un RNC pour la localisation et un RNC pour la classification. Bien que les deux réseaux soient dédiés à des taches différentes, la majorité de leurs poids sont partagées. Par la suite nous appelons ce type de réseaux réseaux de transformations spatiales liées ou RTSL. Le...

Extraction automatique de termes-clés : Comparaison de méthodes non supervisées.

Josiane Mothe & Faneva Ramiandrisoa
RÉSUMÉ. Cet article présente un état de l’art et une comparaison des méthodes non supervisées et automatiques d’extraction de mots-clés à partir des contenus textuels de documents. Nous évaluons plusieurs méthodes de la littérature sur deux corpus de documents en comparant des termes-clés extraits et ceux associés initialement aux documents. Nous avons pu constater que la méthode basée sur une mesure TF-IDF était celle qui renvoie les résultats les plus proches des mots-clés des auteurs...

Building a Knowledge Base Using Microblogs: the Case of Festivals and Location-Based Events.

Hoang Thi Bich Ngoc & Josiane Mothe
RÉSUMÉ. Les médias sociaux comme twitter sont très utilisés lors d'un évènement (conférence, catastrophe, évènement culturel...) pour collaborativement commenter ou donner des avis sur son déroulement. Les utilisateurs du réseau social sont alors avertis via les personnes qu'ils suivent ou en recherchant les tweets portant sur l'évènement. Cependant compte tenu de la taille d'un tweet, l'information obtenue par un seul post est souvent très partielle. L'utilisation d'un ensemble de tweets sur un évènement peut permettre...

Étude préliminaire à la recherche de photographies muséales en mobilité.

Maxime Portaz, Philippe Mulhem & Jean-Pierre Chevallet
RÉSUMÉ. Cet article étudie la problématique de l’indexation et de la recherche d’image dans le cadre de visites de musée. Nous nous intéressons en particulier au cas d’utilisation d’outils mobiles "hors ligne" (c’est-à-dire sans connexion à un serveur distant), du point de vue qualité intrinsèque et du point de vue application mobile. Nous décrivons trois approches de référence, et nous étudions leur comportement qualitatif sur une collection de photographies de peintures, prises par des outils...

Processing Natural Language Queries to Disambiguate Named Entities and Extract Users' Goals : Application to e-Tourism.

Sanjay Kamath, Lorraine Goeuriot & Marie-Christine Fauvet
RÉSUMÉ. Cet article présente une étude qui s’inscrit dans le cadre d’un projet plus large qui porte sur la conception et la réalisation d’un système visant à fournir à des utilisateurs mobiles des services personnalisés, dépendant de leur contexte, et adaptés à leurs besoins. Par exemple, un utilisateur peut vouloir des informations sur la météo du lendemain, ou bien réserver des billets d’entrée à un musée voisin, ou encore réserver une table dans un restaurant...

ANASTASIA : recommandation de séquences d'activités spatiotemporelles.

Diana Nurbakova, Léa Laporte, Sylvie Calabretto & Jérôme Gensel
RÉSUMÉ. Avec l'augmentation du nombre et de la variété des activités accessibles par les utili- sateurs, la recommandation personnalisée de séquences d'activités devient un enjeu important. Or, la plupart des systèmes de recommandation ne tiennent pas compte des contraintes tem- porelles liées aux activités, ce qui rend la recommandation difficile à suivre par un utilisateur. Dans cet article, nous décrivons une nouvelle approche pour la recommandation de séquences d'activités limitées dans le temps et concurrentes....

MyBestQuery : un jeu sérieux pour apprendre des utilisateurs.

Adrian Chifu, Serge Molina & Josiane Mothe
RESUME. MyBestQuery est un jeu sérieux qui collecte des éléments sur les requêtes soumises à un moteur de recherche: (i) la prédiction de la difficulté de la requête par le joueur (ii) des raisons possibles expliquant cette difficulté (iii) des propositions de reformulation.

Recherche par le contenu d'images de monnaies de collection.

Joseph Chazalon & Mickaël Coustaty
RÉSUMÉ. Cette démonstration consiste en une variante du travail de (Perronnin et al., 2010) simplifiée et transposée au cas des images de monnaies de collection. Tirant profit de certaines particularité des objets numismatiques (pièces et billets de collection), qui peuvent être assimilés à un type de documents particuliers, nous avons développé un outil qui permet de chercher les objets similaires à un objet requête parmi une base de plusieurs dizaines de milliers d’objets. Plusieurs modifications...

IDCHECK.IO. Application mobile de contrôle de documents d’identité.

Ahmad Montaser Awal & Fabien Chevalier
RÉSUMÉ. Il existe un très grand nombre de techniques de sécurisation des documents d’identité et il n’est pas rare de voir un même document en implémenter plusieurs dizaines pour accroitre, voire rendre impossible, le travail du fraudeur. Le contrôle des documents d’identité effectué par notre solution IDCHECK.IO permet de lutter efficacement contre la fraude documentaire qui est devenue la troisième plus grande industrie criminelle au monde et coûte chaque année des milliards de dollars à...

Vers une approche utilisant l’apprentissage de métrique pour du clustering semi-supervisé interactif d’images.

Viet Minh Vu, Hien Phuong Lai & Muriel Visani
RÉSUMÉ. La problématique du clustering non supervisé et semi-supervisé est très étudiée dans le domaine de l’apprentissage automatique. En vue d’impliquer l’utilisateur dans le clustering d’images, (Lai et al., 2014) a proposé un nouveau modèle de clustering semi-supervisé interactif traduisant les retours de l’utilisateur (exprimés au niveau des images) en contraintes par paires (must-link et cannot-link) entre groupes d’images constitués à l’aide d’une solution de clustering hiérarchique et de ces retours. Ces dernières années, le...

Extension automatique d’annotation et classification de documents en utilisant un modèle graphique probabiliste.

Abdessalem Bouzaieni, Sabine Barrat & Salvatore Tabbone
RÉSUMÉ. Avec la prolifération des images de documents, l’annotation de documents est devenue un domaine de recherche d’un grand intérêt. L’annotation permet de décrire le contenu sémantique des documents et facilite leur utilisation et leur recherche. Toutefois, pour un grand nombre de documents, l’annotation manuelle de chaque document devient une tâche fastidieuse. Une solution est d’annoter une petite partie des documents et d’étendre automatiquement les annotations à l’ensemble du jeu de données. Dans cet article,...

Adaptation des caractéristiques pseudo-Haar pour le word spotting dans les documents manuscrits.

Adam Ghorbel, Jean-Marc Ogier & Nicole Vincent
RÉSUMÉ. On présente dans ce papier une approche analytique multi-échelle pour le word spotting dans les documents manuscrits. Le modèle proposé comporte deux niveaux. D’abord, un module de filtrage global permettant de définir des zones candidates répondant à la requête dans le document testé. Ensuite, l’échelle de l’observation est modifiée à un niveau plus fin afin d’affiner les résultats et de sélectionner uniquement ceux qui sont vraiment pertinents. Le présent article se focalise sur la...

Audit d’une base de documents étiquetée.

Romain Giot, Romain Bourqui, Nicholas Journet & Anne Vialard
RÉSUMÉ. Dans cet article, déjà présenté à ICDAR 2015, nous nous intéressons à l’étiquetage d’une base d’images de documents dans un contexte industriel. Nous travaillons plus particulièrement sur l’évaluation de la qualité d’un étiquetage préexistant. Dans la plupart des cas pratiques, un opérateur étiquette manuellement une base d’images de documents en parcourant séquentiellement les vignettes correspondant aux images. Cette tâche est très répétitive ; de plus le plan de classement définissant les noms et le...

Reconnaissance et classification de lettrines à base des descripteurs de bas niveau et de représentation structurelle.

Maroua Mehri, Pierre Héroux, Mickaël Coustaty, Petra Gomez-Krämer, Julien Lerouge & Rémy Mullot
RÉSUMÉ. Cet article s’intéresse à un des éléments importants dans l’analyse de graphiques sur les images de documents anciens que sont les lettrines. Nous proposons dans ce travail des méthodes génériques pour la reconnaissance et la classification de lettrines. Tout d’abord, une méthode ascendante de segmentation à base de descripteurs de bas niveau est présentée, permettant d’assurer la séparation des éléments de la couche de forme de ceux de la couche du fond de la...

Utilisation de la couleur pour l’extraction de tableaux dans des images de documents.

Héloïse Alhéritière, Florence Cloppet, Camille Kurtz & Nicole Vincent
RÉSUMÉ. Les tableaux sont des éléments complexes qui peuvent perturber l’analyse automatique de la structure d’une image de document. Dans cet article, nous présentons une méthode fondée sur l’alternance de couleurs de lignes pour extraire des tableaux colorés à bordures non matérialisées. Les résultats expérimentaux obtenus à partir d’une base d’images de documents à mise en page variée, permettent de valider l’intérêt de cette approche.

Un modèle syllabique pour la reconnaissance de l’écriture.

Wassim Swaileh, Kamel Ait Mohand & Thierry Paquet
RÉSUMÉ. Dans cet article nous introduisons un nouveau modèle syllabique pour la reconnaissance de l'écriture. Une méthode de syllabation orthographique supervisée du Français est proposé pour la construction d’un vocabulaire de syllabes. Un modèle de langage statistique en n-gram combinant syllabes et caractères est appris sur un corpus Wikipedia. Le système de reconnaissance d’écriture fondé sur des modèles optiques HMM de caractères procède à un décodage en deux passes en exploitant le modèle syllabique proposé....

Time-efficient Logo Spotting using Text/Non-text Separation as Preprocessing and Approximate Nearest Neighbor Search.

Viet Phuong Le, Nibal Nayef, Muriel Visani, Jean-Marc Ogier & Cao De Tran
RÉSUMÉ. Dans les systèmes de vision par ordinateur et plus particulièrement les systèmes de recherche de documents, la recherche des similarités entre les vecteurs de descripteurs de grande dimension est la partie la plus coûteuse en termes de temps de calcul. Dans cet article, nous proposons un système de recherche de documents basé sur la détection de logos. Ce système est efficace en termes de temps de calcul. En effet, notre approche de détection consiste...

Nouveau modèle pour la datation automatique de photographies à partir de caractéristiques visuelles.

Paul MARTIN, Antoine DOUCET & Frédéric JURIE
RÉSUMÉ. Nous présentons, dans cet article, une méthode de datation de photographies par l’usage du contenu visuel de celles-ci. Nous nous sommes inspirés de travaux récents de la vision par ordinateur. Nous avons amélioré la méthode de classification utilisée dans ces travaux en dépassant une limite intrinsèque de leur approche. En effet, ils considèrent la datation d’images comme un problème de classification multi-classes, pour lequel une classe représente un ensemble d’années, mais ignorant l’ordre relatif...

Extraction des bulles de bandes dessinées.

Christophe Rigaud, Jean-Christophe Burie & Jean-Marc Ogier
RÉSUMÉ. Les bandes dessinées et les mangas sont l’une des formes les plus populaires de contenu graphique dans le monde et jouent un rôle majeur dans la diffusion de la culture. Aujourd’hui, la numérisation massive permet la lecture page par page mais nous pensons que d’autres usages peuvent émerger. Dans cet article, nous nous concentrons sur l’extraction de phylactères qui est une étape majeure pour permettre l’association texte/graphique dans les images de bandes dessinées. En...

Métriques statistiques pour l’évaluation de performance en présence de vérité terrain imprécise.

Bart Lamiroy & Pascal Pierrot
RÉSUMÉ. Ce papier aborde l’évaluation de performances en présence de vérité terrain imprécise. En effet, lors de procédures de benchmarking il est généralement supposé que les données de référence sont parfaites. Nous avons démontré précédemment que cette hypothèse de travail n’est généralement pas satisfaite dans le contexte de problèmes d’interprétation perceptuelle, sauf dans les cas les plus triviaux. Nous présentons ici un approche et test statistiques qui permettent de mesurer la confiance que l’on peut...

La CTC et son intrigant label “blank”. Étude comparative de méthodes d’entraînement de réseaux de neurones pour la reconnaissance d’écriture.

Théodore Bluche, Christopher Kermorvant, Hermann Ney & Jérôme Louradour
RÉSUMÉ. Les systèmes de reconnaissance d’écriture vainqueurs d’évaluations internationales ces dernières années sont basés sur des réseaux de type LSTM, entraînés avec un critère de classification temporelle connexionniste (CTC). L’algorithme de la CTC est basé sur une procédure "forward-backward", sans segmentation de la séquence d’entrée avant l’entraînement. Les sorties du réseau sont les caractères à modéliser, auxquels on ajoute un label spécial, noncaractère, (blank). D’autre part, dans les systèmes hybrides réseaux de neurones / modèles...

Using BLSTM for Interpretation of 2D Languages – Case of Handwritten Mathematical Expressions.

Ting ZHANG, Harold MOUCHERE & Christian VIARDGAUDIN
RÉSUMÉ. Nous proposons une extension à l’utilisation classique des réseaux de type BLSTM pour leur permettre de traiter des données provenant de langages graphiques bidimensionnels tels que les formules mathématiques manuscrites. La solution proposée repose sur un parcours respectant l’ordre temporel des traits. Il en résulte une séquence alternant les étiquettes de symboles et les étiquettes des relations spatiales. Dans le cas des expressions purement linéaires (1- D), nous utilisons l’étiquette « Right » pour...

Filtrage de descripteurs locaux pour l’amélioration de la détection de documents.

Marçal Rusiñol, Joseph Chazalon & Jean-Marc Ogier
RÉSUMÉ. Cet article propose une méthode simple et efficace qui vise à réduire la quantité de descripteurs locaux à indexer dans un scénario de mise en correspondance d’images de do- cuments. Au cours d’une étape d’entraînement préalable, la mise en correspondance entre un document modèle et un ensemble d’images contenant une instance de ce modèle est calculée en ne retenant que les descripteurs locaux du modèle qui produisent des appariements corrects de façon régulière. Cette...

Alignement texte-image sans apprentissage pour les manuscrits médiévaux.

Yann LEYDIER, Véronique EGLIN, Stéphane BRES & Dominique STUTZMANN
RESUME. Dans cet article, nous décrivons une nouvelle approche pour l’alignement texte-image des documents du moyen-âge. La méthode est dédiée à l’alignement au niveau mot, sans segmentation ni apprentissage. L’alignement mot à mot est basé sur une distance d’édition appliqu ée à des signatures extraites à la fois à partir des chaînes de caractères Unicode et à partir des images. Les résultats sont évalués sur la “Queste del saint Graal” (XIIIème s.) par des paléographes...

Resource Types

  • Text
    544

Publication Year

  • 2017
    33
  • 2016
    51
  • 2015
    37
  • 2014
    53
  • 2013
    46
  • 2012
    40
  • 2011
    38
  • 2010
    34
  • 2009
    39
  • 2008
    41
  • 2007
    39
  • 2006
    44
  • 2005
    27
  • 2004
    22